Des chercheurs publient une technique révolutionnaire de pilotage interne pour les LLMs dans Science
Des chercheurs de l'UC San Diego et du MIT ont publié dans Science une étude majeure démontrant une méthode évolutive pour orienter et surveiller les modèles d'IA en manipulant directement les représentations conceptuelles internes, mettant en lumière à la fois des vulnérabilités de sécurité et des améliorations de capacités.


