Pesquisadores Publicam Técnica Revolucionária de Controle Interno para LLMs na Science
Pesquisadores da UC San Diego e do MIT publicaram um estudo marco na Science demonstrando um método escalável para orientar e monitorar modelos de IA manipulando diretamente representações conceituais internas, expondo tanto vulnerabilidades de segurança quanto melhorias de capacidade.


