AI News

El CEO de DeepMind desafía la estrategia de OpenAI y aboga por "Modelos del Mundo (World Models)"

En un momento definitorio para la industria de la inteligencia artificial, el CEO de Google DeepMind, Demis Hassabis, desafió públicamente el predominio vigente de los Modelos de Lenguaje a Gran Escala (Large Language Models, LLMs), argumentando que la vía actual favorecida por competidores como OpenAI es insuficiente para alcanzar la verdadera Inteligencia Artificial General (Artificial General Intelligence, AGI). Hablando en el podcast "The Tech Download" de CNBC el 19 de enero de 2026, Hassabis articuló un giro estratégico hacia los "Modelos del Mundo (World Models)", sistemas capaces de simular la realidad física y comprender la causalidad, en lugar de limitarse a predecir texto basándose en correlaciones estadísticas.

Esta crítica marca una divergencia significativa en las hojas de ruta filosóficas y técnicas de los principales laboratorios de IA del mundo. Mientras que OpenAI, liderada por Sam Altman, históricamente ha insistido en las leyes de escalado—la idea de que aumentar el cómputo y el volumen de datos conduce inevitablemente a una mayor inteligencia—Hassabis sugiere que este enfoque ha chocado con una "pared fundamental" cuando se trata de invención científica y razonamiento desde primeros principios.

La limitación del escalado basado en texto

El núcleo del argumento de Hassabis se basa en la distinción entre el procesamiento de información y la comprensión física. Los Modelos de Lenguaje a Gran Escala (LLMs) sobresalen al analizar enormes cantidades de texto generado por humanos para encontrar patrones. Sin embargo, Hassabis sostiene que estos modelos "no entienden verdaderamente la causalidad." Pueden describir una manzana que cae basándose en descripciones en sus datos de entrenamiento, pero no pueden simular la física de la gravedad en un entorno novedoso para predecir un resultado que no hayan visto antes.

"Los grandes modelos de lenguaje de hoy son fenomenales en el reconocimiento de patrones," declaró Hassabis durante la entrevista. "Pero realmente no saben por qué A conduce a B. Solo predicen el siguiente token."

Para los lectores de Creati.ai, esta distinción es crucial. Implica que, si bien los LLMs seguirán mejorando como interfaces conversacionales y asistentes de programación, podrían seguir siendo incapaces del tipo de avances a escala AlphaGo necesarios para resolver problemas científicos complejos, como descubrir nuevos materiales o curar enfermedades. Hassabis estima que la AGI sigue a 5–10 años de distancia y requerirá arquitecturas que vayan más allá del paradigma basado en transformers.

Definiendo el "Modelo del Mundo"

La visión alternativa de DeepMind se centra en crear IA que construya una representación interna del mundo físico. Estos "Modelos del Mundo" funcionan menos como una biblioteca y más como un motor de juego. Pueden ejecutar "experimentos mentales", simular resultados en espacio 3D y comprobar hipótesis frente a un conjunto consistente de leyes físicas.

DeepMind ya ha comenzado a demostrar la viabilidad de este enfoque. Hassabis señaló a Genie 3, un sistema lanzado en agosto de 2025, que genera entornos 3D interactivos a partir de indicaciones de texto, y SIMA 2, que entrena agentes de IA para navegar y realizar tareas dentro de estos mundos simulados. Investigaciones tempranas sugieren que estos sistemas híbridos—combinando comprensión del lenguaje con razonamiento espacial—superan a los LLMs puros en un 20–30 % en tareas de razonamiento complejo y reducen significativamente las alucinaciones sobre física básica.

Divergencia estratégica: Google vs. OpenAI

El momento de estos comentarios no es casual. La industria de la IA está navegando actualmente un período de intensa volatilidad. Tras el lanzamiento de Gemini 3 de Google a finales de 2025, surgieron informes sobre un "Código Rojo" interno en OpenAI, impulsado por la preocupación de que su estrategia de escalado estaba rindiendo retornos decrecientes. Al articular públicamente las limitaciones de la vía basada únicamente en LLMs, Hassabis está posicionando a Google no solo como competidor, sino como pionero del próximo salto arquitectónico en IA.

Este cambio es operacional además de filosófico. Hassabis reveló que ahora está en contacto diario con el CEO de Alphabet, Sundar Pichai, un cambio que subraya el estatus elevado de DeepMind como la "sala de máquinas" singular de los esfuerzos de IA de Google. Esta estructura optimizada apunta a acelerar la traducción de avances de investigación en productos de consumo, una respuesta directa a las críticas de que Google había avanzado demasiado lentamente.

El contexto geopolítico: China acortando la distancia

Más allá del debate técnico, Hassabis ofreció una evaluación aleccionadora del panorama global de la IA. Al preguntársele sobre la competencia internacional, señaló que los modelos de IA chinos están cerrando rápidamente la brecha de rendimiento con sus homólogos occidentales.

"Es cuestión de meses, no de años," comentó Hassabis respecto a la demora entre los modelos de frontera de EE. UU. y China. Citó avances rápidos de compañías como Alibaba y startups como Moonshot AI. Sin embargo, introdujo una distinción matizada: mientras que los laboratorios chinos son expertos en seguir rápidamente y en la excelencia de ingeniería, Hassabis cuestionó si el ecosistema actual en China fomenta la "mentalidad" específica requerida para avances científicos de cero a uno, como la invención original de la arquitectura Transformer por investigadores de Google.

Análisis comparativo: LLMs vs. Modelos del Mundo

Para entender lo que está en juego en este debate arquitectónico, es útil contrastar las capacidades y limitaciones de los dos enfoques dominantes que actualmente compiten por recursos.

Comparación entre Modelos de Lenguaje a Gran Escala y Modelos del Mundo

Feature Modelos de Lenguaje a Gran Escala (Large Language Models, LLMs) Modelos del Mundo (World Models)
Mecanismo central Reconocimiento de patrones estadísticos y predicción de tokens Simulación de la realidad física y causalidad
Fuente de datos primaria Texto, código e imágenes estáticas de Internet Entornos 3D, motores físicos y datos de vídeo
Capacidad de razonamiento Correlacional (lógica asociativa) Causal (razonamiento desde primeros principios)
Limitación clave Alucinaciones y falta de conciencia espacial Alto costo computacional para simulación en tiempo real
Caso de uso ideal Redacción creativa, programación, resumen Robótica, descubrimiento científico, agentes autónomos
Sistemas de ejemplo GPT-4, Claude 3, Llama 3 Genie 3, SIMA 2, AlphaFold

Implicaciones para la industria de la IA

La defensa de Hassabis de los Modelos del Mundo señala una tendencia industrial más amplia hacia sistemas de IA "neuro-simbólicos (neuro-symbolic)" o híbridos. Para desarrolladores y líderes empresariales, esto sugiere que la era de depender únicamente de la ingeniería de prompts (prompt engineering) para modelos basados en texto podría estar transitando hacia una fase donde la computación espacial y la simulación se conviertan en componentes críticos de la pila de IA.

Si la hipótesis de DeepMind resulta correcta, la próxima generación de IA no solo hablará sobre el mundo: podrá navegarlo. Esta capacidad es esencial para desbloquear la economía física, incluyendo la robótica avanzada y la experimentación científica autónoma. Mientras OpenAI continúa refinando el "cerebro" de la IA a través del lenguaje, DeepMind parece centrarse en dar a ese cerebro un cuerpo y un mundo que habitar.

A medida que 2026 se desarrolla, es probable que la industria vea una bifurcación en el desarrollo de modelos: un camino optimizado para la fluidez lingüística y otro para la inteligencia física. Para Creati.ai, estaremos monitoreando de cerca cómo estos Modelos del Mundo se integran con las herramientas generativas existentes, potencialmente creando una nueva clase de aplicaciones que fusionen la generación creativa con la precisión científica.

Destacados
ThumbnailCreator.com
Herramienta potenciada por IA para crear miniaturas de YouTube impresionantes y profesionales, rápida y fácilmente.
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
AirMusic
AirMusic.ai genera pistas musicales de IA de alta calidad a partir de indicaciones de texto con personalización de estilo y estado de ánimo, y exportación de stems.
AdsCreator.com
Genera al instante creatividades publicitarias pulidas y coherentes con la marca desde cualquier URL para Meta, Google y Stories.
Refly.ai
Refly.AI permite a creadores no técnicos automatizar flujos de trabajo usando lenguaje natural y un lienzo visual.
VoxDeck
Creador de presentaciones con IA que lidera la revolución visual
BGRemover
Elimina fácilmente los fondos de imágenes en línea con SharkFoto BGRemover.
Flowith
Flowith es un espacio de trabajo agéntico basado en lienzo que ofrece gratis 🍌Nano Banana Pro y otros modelos efectivos.
Skywork.ai
Skywork AI es una herramienta innovadora para aumentar la productividad utilizando IA.
FineVoice
Convierte el texto en emoción — Clona, diseña y crea voces de IA expresivas en segundos.
Qoder
Qoder es un asistente de codificación impulsado por IA que automatiza la planificación, la codificación y las pruebas para proyectos de software.
FixArt AI
FixArt AI ofrece herramientas de IA gratuitas y sin restricciones para la generación de imágenes y videos sin necesidad de registrarse.
Elser AI
Estudio web todo‑en‑uno que convierte texto e imágenes en arte estilo anime, personajes, voces y cortometrajes.
Pippit
¡Eleva tu creación de contenido con las poderosas herramientas de IA de Pippit!
SharkFoto
SharkFoto es una plataforma todo-en-uno impulsada por IA para crear y editar videos, imágenes y música de manera eficiente.
Funy AI
¡Anima tus fantasías! Crea vídeos de besos y bikinis con IA a partir de imágenes o texto. Prueba el cambiador de ropa IA
KiloClaw
Agente OpenClaw alojado: despliegue con un clic, más de 500 modelos, infraestructura segura y gestión automatizada de agentes para equipos y desarrolladores.
Diagrimo
Diagrimo transforma el texto en diagramas y visuales generados por IA personalizables al instante.
SuperMaker AI Video Generator
Crea videos, música e imágenes impresionantes sin esfuerzo con SuperMaker.
AI Clothes Changer by SharkFoto
AI Clothes Changer de SharkFoto te permite probar virtualmente atuendos al instante con ajuste, textura e iluminación realistas.
Yollo AI
Chatea y crea junto a tu compañero IA. De imagen a video y generación de imágenes IA.
AnimeShorts
Crea cortos de anime impresionantes sin esfuerzo con tecnología de IA de vanguardia.
Image to Video AI without Login
Herramienta gratuita de IA de Imagen a Video que transforma fotos al instante en videos animados fluidos y de alta calidad sin marcas de agua.
Anijam AI
Anijam es una plataforma de animación nativa de IA que convierte ideas en historias pulidas mediante creación de video agentiva.
HappyHorseAIStudio
Generador de videos con IA basado en navegador para texto, imágenes, referencias y edición de video.
InstantChapters
Genera capítulos de libros cautivadores al instante con Instant Chapters.
NerdyTips
Una plataforma de predicciones de fútbol impulsada por IA que ofrece consejos de partidos basados en datos en ligas de todo el mundo.
WhatsApp AI Sales
WABot es un copiloto de ventas con IA para WhatsApp que ofrece scripts en tiempo real, traducciones y detección de intención.
happy horse AI
Generador de video de IA de código abierto que crea video y audio sincronizados a partir de texto o imágenes.
insmelo AI Music Generator
Generador de música impulsado por IA que convierte prompts, letras o cargas en canciones pulidas y libres de regalías en aproximadamente un minuto.
wan 2.7-image
Un generador de imágenes con IA controlable para rostros precisos, paletas, texto y continuidad visual.
AI Video API: Seedance 2.0 Here
API de video con IA unificada que ofrece modelos de última generación a través de una sola clave y a menor costo.
BeatMV
Plataforma de IA basada en la web que convierte canciones en videoclips cinematográficos y crea música con IA.
Kirkify
Kirkify AI crea al instante memes virales de intercambio de rostros con una estética neon-glitch distintiva para creadores de memes.
Text to Music
Convierte texto o letras en canciones completas de calidad de estudio con voces generadas por IA, instrumentos y exportaciones multipista.
UNI-1 AI
UNI-1 es un modelo unificado de generación de imágenes que combina razonamiento visual con síntesis de imágenes de alta fidelidad.
Wan 2.7
Modelo de video AI de grado profesional con control preciso del movimiento y consistencia multi‑vista.
Iara Chat
Iara Chat: Un asistente de productividad y comunicación impulsado por IA.
Lyria3 AI
Generador de música con IA que crea canciones totalmente producidas y de alta fidelidad a partir de indicaciones de texto, letras y estilos al instante.
Tome AI PPT
Generador de presentaciones impulsado por IA que crea, embellece y exporta presentaciones profesionales en minutos.
kinovi - Seedance 2.0 - Real Man AI Video
Generador de vídeo IA gratuito con salida humana realista, sin marca de agua y con derechos completos de uso comercial.
Video Sora 2
Sora 2 AI convierte texto o imágenes en videos cortos para redes sociales y eCommerce con movimiento físicamente preciso en minutos.
Atoms
Plataforma impulsada por IA que crea aplicaciones y sitios web full‑stack en minutos utilizando automatización multiagente, sin necesidad de programar.
AI Pet Video Generator
Crea videos virales y para compartir de mascotas a partir de fotos usando plantillas impulsadas por IA y exportaciones HD instantáneas para plataformas sociales.
Ampere.SH
Alojamiento OpenClaw gestionado gratuito. Despliega agentes IA en 60 segundos con $500 en créditos Claude.
Paper Banana
Herramienta impulsada por IA para convertir texto académico en diagramas metodológicos listos para publicación y gráficos estadísticos precisos al instante.
Hitem3D
Hitem3D convierte una sola imagen en modelos 3D de alta resolución y listos para producción mediante IA.
HookTide
Plataforma de crecimiento en LinkedIn impulsada por IA que aprende tu voz para crear contenido, interactuar y analizar el rendimiento.
Create WhatsApp Link
Generador gratuito de enlaces y códigos QR para WhatsApp con analíticas, enlaces con marca, enrutamiento y funciones de chat multiagente.
GenPPT.AI
Generador de PPT impulsado por IA que crea, embellece y exporta presentaciones profesionales de PowerPoint con notas del presentador y gráficos en minutos.
Palix AI
Plataforma de IA todo‑en‑uno para creadores que genera imágenes, videos y música con créditos unificados.
Gobii
Gobii permite a los equipos crear trabajadores digitales autónomos 24/7 para automatizar la investigación web y tareas rutinarias.
Seedance 20 Video
Seedance 2 es un generador de video IA multimodal que ofrece personajes consistentes, narrativa en múltiples tomas y audio nativo en 2K.
Veemo - AI Video Generator
Veemo AI es una plataforma todo en uno que genera rápidamente videos e imágenes de alta calidad a partir de texto o imágenes.
AI FIRST
Asistente conversacional de IA que automatiza investigación, tareas del navegador, scraping web y gestión de archivos mediante lenguaje natural.
WhatsApp Warmup Tool
Herramienta de calentamiento de WhatsApp impulsada por IA que automatiza el envío masivo de mensajes mientras previene bloqueos de cuentas.
GLM Image
GLM Image combina modelos híbridos autorregresivos y de difusión para generar imágenes AI de alta fidelidad con una representación de texto excepcional.
Manga Translator AI
AI Manga Translator traduce instantáneamente imágenes de manga a múltiples idiomas en línea.
TextToHuman
Humanizador de IA gratuito que reescribe instantáneamente textos generados por IA en redacción natural y similar a la humana. No requiere registro.
Remy - Newsletter Summarizer
Remy automatiza la gestión de newsletters resumiendo emails en insights fáciles de digerir.
ainanobanana2
Nano Banana 2 genera imágenes 4K de calidad profesional en 4–6 segundos con renderizado de texto preciso y consistencia de sujetos.
Free AI Video Maker & Generator
Creador y Generador de Videos IA Gratis – Ilimitado, Sin Registro

El CEO de DeepMind cuestiona la estrategia de OpenAI y aboga por 'modelos del mundo'

El CEO de Google DeepMind, Demis Hassabis, sostiene que los grandes modelos de lenguaje como ChatGPT son insuficientes para verdaderos avances científicos y que los 'modelos del mundo' son el futuro de la IA.