Google lanza Gemini 3: una nueva era de razonamiento profundo y agentes de IA
728 x 90 px
Casi dos años después de iniciar lo que la compañía denomina la «era Gemini», Google ha dado su paso más ambicioso hasta la fecha en la carrera hacia la Inteligencia Artificial General (AGI). Hoy, 18 de noviembre de 2025, se ha oficializado el lanzamiento de Gemini 3, un modelo que no solo promete ser más rápido, sino fundamentalmente más inteligente, priorizando el razonamiento profundo y la capacidad de agencia sobre la simple generación de texto.
Este lanzamiento marca un hito crítico. Mientras que Gemini 1.0 se centró en la multimodalidad nativa y la versión 2.0 sentó las bases para los agentes, Gemini 3 busca combinar todas estas capacidades para ofrecer un nivel de matiz y comprensión del contexto sin precedentes. Según Sundar Pichai, CEO de Google y Alphabet, este modelo ha evolucionado de «simplemente leer texto e imágenes a leer la habitación», sugiriendo una capacidad superior para captar la intención del usuario.
Un salto cuantitativo en razonamiento y benchmarks
El núcleo de Gemini 3 reside en su motor de razonamiento de última generación. Google afirma que el modelo supera significativamente a su predecesor, Gemini 2.5 Pro, en todos los principales benchmarks de la industria.
(Automático aquí)
Los datos técnicos presentados por Google DeepMind son contundentes:
- Liderazgo en LMArena: Alcanza una puntuación de ruptura de 1501 Elo.
- Razonamiento nivel doctorado: Obtiene puntuaciones superiores en el «Humanity’s Last Exam» (37.5% sin herramientas) y en GPQA Diamond (91.9%).
- Dominio matemático: Establece un nuevo estándar en matemáticas de frontera con un 23.4% en MathArena Apex.
Más allá del texto, la capacidad multimodal sigue siendo un diferenciador clave. Gemini 3 redefine el razonamiento visual con un 81% en MMMU-Pro y un 87.6% en Video-MMMU. Además, su precisión factual ha mejorado notablemente, logrando un 72.1% en SimpleQA Verified, lo que sugiere una reducción significativa en las alucinaciones para consultas complejas.
Gemini 3 Deep Think: pensando antes de responder
Junto con el modelo estándar, Google ha introducido Gemini 3 Deep Think. Este es un modo de razonamiento mejorado diseñado para resolver problemas de alta complejidad que requieren múltiples pasos lógicos.
En pruebas internas y externas, Deep Think supera al propio Gemini 3 Pro, logrando un 41.0% en el «Humanity’s Last Exam» y un impresionante 93.8% en GPQA Diamond. Quizás lo más relevante para la comunidad de investigación es su puntuación del 45.1% en ARC-AGI-2 (con ejecución de código), demostrando una habilidad inédita para resolver desafíos novedosos que no estaban presentes en sus datos de entrenamiento.
Google Antigravity y la revolución del desarrollo de software
Para los desarrolladores, la noticia más disruptiva es la presentación de Google Antigravity. A medida que la inteligencia del modelo se acelera, Google está reimaginando la experiencia de desarrollo (IDE) centrada en agentes.
Antigravity no es solo una herramienta de autocompletado; es una plataforma de desarrollo agéntico. Utilizando las capacidades avanzadas de Gemini 3, permite a los agentes planificar y ejecutar tareas de software complejas de extremo a extremo de forma autónoma. Esto incluye acceso directo al editor de código, la terminal y el navegador.
El modelo se destaca en lo que Google llama «vibe coding» y codificación agéntica, encabezando la tabla de clasificación de WebDev Arena con 1487 Elo y superando ampliamente a la generación anterior en SWE-bench Verified (76.2%). Esto significa que los desarrolladores pueden esperar un asistente que no solo sugiere líneas de código, sino que puede construir interfaces web interactivas y ricas (GenUI) a partir de instrucciones complejas.
Capacidades prácticas: aprender, construir y planificar
La aplicación práctica de Gemini 3 se divide en tres pilares fundamentales que buscan impactar la vida diaria y profesional de los usuarios:
- Aprendizaje personalizado: Gracias a su ventana de contexto de 1 millón de tokens y su comprensión multimodal, Gemini 3 puede ingerir trabajos académicos, largas conferencias de video o tutoriales para generar material de estudio interactivo, tarjetas didácticas o planes de entrenamiento personalizados.
- Construcción creativa: Desde generar código para visualizaciones de alta fidelidad hasta crear interfaces de usuario dinámicas sobre la marcha en el Buscador de Google (Search), el modelo facilita la materialización de ideas abstractas.
- Planificación a largo plazo: Gemini 3 demuestra una capacidad superior para mantener la coherencia en tareas largas. En pruebas como Vending-Bench 2, el modelo gestionó un negocio simulado durante un «año» completo sin desviarse de su objetivo, lo que promete agentes personales capaces de gestionar flujos de trabajo reales, como organizar bandejas de entrada o reservar servicios complejos.
Disponibilidad y desarrollo responsable
Google ha enfatizado que Gemini 3 es su modelo más seguro hasta la fecha, habiendo pasado por evaluaciones exhaustivas para reducir la adulación (sycophancy), resistir inyecciones de prompts y mitigar riesgos de ciberseguridad.
El despliegue comienza hoy mismo a escala global:
- Usuarios generales: Disponible en la app de Gemini y en el Modo IA del Buscador.
- Desarrolladores: Accesible a través de Google AI Studio, Vertex AI y la nueva plataforma Google Antigravity.
- Modo Deep Think: Inicialmente en preview para testers de seguridad, con un lanzamiento próximo para suscriptores de Google AI Ultra.
Este lanzamiento posiciona a Google nuevamente en la vanguardia de la IA generativa, ofreciendo herramientas que prometen transformar no solo cómo buscamos información, sino cómo trabajamos y resolvemos problemas complejos.
Referencia oficial: Google Blog – A new era of intelligence with Gemini 3
