Gemini 2.5: Google potencia sus modelos de IA más inteligentes para desarrolladores
728 x 90 px
Google continúa empujando los límites de la Inteligencia Artificial con las últimas actualizaciones de su serie de modelos Gemini 2.5. Estas mejoras, anunciadas en Google I/O y detalladas previamente para desarrolladores, consolidan a Gemini 2.5 como líder global en rendimiento y eficiencia, con un enfoque en la seguridad y una experiencia mejorada para los creadores de aplicaciones de IA. El incansable esfuerzo de los equipos de Google en el desarrollo responsable y seguro de su tecnología se refleja en cada avance.
Gemini 2.5 Pro: un rendimiento superior en todas las áreas
La versión Gemini 2.5 Pro ha demostrado un desempeño excepcional, superando a la competencia en benchmarks académicos y liderando clasificaciones clave como WebDev Arena y LMArena, que evalúan la preferencia humana en diversas dimensiones. Su ventana de contexto de 1 millón de tokens le permite un rendimiento de vanguardia en la comprensión de contextos largos y videos.
Además, con la incorporación de LearnLM, la familia de modelos desarrollada por expertos en educación, Gemini 2.5 Pro se ha convertido en el modelo líder para el aprendizaje. Educadores y expertos lo prefieren por su pedagogía y eficacia en una amplia gama de escenarios, superando a otros modelos en los cinco principios de la ciencia del aprendizaje utilizados para desarrollar sistemas de IA.
(Automático aquí)
Google también está innovando con Deep Think, un modo de razonamiento experimental y mejorado para matemáticas y codificación altamente complejas. Gemini 2.5 Pro Deep Think ya obtiene puntuaciones impresionantes en benchmarks difíciles como el USAMO 2025 y LiveCodeBench, además de un 84.0% en MMMU, que evalúa el razonamiento multimodal. Este avance se está probando con evaluadores de confianza a través de la API de Gemini para asegurar su seguridad antes del lanzamiento general.
Gemini 2.5 Flash: velocidad y eficiencia mejoradas
Gemini 2.5 Flash, diseñado para la velocidad y la eficiencia, ha mejorado en múltiples dimensiones. Ahora es aún más eficiente, utilizando entre un 20% y un 30% menos de tokens en las evaluaciones, y ha mejorado en puntos de referencia clave de razonamiento, multimodalidad, código y contexto extenso. La nueva versión de Flash 2.5 ya está disponible en vista previa en Google AI Studio para desarrolladores, en Vertex AI para empresas y en la app de Gemini para todos, con disponibilidad general para producción a principios de junio.
Nuevas capacidades de Gemini 2.5 para una interacción más natural
Google está incorporando nuevas funcionalidades que enriquecen la interacción con Gemini 2.5 Pro y 2.5 Flash:
- Salida de Audio Nativa y Mejoras en Live API: Live API ahora ofrece una vista preliminar de entrada audiovisual y diálogo de salida de audio nativo, permitiendo experiencias conversacionales más naturales y expresivas con Gemini. Los usuarios pueden controlar el tono, acento y estilo del habla, e incluso instruir al modelo para que use herramientas y realice búsquedas. Las funciones iniciales incluyen diálogo afectivo (detecta emoción y responde apropiadamente), audio proactivo (ignora conversaciones de fondo) y Thinking in Live API (aprovecha las capacidades de pensamiento de Gemini para tareas complejas). También se lanzaron versiones preliminares de texto a voz (TTS) en 2.5 Pro y 2.5 Flash, con soporte para múltiples hablantes y la captura de matices sutiles como susurros, funcionando en más de 24 idiomas.
- Uso de Computadora: Las capacidades de uso informático de Project Mariner se están integrando en la API de Gemini y Vertex AI. Empresas como Automation Anywhere y UiPath ya exploran su potencial, y Google planea un lanzamiento más amplio para desarrolladores este verano.
- Mayor Seguridad: Se han implementado mejoras significativas en la protección contra amenazas de seguridad, como las inyecciones indirectas de mensajes, haciendo de Gemini 2.5 la familia de modelos más segura hasta la fecha.
Experiencia de desarrollador mejorada: transparencia y control
Google sigue invirtiendo en la experiencia del desarrollador, proporcionando herramientas que aumentan la transparencia y el control:
- Resúmenes de Pensamientos: Las versiones 2.5 Pro y Flash ahora incluyen resúmenes de ideas en la API de Gemini y Vertex AI. Estos resúmenes organizan las ideas originales del modelo en un formato claro, facilitando la comprensión y depuración de las interacciones.
- Presupuestos de Pensamiento: Lanzados con Flash 2.5 para un mayor control de costos al equilibrar latencia y calidad, esta capacidad se extiende a 2.5 Pro. Permite controlar la cantidad de tokens que un modelo usa para «pensar» antes de responder, o incluso desactivar esta función. Gemini 2.5 Pro con presupuestos estará disponible para uso de producción estable en las próximas semanas.
- Soporte MCP: Se ha añadido soporte nativo del SDK para las definiciones del Protocolo de Contexto de Modelo (MCP) en la API de Gemini, facilitando la integración con herramientas de código abierto y explorando servidores MCP y herramientas alojadas para simplificar la creación de aplicaciones con agentes.
Google mantiene un ciclo de innovación constante, mejorando sus modelos y la experiencia del desarrollador, siempre respondiendo a los comentarios de la comunidad y expandiendo las capacidades fundamentales de Gemini.
