Google I/O 2025: potenciando a los desarrolladores con nuevas herramientas de IA

ESPACIO PREMIUM
728 x 90 px
ESPACIO PREMIUM
728 x 90 px

Google I/O 2025 ha sido el escenario para una cascada de anuncios dirigidos a desarrolladores, enfocados en democratizar la creación de aplicaciones de Inteligencia Artificial (IA) transformadoras. Con la convicción de que los desarrolladores son los arquitectos del futuro, Google ha presentado un abanico de innovaciones diseñadas para ampliar los límites de lo posible con la IA, ofreciendo mayor control, eficiencia y versatilidad. Estas actualizaciones se construyen sobre los avances de Gemini 2.5 Pro Preview, que ya había mejorado significativamente las capacidades de programación.

Avances en Gemini 2.5: más potencia y transparencia

Las últimas mejoras en los modelos Gemini se centran en el rendimiento y la eficiencia, ofreciendo a los desarrolladores herramientas más potentes y un control sin precedentes:

  • Gemini 2.5 Flash en Preview mejorado: Esta nueva versión de nuestro modelo líder optimiza el rendimiento en tareas de codificación y razonamiento complejo, priorizando la velocidad y la eficiencia.
  • Mayor transparencia y control: Ahora, los resúmenes de pensamientos están disponibles en los modelos 2.5. Próximamente, los presupuestos de pensamiento se integrarán en la versión preliminar de Pro 2.5, permitiendo a los desarrolladores gestionar mejor los costos y el proceso de razonamiento de los modelos antes de generar una respuesta.
  • Disponibilidad: Ambas versiones de Gemini 2.5 Flash y 2.5 Pro ya están disponibles en vista previa a través de Google AI Studio y Vertex AI. Se espera que Flash tenga disponibilidad general a principios de junio, seguido pronto por Pro.

Nuevos modelos de IA para casos de uso específicos

Google amplía su catálogo de modelos para satisfacer las necesidades específicas de los desarrolladores, brindando aún más variedad para elegir:

GOOGLE ADS
(Automático aquí)
  • Gemma 3n: Este es nuestro último modelo multimodal abierto, diseñado para ser rápido y eficiente, funcionando sin problemas en teléfonos, laptops y tabletas. Soporta audio, texto, imágenes y video. Ya puedes obtener una vista previa de Gemma 3n en Google AI Studio y con Google AI Edge.
  • Gemini Diffusion: Un nuevo modelo de texto a imagen de vanguardia que destaca por su velocidad. La demo experimental de Gemini Diffusion, lanzada hoy, genera texto a una velocidad cinco veces superior a la de nuestro modelo más rápido hasta la fecha, manteniendo el mismo rendimiento de codificación. Los interesados pueden inscribirse en la lista de espera.
  • Lyria RealTime: Un modelo experimental de generación de música interactiva que permite crear, controlar e interpretar música en tiempo real. Lyria RealTime está disponible a través de la API de Gemini y se puede probar en la aplicación de inicio de Google AI Studio.

Además, la familia Gemma crece con variantes especializadas:

  • MedGemma: El modelo abierto más potente de Google para la comprensión multimodal de textos e imágenes médicas, diseñado para que los desarrolladores creen aplicaciones de salud, como el análisis de imágenes médicas. MedGemma ya forma parte de Health AI Developer Foundations.
  • SignGemma: Próximo modelo abierto que traducirá el lenguaje de señas a texto hablado, abriendo nuevas posibilidades para el desarrollo de aplicaciones e integraciones destinadas a usuarios sordos o con dificultades auditivas.

Herramientas simplificadas para la creación con IA

Google I/O presentó un conjunto de herramientas diseñadas para facilitar aún más el proceso de construcción con IA:

  • Un nuevo Colab más agente: Próximamente, Colab será una experiencia completamente basada en agentes. Solo necesitarás indicarle lo que quieres lograr, y Colab actuará en tu cuaderno, corrigiendo errores y transformando el código para ayudarte a resolver problemas complejos más rápido.
  • Gemini Code Assist: Nuestro asistente de programación gratuito con IA, Gemini Code Assist para particulares, y nuestro agente de revisión de código, Gemini Code Assist para GitHub, ya están disponibles para todos los desarrolladores. Además, Gemini 2.5 ya está disponible para Gemini Code Assist, y una ventana de contexto de 2 millones de tokens estará disponible para los desarrolladores de Gemini Code Assist Standard y Enterprise cuando esté disponible en Vertex AI.
  • Firebase Studio: Nuestro nuevo espacio de trabajo de IA en la nube, Firebase Studio, facilita la transformación de ideas en aplicaciones de IA integrales. Los desarrolladores pueden convertir sus diseños de Figma directamente en Firebase Studio con el plugin builder.io. Ahora, se incorpora una funcionalidad que detecta cuándo tu aplicación necesita un backend y lo proporciona automáticamente.
  • Jules: Ya disponible para todos, Jules es un agente de codificación asíncrona que te permite enfocarte en la codificación principal, mientras Jules se encarga de tareas secundarias como solucionar errores acumulados, gestionar múltiples tareas y desarrollar nuevas funcionalidades. Jules trabaja directamente con GitHub, clonando tu repositorio en una máquina virtual en la nube y creando una solicitud de reinversión cuando estás listo.
  • Stitch: Una nueva herramienta con IA para generar diseños de interfaz de usuario (UI) de alta calidad y su código frontend correspondiente para escritorio y dispositivos móviles, utilizando descripciones en lenguaje natural o indicaciones de imágenes. Stitch acelera la materialización de ideas, permitiendo iteraciones conversacionales, ajustes de temas y exportación fácil a CSS/HTML o Figma.

Avances en la API de Gemini: potenciando el desarrollo con IA

La API de Gemini continúa evolucionando, ofreciendo nuevas funcionalidades que amplían las capacidades de los desarrolladores:

  • Actualizaciones de Google AI Studio: La forma más rápida de empezar a crear con la API de Gemini, aprovechando los innovadores modelos Gemini 2.5 junto con nuevos modelos de medios generativos como Imagen, Veo y la generación nativa de imágenes. Gemini 2.5 Pro se ha integrado en el editor de código nativo de Google AI Studio para prototipos más rápidos. Con el SDK de GenAI, puedes generar aplicaciones web al instante desde indicaciones de texto, imagen o video.
  • Salida de audio nativa y API en vivo: El nuevo modelo Flash de Gemini 2.5 (en vista preliminar) incluye funciones como video proactivo (detección y recuerdo de eventos clave), audio proactivo (ignora señales de audio irrelevantes) y diálogo afectivo (responde al tono del usuario). Su implementación comienza hoy mismo.
  • Diálogo de audio nativo: Los desarrolladores pueden previsualizar nuevas funciones de texto a voz (TTS) en Gemini 2.5 Flash y 2.5 Pro, permitiendo una salida de voz sofisticada con uno o varios hablantes. Los nuevos modelos TTS controlables ofrecen un control preciso sobre el estilo, acento y ritmo de la voz para un audio generado por IA altamente personalizado.
  • Llamada de funciones asincrónicas: Una nueva característica que permite llamar a funciones o herramientas de ejecución más prolongada en segundo plano sin bloquear el flujo de conversación principal.
  • API de Uso de Computadora: Una nueva función para que los desarrolladores creen aplicaciones que puedan navegar por la web o usar otras herramientas de software bajo su supervisión. Disponible hoy en la API de Gemini para Testers de Confianza, se expandirá a más desarrolladores a finales de este año.
  • Contexto de URL: Se añade soporte para una nueva herramienta experimental, Contexto de URL, que recupera el contexto completo de la página desde URLs, utilizable de forma independiente o en combinación con otras herramientas como la Búsqueda de Google.
  • Protocolo de contexto de modelo: La API y el SDK de Gemini ahora soportarán el Protocolo de Contexto de Modelo (MCP) para facilitar el uso de una amplia gama de herramientas de código abierto por parte de los desarrolladores.

Metadescripción:

Etiquetas:

GOOGLE ADS
(Automático aquí)

Gustavo Torres

Amante de la tecnología con 7 años de experiencia en el cubrimiento informativo de este sector en temas como telecomunicaciones, tecnología de consumo, dispositivos móviles y plataformas en Colombia.

Mi opinión sobre tecnología ha sido tomada por medios como La República o AS. Soy especialista productos de consumo masivo y reviews de hardware. Soy director de tecnogus.com.co

Comparte...

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *