Google actualiza Veo 3.1: generación de video vertical nativo, resolución 4K y consistencia de personajes mejorada
728 x 90 px
La carrera por la supremacía en la generación de video mediante inteligencia artificial ha dado un nuevo salto cualitativo. Google DeepMind ha anunciado hoy una actualización crítica para su modelo Veo 3.1, enfocándose específicamente en la funcionalidad «Ingredients to Video» (Ingredientes a Video). Esta mejora no es menor; ataca directamente los dolores de cabeza más frecuentes de los creadores de contenido: la consistencia visual, la calidad de resolución y la adaptación a formatos móviles.
Como expertos que hemos seguido la evolución de los modelos generativos desde sus inicios, interpretamos este movimiento como la maduración definitiva de Veo. Ya no se trata solo de generar clips aleatorios impresionantes, sino de ofrecer herramientas de control precisas que permitan flujos de trabajo profesionales, desde la creación de un Short para YouTube hasta producciones de alta fidelidad en 4K.
Consistencia de identidad y control creativo
Uno de los mayores desafíos en el video generativo ha sido la «alucinación» o inconsistencia entre cuadros. A menudo, un personaje cambiaba de rostro o de ropa a medida que avanzaba el clip. Con la actualización de Veo 3.1 Ingredients to Video, Google promete haber mitigado este problema sustancialmente.
(Automático aquí)
Esta función permite a los usuarios cargar imágenes de referencia (los «ingredientes») para guiar la generación del video. Las mejoras actuales aseguran que, incluso con prompts sencillos, el modelo mantenga la identidad del personaje inalterada aunque cambie el entorno. Esto es fundamental para la narrativa secuencial (storytelling), ya que permite utilizar al mismo protagonista en múltiples escenas sin que parezca una persona diferente en cada toma.
Además, la consistencia se extiende a los fondos y objetos. Ahora es posible reutilizar texturas, objetos específicos o escenarios estilizados a través de diferentes clips, otorgando una coherencia visual que antes era extremadamente difícil de lograr sin una postproducción compleja. La IA ahora es capaz de fusionar elementos dispares —personajes, objetos y fondos estilizados— en un clip cohesivo de alto impacto.
El consejo experto: Nano Banana Pro
Para maximizar esta capacidad, Google sugiere un flujo de trabajo integrado: utilizar el nuevo modelo Nano Banana Pro (Gemini 3 Pro Image) en la app de Gemini o Flow para generar las imágenes base de alta calidad, y luego utilizarlas como «ingredientes» en Veo 3.1 para animarlas.
Formato vertical nativo para la era móvil
Hasta ahora, muchos modelos generaban video en formato panorámico (16:9), obligando a los creadores a recortar la imagen para plataformas móviles, perdiendo calidad y composición en el proceso.
Por primera vez, Ingredients to Video soporta la generación de salidas en relación de aspecto nativa 9:16. Esto significa que los creadores de contenido para TikTok, Instagram Reels o YouTube Shorts pueden producir narrativas visuales a pantalla completa directamente desde la IA, sin recortes y sin pérdida de resolución. Esta adaptación al formato mobile-first democratiza el acceso a la producción de video de alta calidad para redes sociales.
Escalado de última generación a 4K
En el extremo opuesto del espectro, para las producciones que requieren fidelidad de transmisión (broadcast), Veo 3.1 introduce capacidades de escalado (upscaling) de vanguardia.
El modelo ahora permite exportar videos en 1080p y 4K.
- 1080p: Ofrece una imagen más limpia y nítida, ideal para la edición estándar.
- 4K: Captura texturas ricas y una claridad asombrosa, diseñada para pantallas grandes y flujos de trabajo de producción de alta gama donde el detalle es innegociable.
Esta capacidad elimina la sensación de «borrosidad» o artefactos de compresión que solían caracterizar a los primeros videos generados por IA, acercando los resultados a estándares profesionales.
Disponibilidad en el ecosistema de Google
Google ha desplegado estas capacidades a través de todo su ecosistema de productos, diferenciando entre herramientas de consumo y plataformas empresariales:
- Para consumidores y creadores: Las funciones de Veo 3.1 llegan directamente a YouTube Shorts y la aplicación YouTube Create, facilitando la creación inmediata. Además, el modo retrato y las mejoras de Ingredients están disponibles desde hoy en la aplicación de Gemini.
- Para empresas y desarrolladores: Las capacidades avanzadas, incluyendo el soporte vertical nativo y el escalado a 4K, se están implementando en Flow, la API de Gemini, Google Vids y Vertex AI. Esto permite a las empresas integrar estas potentes herramientas en sus propios desarrollos de software o flujos de marketing automatizado.
Transparencia y seguridad con SynthID
En un contexto donde la desinformación visual es una preocupación creciente, Google mantiene su compromiso con la IA responsable. Todos los videos generados por las herramientas de Veo 3.1 incluyen SynthID, una marca de agua digital imperceptible para el ojo humano pero detectable por software.
Además, desde diciembre se expandió la herramienta de verificación en la app de Gemini para incluir video. Los usuarios pueden subir un clip y preguntar si fue generado por la IA de Google, fomentando un ecosistema digital más transparente y confiable para todos.
