Gemini API revoluciona la ingesta de datos: soporte para GCS, URLs externas y aumento de límites a 100MB
728 x 90 px
En el desarrollo de aplicaciones de inteligencia artificial generativa, la fricción en la gestión de datos siempre ha sido un cuello de botella crítico. Mover grandes volúmenes de información —videos, documentos extensos o audios largos— desde el almacenamiento en la nube hasta el modelo de inferencia solía implicar procesos redundantes de carga y descarga. Hoy, Google ha eliminado gran parte de esa complejidad con una actualización significativa para la API de Gemini.
Como expertos que llevamos años implementando arquitecturas en la nube, identificamos esta actualización como un cambio fundamental en la operatividad de la API. Las nuevas capacidades permiten la ingesta directa desde Google Cloud Storage (GCS), el uso de URLs firmadas (Signed URLs) desde cualquier proveedor y un aumento sustancial en el límite de tamaño para archivos inline.
El fin de la fricción en la ingesta de datos
Anteriormente, trabajar con archivos grandes en Gemini implicaba subirlos a la Files API, un almacenamiento efímero donde los datos persistían solo por 48 horas. Si bien este método era funcional para prototipos rápidos, resultaba ineficiente para aplicaciones en producción que dependen de datos persistentes y arquitecturas escalables.
(Automático aquí)
La actualización de hoy introduce herramientas robustas que permiten a los desarrolladores «traer sus propios datos» (Bring Your Own Data) sin necesidad de migraciones intermedias, acelerando el paso de desarrollo a producción.
Integración con URLs externas públicas y firmadas
La novedad más versátil es la capacidad de pasar cualquier URL accesible públicamente directamente en la solicitud de generación. Esto significa que si tienes un PDF o una imagen alojada en un servidor web, ya no necesitas descargarla a tu backend para luego enviarla a Gemini. La API se encarga de realizar la petición de forma segura durante el procesamiento.
Interoperabilidad multi-nube
Sin embargo, el verdadero avance para la arquitectura empresarial es el soporte para URLs prefirmadas. Esto permite acceder a datos almacenados en repositorios privados de otros proveedores de nube, como AWS S3 o Azure Blob Storage.
El flujo de trabajo se simplifica drásticamente:
- Tu aplicación genera una URL firmada (con caducidad temporal) desde tu bucket en AWS o Azure.
- Pasas esa URL directamente a la API de Gemini.
- Gemini recupera el contenido de forma segura para procesarlo.
Esto elimina la necesidad de transferir terabytes de información a la infraestructura de Google solo para realizar inferencias, reduciendo costos de ancho de banda y latencia.
Registro directo de archivos en Google Cloud Storage
Para los equipos que ya operan dentro del ecosistema de Google Cloud, la integración se vuelve nativa. Si tus datos residen en Google Cloud Storage (GCS), ya no es necesario «mover bytes».
La nueva funcionalidad permite registrar los archivos de GCS directamente con la Files API. Al hacerlo, se crea una referencia al archivo existente sin duplicar la información. Esto es especialmente útil para entrenamientos o inferencias recurrentes sobre los mismos datasets, ya que puedes registrar las URIs una vez y utilizarlas en múltiples solicitudes. Este método requiere autenticación mediante credenciales OAuth con permisos de lectura en el bucket, garantizando que la seguridad se mantenga bajo los estándares de IAM (Identity and Access Management).
Aumento del límite de archivos inline a 100MB
Para escenarios de prototipado rápido, aplicaciones en tiempo real o casos donde la simplicidad es prioritaria, Google ha escuchado a la comunidad de desarrolladores. El límite para la carga útil de datos inline (codificados en base64) ha aumentado de 20MB a 100MB.
Este incremento es vital para el procesamiento multimodal. Con 20MB, muchas veces era imposible enviar videoclips cortos de alta definición o documentos PDF muy extensos sin recurrir a un almacenamiento intermedio. El nuevo límite de 100MB permite manejar imágenes de gran resolución, clips de audio y video, y documentos masivos directamente en la llamada a la API, simplificando el código para demos y aplicaciones ligeras.
Cómo implementar los nuevos métodos
Estas funciones ya están disponibles en las últimas versiones de los SDK de Inteligencia Artificial Generativa de Google (GenAI SDKs).
Uso con Python y boto3
Para desarrolladores que utilizan Python, la implementación con servicios externos como AWS S3 es directa. Se utiliza la librería boto3 para generar una URL prefirmada y luego se pasa al cliente de genai utilizando el método types.Part.from_uri. Esto demuestra la flexibilidad del modelo gemini-3-flash-preview para interpretar contextos desde fuentes externas seguras.
Autenticación con GCS
En el caso de GCS, la integración requiere autenticar el cliente con credenciales que tengan el alcance (scope) adecuado para la plataforma en la nube. Una vez autenticado, el método client.files.register_files permite mapear las rutas gs:// directamente, haciendo que los archivos estén disponibles para el modelo instantáneamente.
Con estas actualizaciones, Google no solo mejora la API de Gemini, sino que la posiciona como una herramienta agnóstica en cuanto al almacenamiento, permitiendo a los ingenieros construir aplicaciones multimodales más rápidas, económicas y escalables, sin importar dónde residan sus datos.
