Gemini API revoluciona la ingesta de datos: soporte para GCS, URLs externas y aumento de límites a 100MB

ESPACIO PREMIUM
728 x 90 px
ESPACIO PREMIUM
728 x 90 px

En el desarrollo de aplicaciones de inteligencia artificial generativa, la fricción en la gestión de datos siempre ha sido un cuello de botella crítico. Mover grandes volúmenes de información —videos, documentos extensos o audios largos— desde el almacenamiento en la nube hasta el modelo de inferencia solía implicar procesos redundantes de carga y descarga. Hoy, Google ha eliminado gran parte de esa complejidad con una actualización significativa para la API de Gemini.

Como expertos que llevamos años implementando arquitecturas en la nube, identificamos esta actualización como un cambio fundamental en la operatividad de la API. Las nuevas capacidades permiten la ingesta directa desde Google Cloud Storage (GCS), el uso de URLs firmadas (Signed URLs) desde cualquier proveedor y un aumento sustancial en el límite de tamaño para archivos inline.

El fin de la fricción en la ingesta de datos

Anteriormente, trabajar con archivos grandes en Gemini implicaba subirlos a la Files API, un almacenamiento efímero donde los datos persistían solo por 48 horas. Si bien este método era funcional para prototipos rápidos, resultaba ineficiente para aplicaciones en producción que dependen de datos persistentes y arquitecturas escalables.

GOOGLE ADS
(Automático aquí)

La actualización de hoy introduce herramientas robustas que permiten a los desarrolladores «traer sus propios datos» (Bring Your Own Data) sin necesidad de migraciones intermedias, acelerando el paso de desarrollo a producción.

Integración con URLs externas públicas y firmadas

La novedad más versátil es la capacidad de pasar cualquier URL accesible públicamente directamente en la solicitud de generación. Esto significa que si tienes un PDF o una imagen alojada en un servidor web, ya no necesitas descargarla a tu backend para luego enviarla a Gemini. La API se encarga de realizar la petición de forma segura durante el procesamiento.

Interoperabilidad multi-nube

Sin embargo, el verdadero avance para la arquitectura empresarial es el soporte para URLs prefirmadas. Esto permite acceder a datos almacenados en repositorios privados de otros proveedores de nube, como AWS S3 o Azure Blob Storage.

El flujo de trabajo se simplifica drásticamente:

  1. Tu aplicación genera una URL firmada (con caducidad temporal) desde tu bucket en AWS o Azure.
  2. Pasas esa URL directamente a la API de Gemini.
  3. Gemini recupera el contenido de forma segura para procesarlo.

Esto elimina la necesidad de transferir terabytes de información a la infraestructura de Google solo para realizar inferencias, reduciendo costos de ancho de banda y latencia.

Registro directo de archivos en Google Cloud Storage

Para los equipos que ya operan dentro del ecosistema de Google Cloud, la integración se vuelve nativa. Si tus datos residen en Google Cloud Storage (GCS), ya no es necesario «mover bytes».

La nueva funcionalidad permite registrar los archivos de GCS directamente con la Files API. Al hacerlo, se crea una referencia al archivo existente sin duplicar la información. Esto es especialmente útil para entrenamientos o inferencias recurrentes sobre los mismos datasets, ya que puedes registrar las URIs una vez y utilizarlas en múltiples solicitudes. Este método requiere autenticación mediante credenciales OAuth con permisos de lectura en el bucket, garantizando que la seguridad se mantenga bajo los estándares de IAM (Identity and Access Management).

Aumento del límite de archivos inline a 100MB

Para escenarios de prototipado rápido, aplicaciones en tiempo real o casos donde la simplicidad es prioritaria, Google ha escuchado a la comunidad de desarrolladores. El límite para la carga útil de datos inline (codificados en base64) ha aumentado de 20MB a 100MB.

Este incremento es vital para el procesamiento multimodal. Con 20MB, muchas veces era imposible enviar videoclips cortos de alta definición o documentos PDF muy extensos sin recurrir a un almacenamiento intermedio. El nuevo límite de 100MB permite manejar imágenes de gran resolución, clips de audio y video, y documentos masivos directamente en la llamada a la API, simplificando el código para demos y aplicaciones ligeras.

Cómo implementar los nuevos métodos

Estas funciones ya están disponibles en las últimas versiones de los SDK de Inteligencia Artificial Generativa de Google (GenAI SDKs).

Uso con Python y boto3

Para desarrolladores que utilizan Python, la implementación con servicios externos como AWS S3 es directa. Se utiliza la librería boto3 para generar una URL prefirmada y luego se pasa al cliente de genai utilizando el método types.Part.from_uri. Esto demuestra la flexibilidad del modelo gemini-3-flash-preview para interpretar contextos desde fuentes externas seguras.

Autenticación con GCS

En el caso de GCS, la integración requiere autenticar el cliente con credenciales que tengan el alcance (scope) adecuado para la plataforma en la nube. Una vez autenticado, el método client.files.register_files permite mapear las rutas gs:// directamente, haciendo que los archivos estén disponibles para el modelo instantáneamente.

Con estas actualizaciones, Google no solo mejora la API de Gemini, sino que la posiciona como una herramienta agnóstica en cuanto al almacenamiento, permitiendo a los ingenieros construir aplicaciones multimodales más rápidas, económicas y escalables, sin importar dónde residan sus datos.

GOOGLE ADS
(Automático aquí)

Gustavo Torres

Amante de la tecnología con 7 años de experiencia en el cubrimiento informativo de este sector en temas como telecomunicaciones, tecnología de consumo, dispositivos móviles y plataformas en Colombia.

Mi opinión sobre tecnología ha sido tomada por medios como La República o AS. Soy especialista productos de consumo masivo y reviews de hardware. Soy director de tecnogus.com.co

Comparte...

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *