Nvidia y Microsoft presentan una plataforma unificada para la implementación de IA agente desde dispositivos Windows hasta la nube

ESPACIO PREMIUM
728 x 90 px
ESPACIO PREMIUM
728 x 90 px

El ecosistema de la inteligencia artificial ha entrado de forma definitiva en la era de los sistemas autónomos con capacidad de gestión y ejecución. No obstante, para consolidar el despliegue de la IA agéntica a escala empresarial no basta con el diseño de modelos de lenguaje avanzados; se requiere una infraestructura física robusta, entornos de ejecución seguros, alta velocidad en el procesamiento de bases de datos y arquitecturas de hardware optimizadas para tareas complejas de razonamiento a largo plazo.

En el marco del evento tecnológico Microsoft Build 2026, Nvidia y Microsoft han anunciado una colaboración estratégica que unifica su hardware acelerado y suites de software para permitir a los desarrolladores crear, ejecutar y escalar sistemas de IA física y automatizada en dispositivos Windows, la nube de Azure e infraestructuras locales.

Durante la presentación principal de la conferencia, Jensen Huang, fundador y director ejecutivo de Nvidia, participó junto a Satya Nadella, presidente y director ejecutivo de Microsoft, en una transmisión en vivo desde Taipéi para detallar el alcance de esta alianza. El despliegue conjunto abarca el lanzamiento de las arquitecturas RTX Spark y DGX Station para Windows, la aceleración por GPU de Microsoft Fabric, la integración de modelos abiertos en Microsoft Foundry, el entorno de ejecución seguro Nvidia OpenShell en GitHub Copilot y la puesta en marcha de fábricas de IA de última generación.

GOOGLE ADS
(Automático aquí)

Reinventando la computación de escritorio para la era de los agentes autónomos

La colaboración entre ambas compañías redefine las capacidades operativas de los ordenadores personales y las estaciones de trabajo profesionales, introduciendo hardware configurado de fábrica para procesar tareas complejas de IA local.

La arquitectura de PC personales RTX Spark

La línea RTX Spark establece un nuevo estándar en el segmento de ordenadores de escritorio compactos y portátiles, siendo los primeros equipos optimizados de forma nativa para albergar agentes personales. Respaldados por tecnologías de la marca como CUDA, RTX, DLSS y TensorRT, estos dispositivos entregan un rendimiento de IA de 1 petaflop y admiten hasta 128 GB de memoria unificada.

La ingeniería del procesador permite que los sistemas mantengan su rendimiento gráfico e inteligencia artificial completos de forma autónoma, sin necesidad de conectarse a la red de energía eléctrica y garantizando una larga duración de la batería. Los primeros modelos comerciales llegarán al mercado global este otoño de la mano de fabricantes como Microsoft Surface, ASUS, Dell, HP, Lenovo y MSI.

Supercomputación de escritorio con DGX Station para Windows

Para requerimientos empresariales de alta demanda, se introduce la supercomputadora de sobremesa DGX Station para Windows. Este sistema está impulsado por el procesador Nvidia GB300 Grace Blackwell Ultra Desktop Superchip, configurando hasta 748 GB de memoria coherente y un rendimiento computacional FP4 de 20 petaflops.

El hardware está diseñado para ejecutar de forma local y continua modelos de vanguardia de hasta un billón de parámetros para agentes corporativos siempre activos. Se prevé que los fabricantes integradores como ASUS, Dell, GIGABYTE, HP, MSI y Supermicro inicien la distribución de estos equipos durante el cuarto trimestre del año. Cabe destacar que ambas plataformas de hardware operan de manera nativa bajo el entorno seguro Nvidia OpenShell.

Modelos abiertos de Nvidia e infraestructura de datos en Microsoft Foundry

La operación de la IA agéntica empresarial se fundamenta en la interoperabilidad de múltiples modelos. A través de la plataforma de cómputo gestionada Foundry Agent Service en la nube de Azure, las organizaciones pueden desplegar sistemas de agentes con gobernanza e identidad integradas, combinando soluciones de OpenAI, Anthropic y los modelos especializados Hermes. Los modelos Claude de Anthropic se ejecutarán de forma nativa sobre la infraestructura de servidores Nvidia GB300 Blackwell Ultra en Azure en las próximas semanas.

Por su parte, Nvidia introduce este mes su nuevo modelo de razonamiento de frontera abierta, Nvidia Nemotron 3 Ultra, optimizado para la gestión de flujos de trabajo prolongados en codificación, investigación y entornos corporativos. A este modelo se suman las soluciones Nemotron 3.5 ASR para reconocimiento de voz avanzado y Nemotron 3.5 Content Safety para la moderación de datos. El catálogo se enriquece con Nvidia Cosmos 3, el primer omnimodelo abierto diseñado para la IA física, que combina razonamiento visual, simulación de entornos y generación de acciones, así como los modelos meteorológicos de IA Nvidia Earth-2 orientados al análisis de riesgos climáticos empresariales.

Optimización del almacenamiento de datos con Microsoft Fabric

Los flujos de datos rápidos son esenciales para que los agentes inteligentes puedan consultar y razonar información en tiempo real de forma continua. La computación acelerada de Nvidia se ha integrado directamente en Microsoft Fabric Data Warehouse. Los benchmarks de rendimiento internos realizados por Microsoft revelan que esta aceleración por hardware ofrece una ejecución de consultas SQL hasta 6 veces más rápida en comparación con las configuraciones tradicionales basadas en CPU, y hasta 7 veces más veloz frente a otros proveedores de almacenamiento de datos en la nube bajo cargas de alta concurrencia de usuarios.

Extensión de la IA agéntica hacia entornos locales y soberanos

Para las organizaciones que manejan datos sensibles y requieren procesar información fuera de la nube pública, la alianza introduce mejoras críticas en la gobernanza local. La suite Foundry Local de Microsoft ha sido incorporada a Azure Local sobre la plataforma de servidores Nvidia RTX PRO 6000 Blackwell Server Edition, permitiendo la ejecución de la familia de modelos abiertos Nemotron en entornos híbridos, locales o centros de datos soberanos con baja latencia. Esta arquitectura ahora admite implementaciones de múltiples nodos y el entorno de ejecución vLLM para escalar la inferencia en sectores industriales y de energía.

Adicionalmente, el desarrollo seguro de agentes se traslada a la programación diaria mediante la integración de Nvidia OpenShell en GitHub Copilot. Para mitigar los riesgos de ejecución autónoma, OpenShell aísla a cada agente en un contenedor independiente, evaluando cada llamada saliente según políticas de código automatizadas (bajo licencia Apache 2.0) antes de conceder accesos a archivos, redes corporativas o credenciales del sistema.

Detalles de hardware y componentes de la plataforma unificada

Para los ingenieros de sistemas, arquitectos de nube y desarrolladores que necesitan registrar las variables técnicas y la infraestructura de hardware de este ecosistema dentro de portales institucionales o bases de datos en WordPress, a continuación se detallan las especificaciones de los dispositivos principales presentados:

Especificaciones de Nvidia RTX Spark

  • Propósito de diseño: Ordenadores portátiles y de sobremesa compactos optimizados para ejecutar agentes de IA personales de forma local.
  • Rendimiento de cálculo para IA: 1 petaflop de potencia de procesamiento acelerado.
  • Capacidad de memoria RAM: Hasta 128 GB de memoria unificada de alta velocidad.
  • Ecosistema de tecnologías base: Integración nativa de las librerías Nvidia CUDA, RTX, DLSS y TensorRT.
  • Entorno de ejecución seguro: Operación bajo el sistema seguro por diseño Nvidia OpenShell.
  • Disponibilidad en el mercado: Lanzamiento programado para el otoño de 2026 de la mano de Microsoft Surface, ASUS, Dell, HP, Lenovo y MSI.

Especificaciones de Nvidia DGX Station para Windows

  • Propósito de diseño: Supercomputadora de escritorio de alta densidad para la creación, optimización y ejecución de agentes de IA empresariales.
  • Procesador central acelerado: Chip especializado Nvidia GB300 Grace Blackwell Ultra Desktop Superchip.
  • Rendimiento de cálculo para IA: 20 petaflops de potencia bajo el formato de precisión computacional FP4.
  • Capacidad de memoria RAM: Hasta 748 GB de memoria coherente avanzada.
  • Escalabilidad de modelos: Capacidad física y lógica para ejecutar modelos de IA locales de hasta un billón de parámetros.
  • Entorno de ejecución seguro: Operación bajo el sistema seguro por diseño Nvidia OpenShell.
  • Disponibilidad en el mercado: Lanzamiento proyectado para el cuarto trimestre de 2026 a través de ASUS, Dell, GIGABYTE, HP, MSI y Supermicro.

Infraestructura de centros de datos y fábricas de IA

  • Fábrica de IA Fairwater (Wisconsin): Centro de datos a gran escala operativo antes de lo previsto, compuesto por cientos de miles de sistemas Nvidia Grace Blackwell interconectados.
  • Tecnologías de red integradas: Conectividad de alta velocidad mediante Ethernet Nvidia Spectrum-X y el protocolo de transporte de datos Multipath Reliable Connection (MRC) para la optimización económica del procesamiento de tokens.
  • Validación de hardware futuro: Certificación oficial de la plataforma de próxima generación Nvidia Vera Rubin para su despliegue en la infraestructura de Azure, ofreciendo hasta 10 veces más rendimiento de inferencia por megavatio.
  • Arquitectura de protección de datos: Funciones de Computación Confidencial de Nvidia (Nvidia Confidential Computing) integradas para el cifrado y protección de los datos mientras los agentes ejecutan sus tareas de razonamiento a gran escala.
GOOGLE ADS
(Automático aquí)

Gustavo Torres

Amante de la tecnología con 7 años de experiencia en el cubrimiento informativo de este sector en temas como telecomunicaciones, tecnología de consumo, dispositivos móviles y plataformas en Colombia.

Mi opinión sobre tecnología ha sido tomada por medios como La República o AS. Soy especialista productos de consumo masivo y reviews de hardware. Soy director de tecnogus.com.co

Comparte...

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *