Microsoft presenta Maia 200: la nueva bestia del silicio para dominar la inferencia de IA en Azure
728 x 90 px
La infraestructura de nube ha dejado de ser una simple cuestión de servidores para convertirse en una guerra de silicio personalizado. Scott Guthrie, vicepresidente ejecutivo de Cloud + IA en Microsoft, ha revelado oficialmente el Microsoft Maia 200, el acelerador de IA de próxima generación diseñado para otorgar a Azure una ventaja competitiva sin precedentes en velocidad y rentabilidad.
Como expertos con siete años analizando la evolución de los centros de datos, observamos que Maia 200 no es solo un chip; es la respuesta de Microsoft a la necesidad de ejecutar modelos masivos, como el reciente GPT-5.2 de OpenAI, de forma más rápida y económica. En un mercado donde el «rendimiento por dólar» es la métrica reina, este acelerador se posiciona como el silicio de primera mano más eficiente de cualquier hiperescalador hasta la fecha.
Especificaciones técnicas: ¿qué hace al Maia 200 tan potente?
El Maia 200 ha sido fabricado utilizando el proceso de 3 nanómetros (nm) de TSMC, integrando más de 140 mil millones de transistores en un solo chip. Esta densidad permite una eficiencia energética superior, operando dentro de un envolvente térmico (TDP) de 750W, pero entregando potencias que superan a la competencia directa.
(Automático aquí)
Rendimiento bruto y memoria
En términos de potencia de cálculo, el Maia 200 entrega más de 10 petaFLOPS en precisión FP4 y más de 5 petaFLOPS en FP8. Para poner esto en perspectiva humana, ofrece tres veces el rendimiento FP4 que el Amazon Train de tercera generación y supera el rendimiento FP8 del TPU de séptima generación de Google.
Sin embargo, los FLOPS son inútiles si los datos no se mueven rápido. Microsoft ha rediseñado el subsistema de memoria con:
- 216GB de memoria HBM3e con un ancho de banda de 7 TB/s.
- 272MB de SRAM integrada en el chip para minimizar la latencia.
- Un motor DMA especializado y una estructura NoC para eliminar cuellos de botella en modelos de lenguaje extenso (LLM).
Eficiencia operativa y despliegue en la infraestructura de Azure
El despliegue de este hardware ya es una realidad. Maia 200 se encuentra operativo en la región US Central (Iowa) y llegará próximamente a US West 3 (Arizona) y otras regiones globales. Lo más impactante para las empresas y startups de IA es que este chip ofrece un 30% más de rendimiento por dólar en comparación con la flota de hardware anterior de Azure.
Esta ventaja económica es vital para servicios masivos como Microsoft 365 Copilot y Microsoft Foundry. Además, el equipo de Microsoft Superintelligence ya utiliza este silicio para tareas críticas como la generación de datos sintéticos y el aprendizaje por refuerzo, acelerando la velocidad a la que se filtran señales de alta calidad para entrenar modelos de próxima generación.
Un ecosistema optimizado: del silicio al SDK
Uno de los mayores retos al introducir nuevo hardware es la compatibilidad. Microsoft ha resuelto esto lanzando el SDK de Maia, un conjunto de herramientas nativas que permite a los desarrolladores optimizar sus modelos sin complicaciones.
El SDK incluye:
- Integración nativa con PyTorch.
- Un compilador Triton.
- Bibliotecas optimizadas del kernel.
- Acceso a un lenguaje de programación de bajo nivel para un control granular.
Esta flexibilidad asegura que los modelos existentes puedan portarse a Maia 200 con un esfuerzo mínimo, aprovechando la infraestructura heterogénea de Azure que combina diferentes tipos de aceleradores según la necesidad de la carga de trabajo.
¿Cómo mejora Maia 200 la red y la refrigeración en los centros de datos?
A nivel de sistemas, Microsoft ha introducido una red de dos niveles construida sobre Ethernet estándar, evitando tejidos propietarios costosos. Cada acelerador expone 2,8 TB/s de ancho de banda bidireccional, permitiendo operaciones colectivas en clústeres de hasta 6.144 aceleradores.
En la práctica, esto significa que los modelos más grandes de la actualidad —y los que vendrán en el futuro— pueden correr de forma fluida y escalable entre nodos y racks con saltos mínimos de red. Para gestionar el calor generado por tal potencia, Microsoft ha implementado su Unidad de Intercambiador de Calor de Refrigeración Líquida de segunda generación, un sistema de circuito cerrado integrado nativamente en el plano de control de Azure para maximizar el tiempo de actividad.
El programa Maia está diseñado para ser multigeneracional. Mientras el Maia 200 se despliega globalmente, Microsoft ya diseña las futuras iteraciones para establecer nuevos estándares en la era de la IA a gran escala.
