Con chips internos, Microsoft pretende adaptar todo «desde el silicio hasta el servicio» para satisfacer la demanda de IA

ESPACIO PREMIUM
728 x 90 px
ESPACIO PREMIUM
728 x 90 px

Por Jake Siegel

Escondido en el campus de Microsoft en Redmond hay un laboratorio lleno de máquinas que sondean el componente básico de la era digital: el silicio. Este proceso de varios pasos prueba meticulosamente el silicio, en un método que los ingenieros de Microsoft han estado refinando en secreto durante años.

Hoy en Microsoft Ignite la compañía dio a conocer dos chips diseñados a medida y sistemas integrados que resultaron de ese viaje: el Microsoft Azure Maia AI Accelerator, optimizado para tareas de inteligencia artificial (IA) e IA generativa, y Microsoft Azure Cobalt CPU, un procesador basado en Arm diseñado para ejecutar cargas de trabajo de computación de propósito general en la nube de Microsoft.

GOOGLE ADS
(Automático aquí)

Los chips representan una última pieza del rompecabezas para que Microsoft entregue sistemas de infraestructura, que incluyen todo, desde opciones de silicio, software y servidores hasta racks y sistemas de refrigeración, que han sido diseñados de arriba a abajo y pueden optimizarse teniendo en cuenta las cargas de trabajo internas y de los clientes.

Los chips comenzarán a implementarse a principios del próximo año en los centros de datos de Microsoft, impulsando inicialmente los servicios de la compañía, como Microsoft Copilot o Azure OpenAI Service. Se unirán a una gama cada vez mayor de productos de socios de la industria para ayudar a satisfacer la creciente demanda de potencia informática eficiente, escalable y sostenible y las necesidades de los clientes ansiosos por aprovechar los últimos avances en la nube y la IA.

«Microsoft está construyendo la infraestructura para respaldar la innovación en IA, y estamos reinventando todos los aspectos de nuestros centros de datos para satisfacer las necesidades de nuestros clientes», dijo Scott Guthrie, vicepresidente ejecutivo del Grupo Cloud + AI de Microsoft. «A la escala en la que operamos, es importante para nosotros optimizar e integrar cada capa de la pila de infraestructura para maximizar el rendimiento, diversificar nuestra cadena de suministro y ofrecer a los clientes opciones de infraestructura».

Optimización de cada capa de la pila

Los chips son los caballos de batalla de la nube. Manejan miles de millones de transistores que procesan los vastos flujos de unos y ceros que fluyen a través de los centros de datos. En última instancia, ese trabajo le permite hacer casi todo en su pantalla, desde enviar un correo electrónico hasta generar una imagen en Bing con una simple oración.

Al igual que la construcción de una casa le permite controlar cada elección de diseño y detalle, Microsoft ve la adición de chips de cosecha propia como una forma de garantizar que cada elemento se adapte a las cargas de trabajo de IA y nube de Microsoft. Los chips se colocarán en placas de servidor personalizadas, colocadas dentro de racks hechos a medida que caben fácilmente dentro de los centros de datos existentes de Microsoft. El hardware trabajará mano a mano con el software, co-diseñado para desbloquear nuevas capacidades y oportunidades.

El objetivo final es un sistema de hardware de Azure que ofrezca la máxima flexibilidad y que también pueda optimizarse para la potencia, el rendimiento, la sostenibilidad o el costo, señaló Rani Borkar, vicepresidente corporativo de Azure Hardware Systems and Infrastructure (AHSI).

«El software es nuestra principal fortaleza, pero francamente, somos una empresa de sistemas. En Microsoft estamos co-diseñando y optimizando hardware y software juntos para que uno más uno sea mayor que dos», dijo Borkar. «Tenemos visibilidad de toda la pila, y el silicio es solo uno de los ingredientes».

En Microsoft Ignite, la compañía también anunció la disponibilidad general de uno de esos ingredientes clave: Azure Boost, un sistema que hace que el almacenamiento y las redes sean más rápidos al llevar esos procesos de los servidores host a hardware y software especialmente diseñados.

Para complementar sus esfuerzos de silicio personalizado, Microsoft también anunció que está ampliando las asociaciones de la industria para proporcionar más opciones de infraestructura para los clientes. Microsoft lanzó una vista previa de la nueva serie de máquinas virtuales NC H100 v5 creada para NVIDIA Núcleo tensorial H100 GPUs, ofreciendo un mayor rendimiento, fiabilidad y eficiencia para el entrenamiento de IA de rango medio y la inferencia de IA generativa. Microsoft también agregará la última GPU NVIDIA H200 Tensor Core a su flota el próximo año para admitir la inferencia de modelos más grandes sin reducción de latencia.

La compañía también anunció que agregará máquinas virtuales aceleradas AMD MI300X a Azure. Las máquinas virtuales ND MI300 están diseñadas para acelerar el procesamiento de cargas de trabajo de IA para el entrenamiento de modelos de IA de alto rango y la inferencia generativa, y contarán con la última GPU de AMD, la AMD Instinct MI300X.

Al agregar silicio de primera mano a un creciente ecosistema de chips y hardware de socios de la industria, Microsoft podrá ofrecer más opciones en precio y rendimiento para sus clientes, dijo Borkar.

«La obsesión por el cliente significa que ofrecemos lo que es mejor para nuestros clientes, y eso significa tomar lo que está disponible en el ecosistema, así como lo que hemos desarrollado», dijo. «Continuaremos trabajando con todos nuestros socios para ofrecer al cliente lo que quiere».

Evolución conjunta de hardware y software

El nuevo Maia 100 AI Accelerator de la compañía impulsará algunas de las mayores cargas de trabajo internas de IA que se ejecutan en Microsoft Azure. Además, OpenAI ha proporcionado comentarios sobre Azure Maia y los conocimientos profundos de Microsoft sobre cómo se ejecutan las cargas de trabajo de OpenAIn Infraestructura TDe acuerdo con el deber, la mayoría de las personas que se Su large Idioma modelos está ayudando a informar los futuros diseños de Microsoft.

«Desde que nos asociamos por primera vez con Microsoft, hemos colaborado para codiseñar la infraestructura de IA de Azure en cada capa para nuestros modelos y necesidades de entrenamiento sin precedentes», dijo Sam Altman, CEO de OpenAI. «Nos emocionamos cuando Microsoft compartió por primera vez sus diseños para el chip Maia, y hemos trabajado juntos para refinarlo y probarlo con nuestros modelos. La arquitectura de IA de extremo a extremo de Azure, ahora optimizada hasta el silicio con Maia, allana el camino para entrenar modelos más capaces y hacer que esos modelos sean más baratos para nuestros clientes». El Maia 100 AI Accelerator también fue diseñado específicamente para la pila de hardware de Azure, dijo Brian Harry, un miembro técnico de Microsoft que lidera el equipo de Azure Maia. Esa integración vertical, la alineación del diseño del chip con la infraestructura de IA más grande diseñada teniendo en cuenta las cargas de trabajo de Microsoft, puede producir enormes ganancias en rendimiento y eficiencia, dijo.

GOOGLE ADS
(Automático aquí)

Gustavo Torres

Amante de la tecnología con 7 años de experiencia en el cubrimiento informativo de este sector en temas como telecomunicaciones, tecnología de consumo, dispositivos móviles y plataformas en Colombia.

Mi opinión sobre tecnología ha sido tomada por medios como La República o AS. Soy especialista productos de consumo masivo y reviews de hardware. Soy director de tecnogus.com.co

Comparte...

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *