Bienvenidos a Tecnogus

IBM presenta el acelerador Spyre para disponibilidad comercial

IBM anunció la próxima disponibilidad general de IBM Spyre Accelerator, un acelerador de IA que permite la inferencia de baja latencia para respaldar casos de uso de IA generativa y agente, priorizando la seguridad y la resiliencia de las cargas de trabajo principales. A principios de este año, IBM anunció que Spyre Accelerator estaría disponible en los sistemas IBM z17, LinuxONE 5 y Power11. Spyre estará disponible para el público general el 28 de octubre para los sistemas IBM z17 y LinuxONE 5, y a principios de diciembre para los servidores Power11.

El panorama actual de TI está cambiando de los flujos de trabajo lógicos tradicionales a la inferencia de IA con agentes. Los agentes de IA requieren inferencia de baja latencia y capacidad de respuesta del sistema en tiempo real. IBM reconoció la necesidad de mainframes y servidores para ejecutar modelos de IA junto con las cargas de trabajo empresariales más exigentes sin comprometer el rendimiento.

Datos críticos y mitigar el riesgo

Para satisfacer esta demanda, los clientes necesitan hardware de inferencia de IA que admita IA generativa y con agentes, manteniendo al mismo tiempo la seguridad y la resiliencia de los datos, las transacciones y las aplicaciones principales. El acelerador también está diseñado para permitir a los clientes mantener los datos críticos en sus instalaciones para mitigar el riesgo y, al mismo tiempo, optimizar la eficiencia operativa y energética.

El Acelerador IBM Spyre refleja la solidez de la línea de productos de IBM, que abarca desde la investigación hasta el desarrollo de productos, combinando la innovación revolucionaria del Centro de Hardware de IA de IBM Research con el desarrollo de nivel empresarial de IBM Infrastructure. Inicialmente presentado como un prototipo de chip, Spyre se perfeccionó mediante una rápida iteración, incluyendo implementaciones en clústeres en el campus de IBM en Yorktown Heights y con colaboradores como el Centro de Sistemas de Inteligencia Artificial Emergentes  de la Universidad de Albany .

El prototipo de IBM Research se ha convertido en un producto de nivel empresarial para sistemas IBM Z, LinuxONE y Power. Actualmente, el Acelerador Spyre es un sistema en chip comercial con 32 núcleos aceleradores individuales y 25.600 millones de transistores. Fabricado con tecnología de nodos de 5 nm, cada Spyre se monta en una tarjeta PCIe de 75 vatios, lo que permite agrupar hasta 48 tarjetas en un sistema IBM Z o LinuxONE, o 16 tarjetas en un sistema IBM Power, para escalar las capacidades de IA.

Mejorar la infraestructura

«Una de nuestras prioridades clave ha sido mejorar la infraestructura para satisfacer las demandas de las nuevas y emergentes cargas de trabajo de IA», afirmó Barry Baker , director de operaciones de IBM Infrastructure y director general de IBM Systems . «Con Spyre Accelerator, ampliamos las capacidades de nuestros sistemas para dar soporte a la IA multimodelo, incluyendo la IA generativa y la inteligencia artificial. Esta innovación permite a los clientes escalar sus cargas de trabajo críticas basadas en IA con seguridad, resiliencia y eficiencia inquebrantables, a la vez que liberan el valor de sus datos empresariales».

«Lanzamos el Centro de Hardware de IA de IBM Research en 2019 con la misión de satisfacer las crecientes demandas computacionales de la IA, incluso antes del auge reciente de los LLM y los modelos de IA», declaró Mukesh Khare , director general de IBM Semiconductors y vicepresidente de Nube Híbrida de IBM . «Ahora, ante la creciente demanda de capacidades avanzadas de IA, nos enorgullece ver el primer chip del Centro entrar en comercialización, diseñado para ofrecer un mejor rendimiento y productividad a los clientes de mainframe y servidores de IBM».

Mejoras en los niveles de procesamiento

Para los clientes de IBM, los aceleradores Spyre ofrecen un procesamiento rápido y seguro con aceleración de IA local. Esto marca un hito importante, ya que permite a las empresas aprovechar la IA a escala, manteniendo los datos en sistemas IBM Z, LinuxONE y Power. En sistemas mainframe, junto con el procesador Telum II para IBM Z y LinuxONE, Spyre ofrece mayor seguridad, baja latencia y alta capacidad de procesamiento de transacciones. Al aprovechar esta avanzada pila de hardware y software, las empresas pueden usar Spyre para escalar múltiples modelos de IA e impulsar casos de uso predictivos, como la detección avanzada de fraudes y la automatización del comercio minorista.

En los servidores basados ​​en IBM Power, los clientes de Spyre pueden aprovechar un catálogo de servicios de IA, lo que permite una IA integral para flujos de trabajo empresariales. Los clientes pueden instalar los servicios de IA desde el catálogo con un solo clic. Spyre Accelerator for Power, combinado con un acelerador en chip (MMA), también acelera la conversión de datos para la IA generativa, ofreciendo un alto rendimiento para integraciones de procesos profundas.

Además, con un tamaño de solicitud de 128, permite la ingesta de más de 8 millones de documentos para la integración de bases de conocimiento en una hora . 2 Este rendimiento, combinado con la pila de software de IBM, la seguridad, la escalabilidad y la eficiencia energética, apoya a los clientes en su proceso de integración de marcos de IA generativa en sus cargas de trabajo empresariales.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *