Los procesadores Intel Xeon aceleran las cargas de trabajo GenAI con Aible
728 x 90 px
Intel y Aible , una solución empresarial de análisis aumentado y de IA generativa sin servidor (GenAI) de extremo a extremo, ahora ofrecen soluciones a clientes compartidos para ejecutar casos de uso avanzados de GenAI y generación aumentada de recuperación (RAG) en múltiples generaciones de Intel. ® CPU Xeon®. La colaboración, que incluye optimizaciones de ingeniería y un programa de evaluación comparativa , mejora la capacidad de Aible para ofrecer resultados de GenAI a bajo costo para los clientes empresariales y ayuda a los desarrolladores a incorporar inteligencia de IA en las aplicaciones. Juntas, las empresas ofrecen soluciones de IA escalables y eficientes que se basan en hardware de alto rendimiento para ayudar a los clientes a resolver desafíos con IA e Intel.
“Los clientes buscan soluciones eficientes y de nivel empresarial para aprovechar el poder de la IA. Nuestra colaboración con Aible muestra cómo estamos trabajando estrechamente con la industria para ofrecer innovación en IA y reducir la barrera de entrada para que muchos clientes ejecuten las últimas cargas de trabajo GenAI utilizando procesadores Intel Xeon”. –Mishali Naik, ingeniero principal sénior de Intel, centro de datos y grupo de IA
Acerca del rendimiento GenAI de Xeon: Las soluciones de Aible demuestran cómo las CPU pueden mejorar significativamente el rendimiento en una variedad de las últimas cargas de trabajo de IA, desde la ejecución de modelos de lenguaje hasta RAG. Optimizada para procesadores Intel, la tecnología de Aible utiliza un enfoque eficiente de extremo a extremo sin servidor para la IA, consumiendo recursos solo cuando hay solicitudes activas de los usuarios. Por ejemplo, la base de datos vectorial se activa durante solo unos segundos para recuperar información relevante para la consulta de un usuario, y el modelo de lenguaje de manera similar se enciende brevemente para procesar y responder a la solicitud. Esta operación bajo demanda ayuda a reducir el costo total de propiedad (TCO).
(Automático aquí)
Si bien RAG a menudo se implementa utilizando GPU (unidades de procesamiento de gráficos) y aceleradores para aprovechar sus capacidades de procesamiento paralelo, la técnica sin servidor de Aible, combinada con procesadores escalables Intel® Xeon®, permite que los casos de uso de RAG sean impulsados completamente por CPU. Los datos de rendimiento muestran que varias generaciones de procesadores Intel Xeon pueden ejecutar cargas de trabajo RAG de manera eficiente.
Por qué es importante
Aible permite a los clientes reducir los costos operativos de los proyectos GenAI al utilizar exclusivamente CPU sin servidor para compartir los mismos recursos informáticos subyacentes de manera más segura entre múltiples clientes. A modo de comparación, los costos operativos reducidos se pueden comparar con comprar electricidad cuando se usa en lugar de alquilar un generador de electricidad. Además, a medida que crece la demanda de IA generativa, la necesidad de optimizar tanto el rendimiento como el consumo de energía se vuelve más crucial. Los servicios basados en CPU de Aible ofrecen a los clientes una solución rentable y energéticamente eficiente.
Cómo las soluciones de Aible ayudan a los clientes a reducir costos: según el análisis comparativo de Aible, los clientes pueden obtener un ahorro de costos de hasta 55 veces al ejecutar modelos RAG en sus soluciones sin servidor basadas en CPU 1 . Esta reducción de costos es un testimonio de la efectividad del enfoque exclusivo de CPU de Aible, que evita la necesidad de infraestructuras basadas en GPU más costosas con servicios compartidos o servidores dedicados.
Cómo colabora Intel con Aible : Intel, incluidos Intel Labs, ha trabajado con Aible para optimizar las cargas de trabajo de IA en los procesadores Xeon. En particular, al optimizar el código de Aible para AVX-512, Aible obtuvo importantes ganancias de rendimiento y mejoró su rendimiento en los procesadores Xeon, destacando el impacto de las optimizaciones estratégicas del software en la eficiencia general.
La combinación de modelos RAG con procesadores Intel Xeon, facilitada por plataformas como Aible, puede permitir aplicaciones como:
- Procesamiento del lenguaje natural (PNL)
- Sistemas de recomendación
- Sistemas de Soporte a la Decisión
- Generación de contenido
La colaboración de Intel con Aible comenzó con el lanzamiento de los procesadores Xeon de cuarta generación. Desde entonces, las dos empresas han optimizado las cargas de trabajo, el código y las bibliotecas de IA para los procesadores Xeon a fin de aumentar el rendimiento de las ofertas de productos de Aible.
Qué sigue : Intel y Aible demostrarán sus soluciones en la Cumbre de Servicios Web de Amazon en Washington, DC, los días 26 y 27 de junio. Las soluciones de Aible se ejecutan en AWS Lambda y están disponibles en AWS Marketplace.
