About Me

header ads

NVIDIA anuncia Mellanox InfiniBand para supercomputación de IA a exaescala

Imagen: NVIDIA – 2020

NVIDIA presentó la próxima generación de NVIDIA ® Mellanox ® 400G InfiniBand, dando a los desarrolladores de IA e investigadores científicos el rendimiento más rápido de redes disponibles para asumir la mayoría de los problemas que enfrenta el mundo.
 
A medida que los requisitos informáticos siguen creciendo exponencialmente en áreas como el descubrimiento de fármacos, la investigación climática y la genómica, NVIDIA Mellanox 400G InfiniBand está acelerando este trabajo a través de un salto espectacular en el rendimiento ofrecido en la única plataforma informática en red totalmente descargable del mundo.
 
La séptima generación de Mellanox InfiniBand proporciona una latencia ultrabaja y duplica el rendimiento de datos con NDR 400Gb / sy agrega nuevos motores de computación en red NVIDIA para proporcionar una aceleración adicional.
 
Los principales fabricantes de infraestructura del mundo, incluidos Atos, Dell Technologies, Fujitsu, GIGABYTE, Inspur, Lenovo y Supermicro, planean integrar NVIDIA Mellanox 400G InfiniBand en sus soluciones empresariales y ofertas de HPC. Estos compromisos se complementan con un amplio soporte de socios líderes en infraestructura de almacenamiento, incluidos DDN e IBM Storage, entre otros.
 
“El trabajo más importante de nuestros clientes se basa en la inteligencia artificial y en aplicaciones cada vez más complejas que exigen redes más rápidas, inteligentes y escalables”, dijo Gilad Shainer, vicepresidente senior de redes de NVIDIA. "El rendimiento masivo y los motores de aceleración inteligente de NVIDIA Mellanox 400G InfiniBand permiten que las infraestructuras de nube de hiperescala, inteligencia artificial y HPC logren un rendimiento inigualable con menos costos y complejidad".
 
El anuncio de hoy se basa en el liderazgo de Mellanox InfiniBand como la solución más robusta de la industria para supercomputación de IA. NVIDIA Mellanox NDR 400G InfiniBand ofrece 3 veces la densidad de puertos del conmutador y aumenta la potencia de aceleración de la IA en 32 veces. Además, aumenta 5 veces el rendimiento bidireccional agregado del sistema de conmutación, a 1,64 petabits por segundo, lo que permite a los usuarios ejecutar cargas de trabajo más grandes con menos restricciones.
 
Expansión del ecosistema para expandir las cargas de trabajo
 
El interés inicial en la próxima generación de Mellanox InfiniBand proviene de algunas de las organizaciones de investigación científica más grandes del mundo.
 
“La asociación de Microsoft Azure con NVIDIA Networking se deriva de nuestra pasión compartida por ayudar a científicos e investigadores a impulsar la innovación y la creatividad a través de HPC e IA escalables. En HPC, las VM de Azure HBv2 son las primeras en llevar HDR InfiniBand a la nube y lograr una escala y un rendimiento de supercomputación para las aplicaciones de los clientes de MPI con una escala demostrada para eclipsar los 80.000 núcleos para MPI HPC ”, dijo Nidhi Chappell, jefe de producto, Azure HPC e IA. en Microsoft Corp. “En IA, para satisfacer las necesidades de alta ambición de la innovación de IA, las VM Azure NDv4 también aprovechan HDR InfiniBand con 200 Gb / s por GPU, un total masivo de 1.6Tb / s de ancho de banda de interconexión por VM, y escala a miles de GPU bajo el mismo tejido InfiniBand de baja latencia para llevar la supercomputación de IA a las masas.
 
“Las interconexiones de alto rendimiento son tecnologías fundamentales necesarias para exaescala y más allá. El Laboratorio Nacional de Los Alamos sigue estando a la vanguardia de las tecnologías de redes HPC ”, dijo Steve Poole, arquitecto jefe de plataformas de próxima generación en el Laboratorio Nacional de Los Alamos. “El laboratorio continuará su relación trabajando con NVIDIA en la evaluación y análisis de su última tecnología de 400 Gb / s destinada a resolver los diversos requisitos de carga de trabajo en Los Alamos”.
 
“En medio de la nueva era de la computación a exaescala, los investigadores y científicos están superando los límites de la aplicación de modelos matemáticos a la química cuántica, la dinámica molecular y la seguridad civil”, dijo el profesor Thomas Lippert, director del Centro de Supercomputación de Jülich. "Estamos comprometidos a aprovechar la próxima generación de Mellanox InfiniBand para promover nuestro historial de construcción de supercomputadoras líderes en Europa de próxima generación".
 
“InfiniBand continúa manteniendo su ritmo de innovación y rendimiento, subrayando la diferenciación que lo ha convertido en el servidor de alto rendimiento y la interconexión de almacenamiento más comúnmente utilizado para sistemas HPC e AI”, dijo Addison Snell, director ejecutivo de Intersect360 Research. "A medida que las aplicaciones continúan exigiendo un mayor rendimiento de la red, la necesidad de soluciones de alto rendimiento, como NVIDIA Mellanox 400G InfiniBand, tiene el potencial de seguir expandiéndose a nuevos casos de uso y mercados".
 
Especificaciones del producto y disponibilidad
 
Las operaciones de descarga son cruciales para las cargas de trabajo de IA. La tecnología NVIDIA Mellanox SHARP de tercera generación permite que las operaciones de entrenamiento de aprendizaje profundo se descarguen y aceleren mediante la red InfiniBand, lo que da como resultado una potencia de aceleración de IA 32 veces mayor. Cuando se combina con la pila de software NVIDIA Magnum IO ™, proporciona computación científica acelerada lista para usar.
 
Los conmutadores Edge, basados ​​en la arquitectura Mellanox InfiniBand, tienen un rendimiento bidireccional agregado de 51,2 TB / s, con una capacidad histórica de más de 66,5 mil millones de paquetes por segundo. Los conmutadores modulares, basados ​​en Mellanox InfiniBand, llevarán hasta un rendimiento bidireccional agregado de 1,64 petabits por segundo, 5 veces más alto que la última generación.
 
La arquitectura Mellanox InfiniBand se basa en los estándares de la industria para garantizar la compatibilidad con versiones anteriores y futuras y proteger las inversiones del centro de datos. Se espera que las soluciones basadas en la arquitectura muestren en el segundo trimestre de 2021.

Publicar un comentario

0 Comentarios