Des instances Nvidia GB200 NVL72 se déploient sur le cloud de Coreweave

Présent en Amérique du Nord et au Royaume-Uni, Coreweave est l’un des premiers fournisseurs de cloud à mettre en ligne à grande échelle les systèmes GB200 NVL72 de Nvidia pour assurer des entrainements IA intensifs.

Fondée en 2017 dans le New Jersey par trois négociants en matières premières, Michael Intrator, Brian Venturo et Brannin McBee, ainsi que Peter Salanki, Coreweave, initialement conne sous le nom d’Atlantic Crypto, opérait à l’origine comme une société de cryptomonnaie minant de l’Ethereum à l’aide de GPU. Aujourd’hui, cette société à la réputation peu flatteuse se présente comme un fournisseur de services cloud et annonce proposait les systèmes GB200 NVL72 de Nvidia, également connus sous le nom de « Grace Blackwell », aux clients souhaitant effectuer des entrainements IA intensifs. Avec ses 32 datacenters (avec Digital Realty) aux Etats-Unis et en Europe (UK), le fournisseur pousse donc des instances GB200 NVL72, notamment avec la plateforme Kubernetes de Coreweave, Slurm sur Kubernetes (SUNK), Mission Control et d’autres services. Rappelons que le cluster GB200 NVL72 est un système massif et performant comprenant 36 processeurs Grace et 72 GPU Blackwell reliés entre eux via NVLink-C2C ( 900 Go/s). Il est utilisé pour la programmation et l’entrainement avancé de LLM. Les instances GB200 NVL72 peuvent évoluer jusqu’à 110 000 GPU Blackwell avec le réseau Quantum-2 InfiniBand de Nvidia.

IBM utilise déjà les services Coreweave pour entrainer ses modèles d’IA open source Granite utilisés pour watsonx Orchestrate afin de créer et de déployer des agents IA, tandis que Mistral AI prévoit de créer la prochaine génération de modèles d’IA open source sur Blackwell. De son coté, Cohere a déclaré avoir constaté des performances trois fois supérieures à celles de la génération précédente de GPU (Hopper) pour l’entraînement des LLM, et Mistral a déclaré avoir constaté, sans aucune optimisation supplémentaire, une amélioration de 200 % des performances pour l’entraînement de modèles denses. Les instances Grace Blackwell sont désormais disponibles pour tous les clients CoreWeave.

chevron_left
chevron_right