Avec Granite 4.0, IBM livre des LLM moins gourmands en ressources

Face à des coûts d’infrastructures IA croissants, IBM propose une approche plus vertueuse avec la gamme de LLM Granite 4.0. Ils adoptent une approche hybride mêlant la techniques Mamba et transformeur pour réduire notamment la consommation de mémoire.

Après la période d’euphorie, les entreprises sont confrontées aux problèmes des coûts de l’IA, en particulier des infrastructures nécessaires à l’entraînement ou à l’inférence des modèles. Pour répondre à cette problématique, IBM a présenté les derniers LLM de la famille Granite, publiés sous licence Apache 2.0. La particularité de cette gamme open source est d’adopter une architecture hybride mêlant deux techniques : les…

chevron_left
chevron_right