Alors que la demande de GPU continue d’augmenter avec l’IA et que l’approvisionnement reste tendu, AWS annonce une diminution des prix des instances P4 et P5 intégrant des accélérateurs Nvidia. Un moyen de se démarquer de la concurrence.
Face à la concurrence de plus en plus forte et une demande importante sur les GPU Nvidia pour les applications IA, AWS sort la carte de baisse des prix sur ses instances P4 (P4d et P4de) et P5 (P5 et P5en) basées sur les accélérateurs Nvidia. Ce rabais peut aller jusqu’à 45% à la fois sur les options On-Demand et Savings Plan (avec un engagement sur 1 an ou 3 ans). Le Saving Plan offre deux options aux entreprises appelées respectivement Instance Savings Plan (pour des instances au sein d’une seule région) et Compute Savings Plan (autorisant des transferts d’instances dans différentes régions ou de changer de type d’instances).
La réduction des prix est entrée en vigueur le 1er juin pour les achats On-Demand et le 4 juin pour les achats Savings Plan. « Les baisses de tarif sur les instances GPU P4d, P4de, P5 et P5en laissent penser qu’AWS cherche à concurrencer ses rivaux sur les prix. Ces instances, alimentées par des GPU Nvidia de classe A100 et H100, sont au cœur des charges de travail d’IA générative et déjà en demande », a déclaré Kaustubh K, directeur de la pratique chez Everest Group. « Ces réductions peuvent rendre les coûts plus abordables pour les acheteurs d’IA et positionner AWS de manière plus agressive par rapport à Microsoft Azure et Google Cloud sur le marché du calcul à haute performance. Elles peuvent favoriser la mise à échelle, accroître la fidélité à long terme des équipes d’IA des entreprises », a ajouté Kaustubh K.
Remises sur la plupart des plans
Selon AWS, la réduction de prix est basée sur le type d’instance et le plan d’achat choisi par les clients. Pour les instances P4d, les achats On-Demand bénéficieront d’une réduction de 33 %. Lorsque la même instance est achetée via le Savings Plan, les entreprises constateront une baisse des coûts de 31 % pour les deux options du Savings Plan pour une période d’un an. Pour des périodes de trois ans, les coûts de P4d sur l’Instance Savings Plan diminueront de 25 %. Le plan Compute Savings n’est pas disponible pour la même période. Les instances P4de bénéficient de la même réduction que les instances P4d pour tous les plans. Pour les instances P5 et P5en, AWS a réduit les prix de 44 % et 25 %, respectivement, dans le cadre du plan On-Demand. Dans le cadre de l’Instance Savings Plan, les deux instances ne bénéficient d’aucune réduction, du moins pour les packs d’un an de l’Instance Savings Plan. Pour trois périodes de trois ans de l’Instance Savings Plan, les prix des P5 et P5en ont été réduits de 45 % et 26 % respectivement.
Un tableau synthétique des baisses tarifaires des différentes instances EC2 P4 et P5. (Crédit Photo: AWS)
Dans le cadre du Compute Savings Plan, les entreprises bénéficieront d’une réduction de 44 % et de 25 % du prix du P5 et du P5en, respectivement, pour les packs d’un an. « Le tarif du pack Compute Savings de trois ans pour P5 a été réduit de 25 % », a indiqué AWS, en précisant que P5en ne bénéficiait d’aucune réduction sur le même pack. De plus, le fournisseur de services cloud a déclaré qu’il augmentait l’accessibilité aux prix réduits en rendant la capacité On-Demand à l’échelle disponible pour P4d, P4de, P5, et P5en à plus de ses régions clouds. Alors que l’instance P4 est disponible dans les régions Asie-Pacifique (Séoul), Asie-Pacifique (Sydney), Canada (Central) et Europe (Londres), l’instance P4de est disponible dans la région Est des États-Unis (Virginie du Nord). AWS étend la disponibilité des instances P5 et P5en aux régions Asie-Pacifique (Mumbai), Asie-Pacifique (Tokyo), Asie-Pacifique (Jakarta) et Amérique du Sud (São Paulo). AWS propose d’autres instances EC2 pour l’hyper-computing sous la forme de séries P2, P3, P6, G et G5g.