La prolifération des outils entrave les efforts d’observabilité

Entre fragmentation des solutions, lacunes de maturité et obstacles culturels, les freins pour améliorer l’observabilité des environnements hybrides distribués des entreprises ne manquent pas. Ce qui n’empêche pas l’adoption d’outils de monitoring par l’IA de progresser.

Selon de récentes études, les responsables IT sont confrontés à une augmentation des coûts liés aux temps d’arrêt, à la fragmentation des outils et à des obstacles culturels. Des plans de consolidation vers des plateformes d’observabilité unifiées sont en cours d’élaboration. Deux rapports soulignent la nécessité de faire évoluer les technologies d’observabilité et les meilleures pratiques, et de passer d’une approche réactive à une démarche proactive majoritairement soutenue par l’IA. Le premier rapport « 2025 Observability Forecast » de New Relic, basé sur une enquête réalisée auprès de 1700 responsables IT et ingénieurs partout dans le monde, met en évidence les enjeux financiers des pannes et le rôle croissant de l’IA dans l’observabilité. Le second intitulé « The Network Observability Maturity Model: How to Plan for NetOps Excellence » de BlueCat et d’Enterprise Management Associates (EMA), basé sur les réponses de 250 acteurs de l’IT, apporte un éclairage supplémentaire et détaille les mesures que peuvent prendre les équipes d’exploitation du réseau pour atteindre l’excellence opérationnelle.

L’étude d’EMA révèle que seules 46 % des personnes interrogées estiment avoir pleinement réussi avec les outils d’observabilité du réseau. « Compte tenu des défis auxquels continuent de faire face les équipes réseau avec leurs outils d’observabilité, elles ont besoin de directives pour réussir. Un modèle de maturité peut aider les entreprises à trouver cette voie », indique ce rapport. À la question de savoir quelles étaient leurs principales critiques à l’égard de leurs solutions d’observabilité, les personnes ont répondu :

• Portée limitée qui ne permet pas de surveiller tout ce que je dois surveiller : 25,1 %

• Trop cher : 22,5 %

• Personnalisation insuffisante : 20,8 %

• Difficile à mettre en œuvre/maintenir : 20,5 %

• Évolutivité insuffisante : 18,8 %

• Mauvaise qualité des données : 16,5 %

• Trop de bruit – fatigue liée aux alertes : 15,7 %

• Manque d’informations : 14,0 %

• Trop difficile à utiliser : 12,5 %

• Mauvaise assistance client : 8,5 %

• Autre : 0,6 %

Jusqu’à 2 M$ par heure perdus pour une grosse panne

Selon le rapport de New Relic, une panne à fort impact coûte en moyenne 2 millions de dollars par heure. Pour les entreprises disposant d’une observabilité complète, ce chiffre tombe à 1 million de dollars, mais il double pour celles qui n’ont pas atteint ce niveau. Malgré les avantages, près des trois quarts (73 %) des entreprises interrogées par New Relic ne disposent pas d’une couverture totale. L’étude a également révélé que 75 % des entreprises attestent d’un retour sur investissement positif grâce à leurs investissements dans l’observabilité, près d’une sur cinq (18 %) ayant obtenu un ROI trois à dix fois supérieur. « Mais, même si les entreprises investissent dans l’observabilité, beaucoup sont encore loin d’atteindre une visibilité complète. 41 % des dirigeants ont déclaré qu’ils continuaient à être informés des interruptions de service par des moyens inefficaces, à savoir les plaintes des clients, les tickets d’incident ou les vérifications manuelles », indique le rapport de New Relic.

Les deux enquêtes soulignent que la prolifération des outils est un frein au progrès. Le rapport de New Relic montre que les entreprises utilisent encore en moyenne 4,4 outils d’observabilité, malgré une baisse de 27 % au cours des deux dernières années. Plus de la moitié (52 %) des personnes interrogées prévoient de consolider leurs outils sur des plateformes d’observabilité unifiées. Dans son rapport, EMA fait état de conclusions similaires, 87 % des équipes chargées des opérations réseau s’appuyant sur plusieurs outils, souvent sans intégration significative. Ce type de dépannage « pivotant », qui consiste à passer d’un tableau de bord à l’autre pour reconstituer les incidents, reste très répandu. Selon EMA, les entreprises qui réussissent sont celles qui investissent dans l’intégration et l’automatisation afin de rationaliser leurs flux. Le modèle de maturité d’EMA définit cinq niveaux d’observabilité : Ad Hoc/Reactive (ad hoc/réactif), Fragmented/Opportunistic (fragmenté/opportuniste), Integrated/Centrally Managed (intégré/géré de manière centralisée), Intelligent/Automated (intelligent/automatisé), et Optimized/AI-Driven (optimisé/basé sur l’IA). La plupart des entreprises se situent aujourd’hui à des stades intermédiaires, moins de la moitié d’entre elles déclarant avoir pleinement réussi avec leurs outils d’observabilité. Les plus avancées commencent tout juste à atteindre le stade de l’observabilité pilotée par l’IA, où l’automatisation du dépannage de bout en bout et l’optimisation prédictive entrent en jeu.

L’observabilité majoritairement teintée d’IA

New Relic rapporte que l’adoption de la surveillance par l’IA est passée de 42 % en 2024 à 54 % en 2025. C’est la première fois qu’une majorité d’entreprises déploient l’IA pour l’observabilité. Les dirigeants ont cité, comme principaux cas d’usage, le dépannage assisté par l’IA, l’analyse automatisée des causes profondes et l’analyse prédictive. L’étude d’EMA va dans le même sens, les entreprises avancées utilisant l’IA pour la correction automatisée, les playbooks adaptatifs et les recommandations basées sur l’IA pour une gestion proactive des capacités. Celles qui s’appuient encore sur des seuils statiques et des scripts manuels ont du mal à suivre le rythme. EMA a constaté que le succès va de pair avec la mise en place de tableaux de bord personnalisables et spécifiques à chaque rôle, avec des rapports couvrant l’ensemble des équipes. New Relic a obtenu des résultats similaires, soulignant un changement culturel où « la fiabilité devient la responsabilité de tous ». Selon ces deux rapports, la maturité en matière d’observabilité nécessite plus que des plateformes unifiées et de l’IA. Elle a aussi besoin d’une harmonisation entre les DevOps, les NetOps, les SecOps et les parties prenantes. Une observabilité unifiée et basée sur l’IA peut réduire les temps d’arrêt, améliorer l’efficacité et créer de la résilience.

chevron_left
chevron_right