Le Financial Times réduit ses coûts de serveurs de 80% grâce aux conteneurs

Mi-2015, l’équipe chargée de la plate-forme de contenus du Financial Times a adopté Docker comme gestionnaire de conteneurs et en 2017, elle s’est tournée vers Kubernetes pour l’orchestration. Mais ce choix n’a pas été facile.

Sarah Wells, directeur technique, responsable des opérations et de la fiabilité au Financial Times, est intervenue sur la conférence KubeCon, qui se tenait à Copenhague du 2 au 4 mai 2018. (Crédit : Jax Finance)

Grâce à l’adoption d’une infrastructure de conteneurs beaucoup plus stable, l’équipe responsable de la plate-forme de contenus du quotidien économique et financier britannique Financial Times (FT) a réduit les coûts de ses serveurs AWS de 80 %. Mais les défis n’ont pas manqué. Mi-2015, le FT a été l’un des premiers à adopter Docker comme plate-forme de conteneurs. « C’était à la pointe de la technologie à l’époque, même si nous avions beaucoup à faire pour assembler les composants ensemble », a relaté Sarah Wells, directrice technique des opérations et de la fiabilité chez FT lors du KubeCon qui se tenait Copenhague le week-end dernier (2 au 4 mai). On ne peut mettre en oeuvre qu’un nombre limité de modifications à la fois, a-t-elle expliqué, suggérant que les organisations doivent considérer qu’elles ne disposent que d’un nombre fini de « jetons d’innovation » qu’il faut utiliser de façon réfléchie. Par exemple, l’équipe du FT a dû bâtir sa propre plateforme d’orchestration de containers en raison du manque d’options disponibles sur étagères. « Cela signifiait irrémédiablement que nous dépensions certains de ces jetons d’innovation », a expliqué Sarah Wells.

Puis, en 2017, le Financial Times a commencé à utiliser la plate-forme d’orchestration de conteneurs Kubernetes pour faciliter la gestion de sa volumineuse pile technologique conteneurisée existante et de ses 150 microservices. L’adoption de cette architecture leur a permis de passer de 12 mises à jour par an à 2 200. Le journal a pu faire ensuite d’autres économies. « La migration de la totalité de la pile sur huit grandes machines virtuelles seulement a permis de réduire les coûts de 80 % », a indiqué  Sarah Wells. Cependant, « la migration [vers Kubernetes] n’a pas été une petite affaire », a-t-elle ajouté. Mais, parce que les avantages l’emportaient sur les risques, l’équipe a décidé de se lancer. La plateforme interne posait un certain nombre de défis en terme de soutenabilité et de documentation. L’équipe du FT qui l’avait développée « ne pouvait compter que sur elle-même ». Ensuite, « le travail sur les conteneurs a été réalisé par des salariés qui ont pratiquement tous quitté l’entreprise en 2016. Vous supportez des choses que vous ne comprenez pas et vous ne pouvez demander d’aide à personne », a pointé Sarah Wells. « Généralement, la technologie est d’abord une affaire d’experts et de développement sur mesure. Mais ensuite, les gens transforment ça en produit. L’électricité est un excellent exemple. Nous ne construisons pas de centrales électriques, nous nous contentons de brancher nos appareils à une prise de courant. C’est la même chose en informatique. Nous sommes passés du datacenter au cloud privé, et du cloud privé aux fournisseurs de cloud », a-t-elle ajouté.

Un standard émergent et une énorme communauté

Avant de choisir une plateforme d’orchestration de conteneurs, l’équipe s’est intéressée à deux indicateurs : le temps passé à maintenir le cluster en bonne santé et le nombre de commentaires sarcastiques sur Slack. « Une technologie ennuyeuse n’est pas forcément mauvaise. Elle vous permet de vous concentrer sur ce qui vous différencie des autres. Développer des technologies innovantes, c’est bien, mais fin 2016, les outils arrivaient à maturité et nous pensions en tirer profit. Pourquoi assurer soi-même la maintenance quand il y a un produit disponible pour cela, sauf si c’est un élément critique de votre activité ? Nous ne sommes pas une entreprise d’orchestration de clusters, nous sommes un média d’information », a-t-elle ajouté. L’équipe a opté pour Kubernetes pour deux raisons. D’abord, ils l’ont préféré aux autres plates-formes qu’ils avaient évaluées et, ensuite, il semblait que Kubernetes était un standard émergent vers lequel convergeait l’industrie (et elle a continué de le faire). De plus, la technologie Kubernetes étant open source, elle regroupait autour d’elle une énorme communauté avec de nombreuses possibilités de partage de documentation et d’échange d’expériences.

Les défis de la migration

La principale difficulté liée à l’adoption de Kubernetes venait du fait que le Financial Times devait passer de sa plate-forme interne vers l’orchestrateur de conteneurs open source en faisant tourner les deux infrastructures en parallèle. « C’était un défi majeur. C’est un peu comme essayer de changer de cheval en traversant une rivière tumultueuse », a déclaré Sarah Wells. « Quand nous avons entamé la migration, 150 services étaient exécutés en live, et beaucoup d’autres tâches tournaient en même temps. Nous avons dû mener cette migration sans perturber aucun service », a-t-elle expliqué. Cette contrainte a occasionné des coûts importants, financiers du fait d’un usage temporairement élevé d’AWS et de son outil de logs, mais aussi en terme de temps passé, plus important que prévu.

« La synchronisation des deux piles était compliquée, de même que le déploiement simultané des changements. Il fallait tout tester deux fois sur les deux plates-formes », a encore déclaré Sarah Wells. Néanmoins, la migration s’est assez bien déroulée et la plateforme est beaucoup plus stable. « Nous avons eu trois incidents de production depuis, juste la panne de quelques nœuds, mais personne n’a été affecté. Nous n’avons eu que deux appels en dehors des heures d’ouverture, et dans les deux cas, Kubernetes a récupéré le système avant même que les développeurs n’aient pu démarrer leur ordinateur portable », a-t-elle encore déclaré. « Notre système est désormais beaucoup plus stable, il coûte moins cher. De plus, notre équipe travaille beaucoup mieux et fait autre chose que simplement supporter la plate-forme », a-t-elle ajouté.

chevron_left
chevron_right