Un data hub Alation pour cataloguer tous les silos

Le data management, et son sous-ensemble le data catalog, est aujourd’hui confronté la progression des grands volumes de données conservés sur des plateformes disparates. Pour réconcilier ces silos et mieux alimenter les développeurs, data analysts et data scientists, Alation propose d’indexer ces silos et data lakes pour remonter les informations pertinentes aux utilisateurs.

CEO et cofondateur d’Alation, Satyen Sangani entend aider les entreprises à valoriser leurs données. (Crédit S.L.)

En direct de Redwood City. Cofondée en 2012 par un ancien d’Oracle, Satyen Sangani aujourd’hui CEO de la start-up, Alation a levé 50 M$ en début d’année pour développer sa solution de data catalog (un sous-ensemble du data management), dont nous vous avons déjà parlé en février 2018. Le discours de la jeune poussée n’a guère changé si on excepte un accent plus prononcé sur l’accompagnement de la transformation digitale en cours dans les entreprises. Pour survivre à cette évolution, les data lakes  plus ou moins grands  qui se développent dans ces entreprises doivent commencer à prouver leur valeur commerciale. Et pour ce faire, il est nécessaire de passer par un catalogage précis – doublé d’un assistant virtuel pour l’analyse – seul à même d’apporter de la valeur ajoutée au travail des data analysts, data scientists, et autres développeurs. Et pour accompagner les entreprises dans cette déùarche, Alation entend apporter les outils mâtinés d’intelligence artificielle capable de fournir de nouvelles perspectives commerciales.

Les data lakes et autres grands volumes de données en silos (ERP, Salesforce…) – dont beaucoup commencent à douter de l’utilité – peuvent trouver un nouveau souffle avec ce qu’Alation appelle des super-centres qui peuvent fournir un contexte en tant que service via l’apprentissage machine appliqué à la consultation des données. Une sorte de hub des hubs capable de relier les actifs à travers les différents silos et d’apporter des aperçus prédictifs plus pertinents pour mieux accompagner les équipes opérationnelles.

Le data hub Alation travaille avec des sources locales ou dans le cloud pour l’indexation des données. (Crédit Alation)

Indexer et réorganiser ses données avec les metadata

Rappelons que la suite d’outils d’Alation utilise l’apprentissage machine pour analyser et organiser automatiquement dans un référentiel unique les données – à l’aide des metadata – avec les droits accordés aux utilisateurs avec des sources comme Hive, Presto, RedshiftSpark ou Teradata. Un tableau de bord permet aux gestionnaires de données de suivre visuellement l’utilisation des ressources, tandis qu’un composant de conservation – avec listes, classements de popularité, annotations, commentaires et scores – laisse les utilisateurs organiser les données sur différents systèmes de stockage, file, Hadoop et autres.

Pour ses derniers résultats, quatrième trimestre 2018, la start-up a annoncé une croissance de sa clientèle qui vient couronner une croissance annuelle à trois chiffres de ses revenus. Au quatrième trimestre, Alation a ajouté 20 nouveaux clients, dont Farm Credit Services of AmericaFinnair, Liberty Mutual Insurance, Mission Lane, Nebraska Furniture Mart, et Syngenta. Parmi les clients européens on peut citer le réassureur allemand Munich RE. Pour gérer et naviguer sur son data lake, Munich Re a recours aux outils de l’éditeur afin que les analystes et les scientifiques puissent mieux travailler en collaboration avec les données disponibles. Ces outils constituent un lieu central pour la recherche et l’accès aux données. L’idée était de briser les silos organisationnels et d’encourager les équipes à penser différemment avec des sources de données apportant de la valeur à l’échelle de l’organisation. Avec Alation, Munich RE comprend plus finement qui utilise ses données, en plus de ses propres équipes.

Un marché dynamique

Alation n’est pas la seule start-up à se positionner sur ce marché, Waterline Data – que nous avons déjà rencontré 2 fois – DatumCollibra ou Informatica. Estimé à 42 milliards de dollars selon le Gartner, le marché du data management est une industrie relativement nouvelle si on considère que les entreprises stockent aujourd’hui de plus en plus de données sur des systèmes disparates et doivent faire appel à des systèmes autonomes pour indexer ces fichiers. Sa solution est disponible pour test pendant 30 jours afin de réaliser des POC. 

chevron_left
chevron_right