Pour surfer sur RGPD, Hortonworks glisse du big data au data management

A l’occasion de son événement européen Dataworks Summit, à Berlin cette année, Hortonworks a insisté sur la dimension data management de sa plateforme, avec notamment le concours de son module Data Steward Studio (DSS).

« Nous offrons des services sur différents clusters, et les applications peuvent avoir un accès simultané aux mêmes données. C’est la beauté de la chose », assure Nadeem Asghar, vice-président en charge de l’ingénierie chez Hortonworks.

A quelques semaines de l’entrée en application du RGPD (Règlement général sur la protection des données), Hortonworks a profité de son évènement européen annuel Dataworks Summit (du 16 au 19 avril à Berlin) pour mettre en avant ses solutions destinées à accompagner la réglementation de l’UE qui s’imposera le 25 mai prochain à toutes les entreprises européennes ou traitant les données de citoyens européens. Avec le module Data Steward Studio (DSS) qui vient s’ajouter à sa plateforme Global Data Management, l’éditeur propose aux entreprises des capacités supplémentaires pour gérer la sécurité et la gouvernance de très grandes quantités de données conservées dans le cloud ou sur site. « De multiple clusters avec des sources différentes augmentent le nombre de types de données disponibles », nous a indiqué John Kreisa, vice-président en charge du marketing chez Hortonworks. L’heure n’est plus au seul traitement big data, mais bien au data management, à la nécessité de maitriser la traçabilité de ses données avec une vue complète de son périmètre.

Avec le module DSS, Hortonworks compte aider les entreprises à classer plus rapidement leurs données avec des marqueurs pour identifier les différents types de données. L’idée est de fournir une meilleure compréhension de l’information qui se trouve dans ce qu’on appelle les data lakes, un terme qui désigne de grandes quantités de données rassemblées, qui peuvent regrouper des données personnelles, des données de confiance, des données obsolètes… Hortonworks se concentre plus particulièrement sur l’accompagnement des spécialistes des données, des commerciaux et des analystes. Pour ces groupes, la source et le contrôle des données deviennent de plus en plus importants, car ils auront bientôt affaire aux organismes en charge de contrôler la bonne application du RDPD. En France, c’est la CNIL qui renforce ses ressources en personnel pour suivre toutes ces questions réglementaires.

Le module DSS vient compléter la plateforme Global Data Management.

Se mettre à l’heure du RGPD

Cela permet d’organiser et de configurer les données globales en fonction de différents critères. Pensez, par exemple, aux classifications, aux objectifs et à la protection des données de l’entreprise. La découverte, le catalogage et la recherche des données personnelles ou sensibles s’y ajoutent. Il est ainsi plus facile pour les commerciaux, les juristes ou les data scientists d’effectuer des recherches. « La régulation est une bonne chose, il faut regarder RGPD comme une opportunité de business », a précisé Abhas Ricy, directeur de la stratégie et de l’innovation chez Hortonworks. L’éditeur s’efforce de simplifier la gestion et l’administration des données en les regroupant. « Nous offrons des services sur différents clusters, et les applications peuvent avoir un accès simultané aux mêmes données. C’est la beauté de la chose », a complété Nadeem Asghar, vice-président en charge de l’ingénierie chez Hortonworks. Des caractéristiques telles que l’origine des données, la valeur, le niveau de protection, la sensibilité et l’utilisation pratique sont prises en compte. Afin de donner un aperçu de la sécurité des données et des metadata, la plateforme DSS indique le statut de protection des données, les règles d’anonymat et les directives de sécurité qui ont été préalablement définies pour respecter la législation en vigueur.

Pour construire cette plateforme DSS, Hortonworks a bien sûr utilisé comme à son habitude des technologies open source, avec ici Apache Atlas et Apache Ranger. Ces derniers étendent le périmètre de la Modern Data Architecture de l’éditeur dans différents environnements. DSS, qui est le deuxième service annoncé dans le cadre de l’offre DataPlane, sera disponible au cours de ce deuxième trimestre. Des tests sont déjà possibles avec une version bêta du produit qui arrive toutefois un peu tard sur le marché européen puisque RGPD entrera en vigueur le 25 mai prochain et que des concurrents comme Waterline Data ou Veritas ont déjà des solutions RGPD. On attend toutefois toujours la transcription du règlement européen dans le droit français, puis ensuite la publication des décrets d’application.

chevron_left
chevron_right