H2O apporte le pilotage automatique au machine learning

L’intelligence artificielle sans pilote de H2O promet d’apporter l’analyse ML aux utilisateurs non-techniques et d’éliminer la corvée de la sélection des modèles pour les experts.

Sri Ambatin, CEO et cofondateur de la start-up H2O, mise sur l’automatisation des traitements IA. (Crédit S.L.)

Si l’intelligence artificielle est aujourd’hui sur les lèvres de tous les services opérationnelles dans les entreprises, son usage demande encore des ressources et des talents particuliers pour sa mise en œuvre. « Une entreprise comme Unilever se pose par exemple toujours la même question en cas de canicule : est-il judicieux d’envoyer toutes les glaces à un endroit précis par avion ? », nous a indiqué Sri Ambatin, CEO et cofondateur de la start-up H2O. Pour répondre à cette demande, la jeune pousse installée à Mountain View propose une plateforme permettant aux utilisateurs familiers avec des produits comme Tableau Software d’extraire et traiter des informations sans avoir besoin d’une expertise dans le déploiement ou l’ajustement de modèles d’apprentissage machine.

Baptisée Driverless AI, la solution entreprise de la société, également disponible en version open source sous l’appellation H2O, Sparkling Water (avec Spark), et H2O4GPU (pour travailler avec des accélérateurs graphiques Nvidia), est présentée par la start-up comme un « système expert pour l’intelligence artificielle ». Il s’agit d’un moyen d’automatiser l’expertise que les spécialistes des données apportent au développement de modèles d’apprentissage machine. La cible est, d’une part, constituée d’utilisateurs non experts, qui peuvent prendre des ensembles de données et exécuter des algorithmes ML accélérés par GPU pour extraire des résultats utiles, sans comprendre les tenants et aboutissants de la science des données. Mais H2O entend aussi séduire les spécialistes des données en automatisant certains processus fastidieux de l’analyse d’un ensemble de données, comme le choix du modèle le mieux adapté à un ensemble de données parmi les différents modèles disponibles.

Des moteurs et bibliothèques ML open source

L’utilisateur, qui configure le traitement à l’aide d’une interface web, n’a généralement besoin que de choisir la variable cible de l’ensemble de données à résoudre. L’application gère la sélection et le déploiement des composants sous-jacents, tels que AutoML, XGBoost ou TensorFlow, pour déterminer ceux qui donneront les résultats les plus précis. Les paramétrages qui nécessitent normalement l’attention d’un spécialiste des données, comme le réglage des hyperparamètres, sont traités automatiquement.

De nombreux cas courants d’utilisation de l’analyse des données sont préprogrammés, et H2O indique qu’il en ajoutera d’autres avec le temps. Les utilisateurs ne peuvent toutefois pas encore ajouter leurs propres scénarios. « La personnalisation des modèles est un point crutial et il est en cours d’élaboration », a précisé le CEO. Paypal, par exemple, utilise la solution pour lutter contre la fraude lors d’une collusion entre un vendeur et un acheteur qui s’entendent pour partager l’argent de la couverture d’une transaction. L’accélération GPU est utilisée ici pour assurer les traitements rapides des algorithmes IA et ML. « Les grandes compagnies vont sombrer si elles n’adoptent pas une stratégie portant sur le pilotage des données », assure le dirigeant. « On peut aussi gérer les créateurs de données pour les exclure ou les rémunérer : compagnies d’assurance, services financiers ou constructeurs automobiles », nous a indiqué le CEO.

Plus de 73,6 Md$ levés

Pas encore disponible en version SaaS, Driverless AI a été lancé il y a un an avec le soutien de plusieurs partenaires et investisseurs comme Nvidia GPU Ventures, Well Fargo, Nexus Venture Partners(un fond d’investissement indien), Paxion Capital, Barclays. H2O a levé 73,6 millions de dollars à ce jour et emploie un peu moins de 100 personnes de personnes. Des morceaux de la pile H2O, comme le moteur de traitement de base et les bibliothèques ML mentionnées ci-dessus, sont disponibles en open source. L’IA autopilotée, bien qu’elle soit construite sur ces éléments, est un produit propriétaire – Driverless AI – avec une tarification au processeur. La société propose des conteneurs Docker qui peuvent être utilisés sur des appareils équipés de GPU, et elle travaille également sur une déclinaison cloud.

chevron_left
chevron_right