MongoDB s’oriente vers l’IA avec un portefeuille de solutions dédiées

À l’occasion de sa conférence développeurs MongoDB.local à New York cette semaine, l’entreprise a fait part de plusieurs nouveautés. En plus d’intégrer les modèles Vertex AI de Google Cloud, MongoDB a annoncé l’ajout de fonctions visant à faire d’Atlas une plateforme de données complète pour les développeurs.

Après avoir tenté d’élargir sa base d’utilisateurs aux professionnels des bases de données traditionnelles l’année dernière, MongoDB passe à la vitesse supérieure en ajoutant des fonctions pour transformer son SGBD NoSQL Atlas en tant que service (DBaaS) en une plateforme de données plus complète pour les développeurs. Et cela passe notamment par des capacités qui prennent en charge la construction d’applications d’IA générative. En plus d’introduire la recherche vectorielle pour Atlas et d’intégrer les modèles Vertex AI de Google Cloud, la société a annoncé une variété de capacités supplémentaires pour DBaaS lors de sa conférence MongoDB.local à New York jeudi, y compris des capacités de recherche, de flux de données et d’interrogation pour Atlas.

« Tout ce que MongoDB a annoncé peut être considéré comme un mouvement visant à faire d’Atlas une plateforme de données plus complète pour les développeurs », a déclaré Doug Henschen, analyste principal chez Constellation Research. « Plus MongoDB peut fournir aux développeurs tous les outils dont ils ont besoin, plus la plateforme devient solide pour ces développeurs et les entreprises pour lesquelles ils travaillent ». Le point de vue de M. Henschen semble raisonnable, étant donné que l’entreprise est en concurrence avec des fournisseurs de plateformes de données cloud tels que Snowflake, qui propose un cadre d’application natif, et Databricks, qui a récemment lancé Lakehouse Apps. 

La recherche vectorielle aide à créer des applications d’IA générative

Afin d’aider les entreprises à créer des applications basées sur l’IA générative à partir de données stockées dans MongoDB, l’entreprise a introduit une capacité de recherche vectorielle dans Atlas, appelée Vector Search. Selon l’éditeur, cela aidera à la prise en charge d’une autre gamme de charges de travail, y compris la recherche sémantique avec du texte, la recherche d’images et les recommandations de produits hautement personnalisées. Les requêtes s’appuient sur des vecteurs – des représentations mathématiques multidimensionnelles de caractéristiques ou d’attributs de données brutes pouvant inclure du texte, des images, de l’audio ou de la vidéo, a déclaré Matt Aslett, directeur de recherche chez Ventana Research.

« La recherche vectorielle utilise les vecteurs pour effectuer des recherches de similarité en permettant l’identification et la récupération rapides de données similaires ou connexes », indique Matt Aslett, ajoutant que la recherche vectorielle peut également être utilisée pour compléter les grands modèles de langage (LLM) afin de réduire les préoccupations concernant la précision et la confiance grâce à l’incorporation de contenu et de données d’entreprise approuvés. Avec la recherche vectorielle de MongoDB Atlas, les entreprises peuvent également augmenter les capacités des modèles pré-entraînés tels que GPT-4 avec leurs propres données grâce à l’utilisation de cadres open source tels que LangChain et LlamaIndex, a déclaré l’éditeur. Ces frameworks peuvent être utilisés pour accéder aux LLM des partenaires de MongoDB et des fournisseurs de modèles, tels que AWS, Databricks, Google Cloud, Microsoft Azure, MindsDB, Anthropic, Hugging Face et OpenAI, afin de générer des embeddings vectoriels et de construire des applications basées sur l’IA sur Atlas, a ajouté la société.

MongoDB se rapproche de Google Cloud et de sa plateforme Vertex AI

Le partenariat de MongoDB avec Google Cloud pour intégrer les capacités de Vertex AI vise à accélérer le développement d’applications basées sur l’IA générative. Selon l’éditeur, Vertex AI fournira l’API d’incorporation de texte nécessaire pour générer des incorporations à partir des données d’entreprise stockées dans MongoDB Atlas. Ces embeddings peuvent ensuite être combinés avec les modèles de texte PaLM pour créer des fonctionnalités avancées telles que la recherche sémantique, la classification, la détection de valeurs aberrantes, les chatbots alimentés par l’IA et le résumé de texte. Via ce partenariat, les entreprises bénéficieront d’une assistance pratique de la part des équipes de MongoDB et de Google Cloud pour la conception de schémas de données et d’indexation, la structuration des requêtes et l’affinement des modèles d’IA.

Les bases de données de Dremio, DataStax et Kinetica ajoutent également des capacités d’IA générative. La décision de MongoDB d’ajouter la recherche vectorielle à Atlas n’est pas unique, mais elle renforcera la compétitivité de l’entreprise, a déclaré M. Aslett. « Il existe une liste croissante de fournisseurs de bases de données vectorielles spécialisées, tandis que de nombreux fournisseurs de bases de données existantes s’efforcent d’ajouter un support pour apporter la recherche vectorielle aux données déjà stockées dans leurs plateformes de données », précise Matt Aslett.

Gestion des flux de données en temps réel dans une interface unique

Afin d’aider les entreprises à gérer les flux de données en temps réel provenant de sources multiples dans une interface unique, MongoDB a ajouté une interface de traitement des flux à Atlas. Baptisée Stream Processing, cette interface, qui peut traiter tout type de données et dispose d’un modèle de données flexible, propose aux entreprises d’analyser les données en temps réel et d’ajuster le comportement de l’application pour répondre aux besoins du client final, a déclaré la société. Stream Processing évite aux développeurs de devoir utiliser plusieurs langages de programmation spécialisés, bibliothèques, interfaces de programmation d’applications (API) et pilotes, tout en évitant la complexité liée à l’utilisation de ces multiples outils, selon MongoDB.

L’interface, selon Matt Aslett, aide les développeurs à travailler avec des données en continu et des données historiques en utilisant le modèle de document. « Le traitement des données au fur et à mesure qu’elles sont ingérées permet d’interroger les données en continu au fur et à mesure que d’autres données sont ajoutées, fournissant ainsi une vue en temps réel constamment mise à jour et déclenchée par l’ingestion de nouvelles données », poursuit M. Aslett. Selon un rapport de Ventana Research, les architectures d’information standard de plus de sept entreprises sur dix incluront le traitement des données et des événements en continu d’ici à 2025, afin de pouvoir offrir de meilleures expériences aux clients.

Selon Sanjeev Mohan, analyste principal chez SanjMo, Stream Processing peut également être utilisé par les développeurs pour exécuter des fonctions telles que l’agrégation, le filtrage et la détection d’anomalies sur les données contenues dans les sujets Kafka, Amazon Kinesis ou même la capture de données de changement MongoDB. Le modèle de données flexible de Stream Processing peut également être modifié au fil du temps pour répondre aux besoins, a déclaré l’éditeur. L’ajout de cette interface à Atlas peut être considéré comme un moyen de rattraper les fournisseurs de data cloud concurrents tels que Snowflake et Databricks, qui ont déjà introduit des fonctions de traitement des données en temps réel, a fait remarquer Doug Henschen de Constellation.

Recherche vectorielle et gestion des données de séries temporelles au menu

Afin d’aider les entreprises à maintenir les performances des bases de données et des recherches sur Atlas, la société a introduit une fonctionnalité, appelée Search Nodes, qui isole les charges de travail de recherche des charges de travail de base de données. Destinée aux clients qui ont déjà fait évoluer leurs charges de travail de recherche sur MongoDB, Search Nodes fournit des ressources dédiées et optimise l’utilisation des ressources pour soutenir les performances de ces charges de travail spécifiques, y compris la recherche vectorielle, a déclaré MongoDB « Les entreprises peuvent constater que le fait de dédier des nœuds dans un cluster, spécifiquement à la recherche, peut soutenir l’efficacité opérationnelle en évitant la dégradation des performances sur d’autres charges de travail », a déclaré Matt Aslett, ajoutant qu’il s’agit d’une capacité adoptée par de nombreux fournisseurs de bases de données distribuées.

Les mises à jour d’Atlas de MongoDB comprennent également une fonction d’édition de données de séries temporelles qui, selon l’entreprise, n’est généralement pas autorisée dans la plupart des bases de données de séries temporelles. Les fonctions Time Series Collections de la société sont faites pour modifier les données de séries temporelles, ce qui se traduira par une meilleure efficacité du stockage, des résultats précis et de meilleures performances en matière de requêtes, a déclaré la société. La fonction de modification des données de séries temporelles aidera la plupart des entreprises, selon Sanjeev Mohan. D’autres mises à jour incluent la possibilité de hiérarchiser et d’interroger les bases de données sur Microsoft Azure en utilisant les fonctionnalités Online Archive et Data Federation, a déclaré la société, ajoutant qu’Atlas prenait déjà en charge la hiérarchisation et l’interrogation sur AWS.

Atlas pour les services financiers et d’autres secteurs d’activité

Dans le cadre des mises à jour annoncées lors de sa conférence MongoDB.local à New York, la société a déclaré qu’elle lancerait également un programme de base de données Atlas spécifique à l’industrie pour les services financiers, suivi par d’autres secteurs industriels tels que le retail, la santé, l’assurance, l’industrie manufacturière et l’automobile. Dans le cadre de ces programmes sectoriels, l’entreprise proposera des revues de conception architecturale dirigées par des experts, des partenariats technologiques par le biais d’ateliers et d’autres instruments afin que les entreprises puissent élaborer des solutions spécifiques à leur secteur d’activité.

L’éditeur proposera également des cours et du matériel d’apprentissage sur mesure de la MongoDB University afin de permettre aux développeurs de mener à bien leurs projets d’entreprise. Bien que la société n’ait pas immédiatement fourni d’informations sur la disponibilité et le prix de ces fonctions, elle a déclaré qu’elle mettait son outil Relational Migrator à la disposition de tous. Cet outil est conçu pour aider les entreprises à migrer leurs anciennes bases de données vers des bases de données modernes basées sur des documents.

chevron_left
chevron_right