Après l’échec de ses deux bases de données PostgreSQL existantes, Microsoft espère cette fois que sa base Azure HorizonDB plus axée sur l’IA attirera des clients.
Présentée en avant-première, cette troisième base de données managée compatible PostgreSQL pour le cloud de Microsoft, Azure HorizonDB, vise les charges de travail modernes et à la modernisation des applications héritées. Microsoft propose déjà deux bases de données compatibles PostgreSQL, l’interface de base de données très appréciée des développeurs d’applications d’IA, que sont Azure Cosmos DB pour PostgreSQL et Azure Database pour PostgreSQL. « Azure HorizonDB se distingue des deux offres existantes en ce qu’il s’agit d’une architecture informatique à stockage partagé et évolutive, spécialement conçue pour les modèles d’applications de l’ère de l’IA », a expliqué Stéphanie Walter, responsable de la pile IA chez HyperFrame Research. « En revanche, Azure Database et Cosmos DB pour PostgreSQL restent respectivement une offre de Postgres géré à usage général pour les applications traditionnelles et une option distribuée et fragmentée pour les charges de travail multi-locataires à évolutivité horizontale », a-t-elle précisé. « HorizonDB est en quelque sorte l’offre Postgres pour l’IA, où la modernisation transactionnelle et les applications vectorielles se retrouvent enfin dans le même moteur. La base est destinée à être positionnée à l’endroit où l’on modernise à la fois les systèmes transactionnels hérités et là où l’on ajoute des fonctionnalités RAG, des agents et des fonctionnalités riches en intégrations sans avoir à assembler des bases de données et des points de terminaison ML séparés », a détaillé Mme Walter.
« L’une des raisons pour lesquelles PostgreSQL est si populaire auprès des développeurs d’IA résulte de sa prise en charge des index vectoriels », a rappelé Microsoft, ajoutant que dans Azure HorizonDB, ce support était étendu avec des capacités de filtrage avancées dans l’index vectoriel DiskANN qui « permettent les pushdown de prédicats directement dans la recherche de similarité vectorielle ». Cette technique d’optimisation courante filtre les données le plus tôt possible dans le pipeline afin d’éviter tout traitement et toute transmission inutiles. « Ce filtrage en amont allège le travail du moteur et peut améliorer la latence à long terme des requêtes de vecteur avec métadonnées », a expliqué Devin Pratt, directeur de recherche chez IDC. Microsoft a également déclaré qu’HorizonDB faciliterait l’intégration et la gestion par les développeurs des modèles génératifs, d’embeddings et de reranking de Microsoft Foundry sans aucune configuration. Selon M. Pratt, cela contribuera à réduire le code de colle, à simplifier les audits et à raccourcir le chemin entre le prototype et la production en conservant les données et les modèles sous un même plan de gouvernance.
Différenciation avec d’autres fournisseurs PostgreSQL
Microsoft n’est pas le seul fournisseur de cloud à proposer des services de base de données compatibles PostgreSQL, mais il cherche à se différencier. « Des offres comme AlloyDB AI, Snowflake Cortex, Aurora PostgreSQL avec Bedrock/SageMaker adoptent des approches similaires, mais HorizonDB met l’accent sur la gestion des modèles et la recherche vectorielle au sein du service Postgres », a souligné M. Pratt. Selon Mme Walter, un autre facteur clé qui différencie Microsoft concerne la couche de modèles d’Azure HorizonDB, qui est connectée à AI Foundry et à l’écosystème Azure AI plus large, si bien qu’il est possible de réutiliser les mêmes modèles et primitives de gouvernance dans les applications, les agents et les services de données. L’éditeur prévoit d’ajouter le mirroring pour Azure HorizonDB à Fabric, sa plateforme unifiée de données et d’analyse. Selon Bradley Shimmin, responsable des données, de l’analyse et de l’infrastructure chez The Futurum Group, cet ajout permettra à Fabric de disposer d’une base de données opérationnelle plus solide. Fabric prend déjà en charge le mirroring d’Azure Database pour PostgreSQL.
HorizonDB et ADP prennent en charge l’extension graphique open source Apache AGE. Cela transforme ces services en bases de données graphiques entièrement gérées. (Crédit MS)
Une intégration de GitHub Copilot pour faciliter la migration
Même si une grande partie de l’argumentaire de Microsoft en faveur d’Azure HorizonDB repose sur le fait que sa base est idéale pour fournir des données aux applications d’IA modernes, le fournisseur insiste également sur le fait que sa solution peut contribuer à moderniser les charges de travail héritées qui s’exécutent actuellement sur Oracle. Pour cela, la firme a intégré GitHub Copilot dans l’extension PostgreSQL pour Visual Studio Code. « Les équipes d’ingénieurs peuvent utiliser GitHub Copilot pour automatiser la conversion de bout en bout de codes de bases de données complexes à l’aide d’éditions de code riches, d’un contrôle de version et de texte », a souligné Microsoft dans l’article de blog annonçant Azure HorizonDB.
