Pour aider les développeurs, Perplexity lance une API de recherche

Le spécialiste de l’IA a dévoilé son API Search donnant aux développeurs la capacité d’accéder au moteur de recherche de Perplexity indexant des milliards de pages Web.

De plus en plus de fournisseurs de services IA s’attaquent au marché du moteur de recherche pour concurrencer les acteurs dominants que sont Google et Microsoft. Dans cette bataille, Perplexity vient de présenter son API Search à destination des développeurs. Ces derniers peuvent ainsi avoir accès au moteur de recherche de l’éditeur et son imposant index de plusieurs milliards de pages web. Cette ouverture « est un évènement majeur », souligne Wyatt Mayham de Northwest AI Consulting. Il ajoute, « cette initiative transforme Perplexity, autrefois moteur de recherche orienté consommateur, en une plateforme intégrée à l’infrastructure de recherche elle-même ».

Plus de précision dans l’extraction de données

L’API est conçue pour répondre aux exigences spécifiques des charges de travail IA, fournissant ce que l’entreprise décrit comme des « réponses structurées riches » immédiatement prêtes à l’emploi dans les applications IA. Son infrastructure d’indexation et de récupération divise les documents en sous-unités, évaluées selon les paramètres de la requête initiale. Cela permet à l’API de renvoyer des extraits pertinents et classés. Ce composant est un atout majeur souligne Wyatt Mayham, « au lieu de renvoyer des pages entières, ils classent les passages individuels et combinent les signaux de mots clés et sémantiques ». Il ajoute, « cela offre un meilleur contexte pour LLM volumineux et un prétraitement simplifié.»

Les utilisateurs peuvent filtrer les données par région ou par date, et regrouper plusieurs requêtes selon une tarification simple (5 $ HT pour 1 000 requêtes), précise-t-il. « Pour les développeurs, cela signifie qu’ils peuvent créer des outils de RAG, des workflows agentiques ou des produits de recherche sans avoir à extraire ni à assembler des API tierces. » Pour les développeurs d’IA, le rafraîchissement des données est primordiale, a-t-il déclaré, et les API de scraping des pages de résultats des agents de recherche sont soit « obsolètes ou restrictives ». Les entreprises dépensent des milliers de dollars par mois en scraping web pour contourner ce problème.

Un gain de temps pour les développeurs

L’API de recherche de Perplexity présente des « raisons convaincantes » pour lesquelles les développeurs s’y intéressent, a confirmé Thomas Randall, directeur de recherche chez Info-Tech Research Group. L’élimination de l’exploration, de la déduplication, du classement et le respect du fichier robots.txt (qui indique aux robots ce à quoi ils peuvent ou non accéder) peuvent représenter un gain considérable pour les développeurs. « La solution de Perplexity promet de supprimer ce problème », a-t-il déclaré, décrivant un « créneau potentiel » où l’API pourrait devenir la couche de récupération par défaut des LLM pour les startups et les outils internes, notamment si elle s’intègre aux API des modèles populaires.

Des outils accompagnant l’API

Parallèlement à cette offre, Perplexity a publié un kit de développement logiciel (SDK), un framework d’évaluation open source pour l’API Search. L’entreprise encourage les chercheurs et les développeurs à utiliser ce cadre, searchevals, pour tester toute API de recherche publique. Elle affirme dominer la concurrence en termes de qualité de sortie et de latence pour les flux de recherche via des agents IA. Le SDK facilite la prise en main de l’API, a souligné Wyatt Mayham, et les réponses structurées avec citations permettent d’éviter les hallucinations. Il a souligné que Perplexity s’est engagé à ne pas entraîner ses modèles sur les données clients – ce qui est particulièrement important pour les entreprises – et a qualifié sa boîte à outils d’évaluation ouverte de « rafraîchissante par rapport à la nature boîte noire de la plupart des API de recherche ». Le fournisseur affirme avoir utilisé le SDK et des outils de codage d’IA pour développer des produits plus rapidement (en moins d’une heure revendique-t-il). 

S’attaquer à l’obsolescence des informations

Le fournisseur a priorisé l’exactitude dès le départ, concentrant ses investissements en R&D sur la corroboration des réponses et des sources. « Notre propre expérience montre que l’obsolescence des informations est l’un des principaux facteurs de défaillance des agents d’IA. Nous avons donc optimisé nos flux d’indexation pour faire de Perplexity un véritable assistant en temps réel », a écrit la société dans un blog. L’entreprise affirme que son système basé sur l’IA traite des dizaines de milliers de requêtes de mise à jour d’index par seconde pour fournir des résultats actualisés. Son module de compréhension de contenu génère une logique d’analyse syntaxique pour gérer la complexité naturelle du web ouvert et optimiser. 

chevron_left
chevron_right