Après Deepseek, une start-up chinoise nommée Butterfly Effect a présenté une IA nommée Manus AI. Cet agent capable de gérer différentes tâches et doté d’une grande autonomie rivalise avec DeepResearch d’OpenAI. Face à l’engouement du week-end, le service a été bloqué.
La Chine ne cesse d’être au cœur de l’actualité sur l’intelligence artificielle. En début d’année, le monde a découvert Deepseek et son modèle de raisonnement. Un succès fulgurant pour un LLM performant et entraîné à moindre coût. Ce week-end, une autre start-up chinoise a fait parler d’elle, Butterfly Effect et surtout son modèle Manus AI. Dans une vidéo, son fondateur Xiao Hong, présente ce LLM comme « le premier agent d’IA générale », en étant capable de gérer plusieurs tâches de manière autonome.
Dans cette présentation, Manus est capable de plusieurs choses. Il peut recommander le meilleur candidat pour un poste après avoir ingéré, ouvert et lu les demandes d’emploi, puis classer les personnes dans un document en texte avant de reformater ses recommandations sous forme de feuille de calcul. Autre cas d’usage, il prépare un document sur les biens immobiliers disponibles après qu’un utilisateur lui ai fournit ses exigences, le lieu et son budget. Enfin, le dernier cas d’usage propose de corréler différents cours de bourse de sociétés (dont Nvidia), de les mettre en forme dans un rapport et de créer un site pour les présenter sur une page web.
Manus AI est capable de créer une page web depuis un rapport de corrélation de cours de bourse. (Crédit Photo : Butterfly Effet)
Des performances et des interrogations
Dans la vidéo, l’interface utilisateur est la même qu’un assistant IA avec des requêtes en langage naturel, puis elle se transforme en interface de ligne de commande pour voir le travail du modèle. Le créateur souligne dans son exposé que Manus se comporte comme « un système multi-agents alimenté par plusieurs modèles distincts. » Pour l’instant, il ne donne pas de détail sur les LLM utilisés, même si certains experts estiment que l’entraînement s’est fait sur Claude d’Anthropic, ainsi que Deepseek et Qwen d’Alibaba. Aucun détail non plus sur le coût pour créer Manus en sachant que la Chine est soumise à l’interdiction des Etats-Unis sur les importations de puces IA avancées.
Manus revendique de meilleures performances que Deep Research d’OpenAI. (Crédit Photo: Butterfly Effect)
Si les performances et la rapidité d’exécution semblent au rendez-vous, certains testeurs ont constaté des erreurs ou des blocages du modèle lors d’invites complexes. Dans un benchmark avec l’outil d’évaluation Gaia, Butterfly Effet juge néanmoins que Manu AI se démarque d’OpenAI Deep Research sur plusieurs niveaux de difficulté. Une chose est sûre, l’effet whaou a joué à plein pendant le week-end à tel point que la start-up a été obligée de fermer le service submergé par les demandes.