Recherche en IA : L’Europe publie plus d’articles que la Chine et les Etats-Unis

L’AI Index collecte et analyse la nature des articles de recherche publiés autour de l’intelligence artificielle. Son édition 2018 montre que l’Europe continue à publier davantage d’articles, soit 28% des publications référencées sur la base d’articles scientifiques Scopus en 2017, contre 25% pour la Chine et 17% pour les Etats-Unis. Mais la Chine a redoublé d’efforts ces dernières années et les articles européens sont moins cités que ceux des chercheurs américains.

Si l’Europe publie toujours davantage d’articles de recherche en IA, la Chine a fortement progressé au cours des 10 dernières années. (Crédit : IA Index/Elsevier)

Les articles de recherche consacrés à l’intelligence artificielle ont été multipliés par 8 au cours des 20 dernières années dans le monde quand, dans le même temps, le nombre total d’articles de recherche a été multiplié par deux, selon les données collectées par l’AI Index. L’Europe a été l’un des plus importants contributeurs dans le domaine de l’IA entre 1988 et 2017, avec 28% des articles sur l’intelligence articificielle référencés sur Scopus – la base de données d’articles scientifiques d’Elsevier – contre 25% pour la Chine et 17% pour les Etats-Unis. En Chine, l’ampleur des publications a fortement progressé, de 150% entre 2007 et 2017. L’activité de recherche autour de l’IA est par ailleurs mondiale puisque 30% des articles sont produits en dehors de ces trois grandes régions. Nonobstant les chiffres établis par cet indice, au comité duquel siègent des représentants de Stanford, du MIT, d’Harvard ou d’OpenAI, on constate néanmoins sur le terrain que les technologies concrètement exploitées pour les applications IA sont actuellement issues de fournisseurs américains et chinois. Sur Github, le framework opensource le plus utilisé par les développeurs reste, de très loin, Tensorflow issu de la R&D de Google.

En termes de citations par rapport à la moyenne, les articles de recherche sur l’IA publiés par l’Europe sont plus cités que les articles chinois mais restent en-dessous des citations reçues par les chercheurs américains. (source : AI Index 2018)

L’indicateur FWCI (Field-weighted citation impact) mesure l’impact des recherches sur le nombre moyen de citations qu’elles ont reçues par rapport à la moyenne mondiale pour la même catégorie. Il apparaît que l’Europe est peu citée dans ses recherches en IA, bien qu’elle soit en tête des publications. Ce sont toujours les Etats-Unis qui dominent en la matière, avec 83% des auteurs américains cités au-dessus de la moyenne mondial. Les auteurs chinois d’articles IA sont moins cités que les Européens mais ils ont nettement progressé. En 2016, ils ont été cités 44% plus qu’ils ne l’avaient été en 2000. L’indice a également regardé les citations en fonction de la sédentarité ou du déplacement des auteurs d’articles. Ceux qui publient le plus en dehors de leur région d’origine sont aussi ceux qui sont le plus cités, américains en tête. L’AI Index confirme l’accélération de la Chine sur les efforts investis en intelligence artificielle. Si le nombre de formations à l’IA et à l’apprentissage machine a progressé à l’échelle mondiale, il a été multiplié par plus de 10 en Chine en 2017 par rapport à 2010. D’autres pays ont également redoublé d’efforts. La Corée du Sud et le Japon ont été les plus gros producteurs de brevets IA en 2014, derrière les Etats-Unis. La formation en machine learning a aussi pris de l’importance sur le continent africain où l’Afrique du Sud accueille la conférence Deep Learning Indaba.

Machine learning et raisonnement probabiliste en tête

Un classement des articles sur l’IA publiés par catégories montre que 56% d’entre eux ont concerné en 2017 l’apprentissage machine et le raisonnement probabiliste contre 28% en 2010. Le rythme des publications s’est accéléré entre 2014 et 2017 par rapport aux 5 années précédentes. En particulier, les articles sur les réseaux de neurones ont progressé de 37% en moyenne par an contre 3% auparavant. Les articles sur la vision informatisée ont également augmenté. Cette tendance apparaît nettement dans la nature des articles IA enregistrés sur le référentiel de prépublication ArXiv. Ce site reçoit les articles que les chercheurs souhaitent communiquer mais qui n’ont pas encore été revus par des pairs. La catégorie Computer Vision et Pattern Recognition est, de loin, la plus importante.

Sur les applications de l’IA, des différences apparaissent dans les recherches publiées entre 2000 et 2017. L’Europe et les Etats-Unis sont davantage investis sur la santé et les sciences humaines, par rapport à l’ensemble des recherches, alors que la Chine met l’accent sur l’ingénierie et l’agriculture. On voit aussi qu’en 7 ans, l’activité des Etats-Unis sur les sciences médicales et humaines a dépassé celle de l’Europe.

Aux Etats-Unis, les entreprises plus impliquées dans la recherche IA

L’implication des gouvernements dans les recherches en IA apparaît aussi dans l’index. En Chine, en 2017, le gouvernement a produit près de 4 fois plus d’articles que les entreprises chinoises. Depuis 2007, le nombre d’articles publiés par l’administration chinoise a crû de 400% contre 73% du côté des entreprises. Aux Etats-Unis, ce sont les entreprises qui produisent le plus d’articles (6,6 fois plus qu’en Chine), même si l’administration en publie également beaucoup. En France, le secteur public est largement en tête, mais avec une baisse enregistrée après 2016.

Sur l’adoption des fonctionnalités d’IA, l’indice mentionne une étude de McKinsey (sur 2135 répondants) montrant une adoption relativement équivalente entre les grandes régions mondiales, même si certaines fonctionnalités sont plus utilisées que d’autres. L’automatisation robotisée des processus est par exemple un peu plus utilisée en Europe :27% des répondants contre 23% en Amérique du Nord et sur les marchés en développemet dont la Chine. Tandis que ces derniers utilisent davantage la vision informatisée.

Le classement d’images toujours plus rapide

Un chapitre de l’AI Index est consacré aux stars de GitHub, le référentiel de code utilisé par les développeurs au niveau mondial et désormais racheté par Microsoft. Sans surprise, le framework open source TensorFlow développé par Google culmine en tête des outils les plus populaires, loin devant tous les autres. Derrière lui, Scikit-learn, BVLC/Caffe et Keras. Derrière arrivent CNTK, mxnet et Pytorch, le plus récent mais qui fait une forte percée. Viennent ensuite Theano, caffe2 et Torch.

L’AI Index fait également un point sur la détection d’objets à travers ImagineNet, base de données d’images annotées à utiliser dans les recherches en reconnaissance d’objets. Il regarde l’évolution des temps d’entraînement pour classer des images par catégorie avec précision. « En un an et demi, le temps requis pour entraîner un réseau a chuté d’une heure à 4 minutes », indiquent les rapporteurs de l’index en ajoutant que ces temps reflètent l’industrialisation de la recherche en IA. Ils résultent des innovations en algorithmie et des investissements dans les infrastructures (matériel et logiciel) utilisées pour tester les systèmes. L’index aborde aussi les progrès réalisés dans d’autres domaines : l’analyse syntaxique des phrases (parsing), la traduction automatique, la compréhension du langage naturel… L’édition 2018 de l’AI Index peut être consultée en ligne.