Le célèbre robot C-3PO de la saga Star Wars converse couramment dans des millions de langues. Les performances des meilleurs traducteurs automatiques d’aujourd’hui se concentrent sur une poignée de langues. Quant à tenir une conversation, les chatbots les plus élaborés ne font illusion qu’un temps. L’éloquence, malgré les progrès fulgurants de l’intelligence artificielle, serait-elle un talent réservé aux humains ?
Les robots et ordinateurs parlants de la science-fiction nous habituent à des performances linguistiques très élevées : ils comprennent tout ce qu’on leur dit, ne butent pas sur un concept inconnu et gèrent à merveille les pièges de la communication comme les homonymes et les ambiguïtés. On les voit rarement demander à leur interlocuteur humain de répéter, reformuler ou réexpliquer. L’écart avec les robots réels est flagrant : essayez de dialoguer dix minutes avec Siri, Alexa, Nao ou Pepper, vous allez vite identifier leurs limites et, probablement, soupçonner que faire parler une machine n’est pas chose aisée. De fait, c’est un véritable enjeu, qui concerne les domaines du traitement automatique des langues et de l’intelligence artificielle. Les recherches se succèdent, les techniques évoluent, les apports de l’apprentissage profond – le fameux deep learning – sont exploités, mais il s’avère encore bien difficile d’atteindre un dialogue aussi fluide et cohérent que le dialogue entre humains. De quoi les machines parlantes sont-elles vraiment capables aujourd’hui ? Comment évaluer leurs progrès ?
Cette évaluation est l’objet du test de Turing, formulé par Alan Turing en 1950 et considéré comme l’un des faits les plus marquants de l’histoire de l’informatique. Plus récemment, c’est aussi l’objet des schémas de Winograd, dont l’enjeu est d’interpréter un pronom comme « il » dans des phrases bien choisies, par exemple « Le poster ne tient pas sur le mur car il est trop grand » (il = le poster) et « Le poster ne tient pas sur le mur car il est trop petit » (il = le mur). En quoi une machine capable de détecter une telle subtilité de langage est-elle intelligente ? Quelles sont les limites de ces tests d’évaluation de l’intelligence ?