L'IA Go de Deepmind a poussé un champion humain à la retraite. Aujourd'hui, le laboratoire d'IA de Google veut l'intégrer dans son modèle de langage large de nouvelle génération pour concurrencer ChatGPT. Faut-il s'inquiéter ?
Google prévoit d'intégrer des techniques issues d'un système d'IA conçu pour gagner des parties du jeu de société complexe qu'est le Go, afin d'étoffer son modèle de langage large de nouvelle génération et de rivaliser avec le ChatGPT d'OpenAI.
Le nouveau grand modèle de langage (LLM), appelé Gemini, s'appuiera sur le système d'IA qui a gagné des parties pour tirer parti de ses compétences en matière d'apprentissage par renforcement. Cela devrait permettre d'améliorer les tâches pour lesquelles les LLM actuels, tels que ChatGPT ou Google's Bard, peuvent rencontrer des difficultés, ou d'ouvrir de nouvelles perspectives d'utilisation.
« À un niveau élevé, on peut considérer que Gemini combine certaines des forces des systèmes de type AlphaGo avec les étonnantes capacités linguistiques des grands modèles », déclare Demis Hassabis, PDG de Google DeepMind, dans un article de Wired.
Depuis avril dernier, DeepMind a fusionné avec l'équipe d'IA interne de Google pour créer Google DeepMind.
Google a initialement acquis DeepMind en 2014 après avoir démontré que son modèle d'IA, connu sous le nom d'AlphaGo, était le meilleur dans un jeu de plateau extrêmement complexe appelé Go. Peu après, en 2016, AlphaGo a battu le champion de l'époque, Lee Sedol, en quatre parties sur cinq.
Lee s'est ensuite retiré complètement du jeu, affirmant que l'IA « ne peut pas être vaincue ».
Lee n'avait pas tout à fait raison, puisque Kellin Pelgrine a battu une autre IA joueuse de Go, KataGo, par 14 parties à 15 en début d'année. Cependant, Pelgrine a été aidé par une IA qui a repéré les faiblesses de KataGo. Il s'agit donc plutôt d'une victoire à la Pyrrhus pour nous, les humains en chair et en os.
Ce qui intéresse le développement du LLM de Google, c'est la façon dont AlphaGo utilise l'apprentissage par renforcement pour devenir un adversaire redoutable. Il s'agit essentiellement d'un système qui lui permet de faire des tentatives et de recevoir un retour d'information sur ses résultats, ce qui, combiné à la capacité de cartographier de nombreux mouvements possibles dans un jeu, l'a finalement amené à vaincre un adversaire qui maîtrisait le jeu.
Combinez cette compétence avec la capacité d'un LLM à extraire des informations d'Internet et à les régurgiter dans un langage naturel, et vous pourriez être en présence d'un outil d'IA plus intelligent que ceux qui existent aujourd'hui. C'est du moins ce que pense Google, qui suggère que ce type de raisonnement et de renforcement pourrait aider ses modèles d'IA à rattraper enfin le ChatGPT dominant d'OpenAI.
Bien que Gemini soit encore en cours d'élaboration, il est probable que son développement se poursuive encore longtemps avant qu'il ne soit prêt à être diffusé à grande échelle.