![]() Toutes les news c'est ici Contact
Abonner un(e) ami(e) Vous abonner Qui sommes no |
|
07.01.2025 - N° 1.866 L'IA, le go et… les maths Par Gaël Varoquaux
![]() Titulaire d’un master en physique quantique de l’École normale supérieure et d’un doctorat en physique quantique de l’université d’Orsay, Gaël Varoquaux se passionne pendant ses études pour l’informatique et le traitement des données. En 2008, il décide de changer d’orientation et rejoint l’équipe-projet Parietal d’Inria Saclay, spécialisée dans la modélisation du cerveau pour les neurosciences. Il utilise Scikit-learn pour ses travaux et s’implique dans l’animation de la communauté de développeurs. En 2018, il devient chef de projet pour le consortium Scikit-learn. ![]() Depuis
2017, une IA gagne contre les meilleurs experts du jeu de go, pourtant
particulièrement ardu. Une telle « super-intelligence » est rare, mais
elle pourrait advenir en mathématique fondamentale.
Cela
fait bien longtemps qu'une calculatrice dépasse l'homme sur une tâche
intellectuelle : le calcul mental. Et pourtant, nous n'appelons pas
cela de la « super-intelligence ». Probablement parce que c'est l'homme
qui a spécifié à la machine toutes les règles pour ces calculs. De
même, un ordinateur a une capacité surhumaine à mémoriser exactement
des informations, par exemple des chiffres, mais ne le considérons pas
pour autant super-intelligent. Peut-être est-ce parce qu'il ne nous
apprend rien de nouveau. Mais en 2017, une IA a commencé à apprendre
aux meilleurs joueurs de go des mouvements, des stratégies, que
personne ne connaissait. Comment cela est-il possible ? L'IA va-t-elle
dépasser son créateur et devenir super-intelligente sur tous les sujets
? La plupart des percées récentes en IA se font avec des méthodes d'apprentissage où l'ordinateur imite l'humain. Par exemple, pour créer des systèmes de vision par ordinateur, on présente à l'ordinateur beaucoup d'images annotées de descriptions de ce qu'elles représentent. Les IA conversationnelles, elles, apprennent à partir d'exemples à compléter des textes. Dans ces conditions, il n'est pas facile pour l'IA de se démarquer de son créateur. Renforcement Mais AlphaZero, l'IA championne au go, fonctionne sur un principe différent : l'apprentissage par renforcement. Ici, l'IA fait des actions, celles du jeu de go, et reçoit en retour une « récompense » si elle gagne le jeu. A travers les parties, elle optimise ses stratégies pour maximiser ses récompenses, incluant des étapes d'exploration de nouvelles stratégies. AlphaZero s'est entraîné en jouant des dizaines de millions de parties contre lui-même. C'est ainsi que l'IA a pu créer de nouvelles stratégies, pas limitées par la connaissance humaine. Un tel apprentissage par des millions d'essais-erreurs ne s'applique pas à tous les problèmes : il faut pouvoir réaliser des essais très rapidement, comme dans un jeu sur un ordinateur, seul domaine dans lequel on a à ce jour créé une réelle super-intelligence. Mais il y a de l'espoir en mathématiques, cet autre jeu de l'esprit. En effet, les progrès en IA générative sur le langage, ceux-là mêmes qui alimentent chatGPT, peuvent s'appliquer aux preuves mathématiques, qui sont une suite de symboles. Entraînée sur de nombreuses preuves, l'IA apprend à compléter des débuts de preuve. Mais une IA générative crée de tels enchaînements sans garantie qu'ils soient valides mathématiquement. Un outil de vérification de preuves, basé sur de l'IA symbolique, peut cependant n'accepter que les enchaînements justes. Un apprentissage par renforcement permet alors de découvrir de nouveaux enchaînements. C'est ainsi qu'en juillet 2024, aux Olympiades internationales de mathématiques, l'IA AlphaProof a remporté une médaille d'argent. Plus de progrès amèneront peut-être une « super-intelligence » en maths. Mais nous sommes loin d'une « super-intelligence » générale,
car en go comme en maths les progrès sont rendus possibles par la facilité de tester si on a « gagné » ou non. ______________
| ||
Qui
sommes-nous ? Nous écoutons, nous lisons, nous regardons... C'est parfois un peu ardu, et les news peuvent demander de l'attention. Mais elle sont souvent remarquables ! Nous vous proposons cet article afin d'élargir votre champ de réflexion et nourrir celle-ci. Cela ne signifie pas forcément que nous approuvions la vision développée ici. Nous ne sommes nullement engagés par les propos que l'auteur aurait pu tenir par ailleurs, et encore moins par ceux qu'il pourrait tenir dans le futur. Merci cependant de nous signaler par le formulaire de contact toute information concernant l'auteur qui pourrait nuire à sa réputation. Bien sûr, vos commentaires sont très attendus. ![]() |