Les « world models » : une promesse pour l'IA, à condition de les orienter collectivement
Après les modèles de langage, capables de converser ou de coder, une nouvelle promesse de l'intelligence artificielle (IA) capte désormais l'attention : celle des « modèles de monde » (world models), présentés comme une étape décisive vers une intelligence enfin ancrée dans le réel. Mais cette lecture peut être trompeuse : les modèles de monde ne constituent pas une rupture nette avec les modèles de langage ; ils en prolongent la logique et en reprennent certains outils. Ils apportent néanmoins des bénéfices spécifiques et se distinguent dans leur manière d'apprendre. Reste alors une question essentielle : comment faire en sorte que les world models bénéficient à la société ?
Une opposition artificielle entre modèles de langage et modèles de monde
On présente souvent les modèles de langage et les modèles de monde comme deux approches éloignées, voire opposées, de l'IA. Les premiers manipuleraient des mots sans comprendre le réel ; les seconds permettraient enfin aux machines de plonger dans le monde physique. Cette opposition peut être trompeuse. Dans les faits, les modèles de monde reposent sur les mêmes fondations que les modèles de langage : architectures Transformer, entraînement non supervisé, apprentissage et exploitation de représentations abstraites, ingestion et prédiction séquentielles de données variées (texte, image, audio). Loin de remplacer les modèles de langage, les world models en prolongent la logique, étendant leur champ d'application à la perception et l'action dans divers environnements. Par ailleurs, l'IA physique, entraînée dans un world model, devra comprendre des instructions complexes, décrire des situations et, plus généralement, communiquer avec nous via le langage. La frontière est donc moins nette qu'il n'y paraît.
La vraie bascule : de l'observation à l'expérimentation
La véritable nouveauté des world models se situe ailleurs. Jusqu'à présent, apprendre à un système à agir dans le monde impliquait de collecter énormément de données in situ. Un processus coûteux, lent, parfois dangereux. Les modèles de monde changent cette équation : ils fournissent une forme de simulation dans laquelle un agent peut expérimenter, échouer, apprendre, et recommencer d'innombrables fois. Ce changement est décisif. L'IA ne se contente plus d'observer le monde : elle commence à l'expérimenter. Elle ne dépend plus uniquement du passé : elle peut explorer des futurs possibles.
Prenons l'exemple du véhicule autonome. Le tester sur route en toutes circonstances, notamment les plus rares ou les plus dangereuses, est impossible. Un world model de conduite sait générer ces scénarios à grande échelle : un enfant surgissant entre deux voitures, une chaussée verglacée, le comportement imprévisible d'un autre conducteur. Ce « bac à sable » permet d'explorer sans limites et d'améliorer de façon décisive la robustesse des systèmes. Au-delà de la simulation, ces approches élaborent une représentation abstraite du monde sensible, à l'instar des humains : cela permet d'imaginer des situations, d'anticiper les conséquences d'une action, de planifier avant d'agir. Ce déplacement, plus que toute opposition artificielle entre paradigmes, constitue le cœur de la transformation actuelle.
Des « world models » ouverts au service de la société
Ces technologies ouvrent maintes perspectives pour le bien commun : robotique d'assistance améliorant l'autonomie des personnes âgées ; aide à l'élaboration de traitements médicaux personnalisés ; robotique d'intervention en zones sinistrées ; véhicules autonomes pour une mobilité plus sûre et plus inclusive ; etc. Le débat public se concentre pourtant davantage sur les risques : perte de contrôle, usages militaires, dérives liées à l'autonomie des systèmes. Ces préoccupations, légitimes, ne devraient pas reléguer au second plan les perspectives bénéfiques, toutes aussi réelles. La question essentielle devient alors collective : quels usages voulons-nous encourager ?
Dans ce contexte, le rôle de la recherche ouverte est déterminant. Les world models ne se contentent pas de simuler une réalité. Ils sélectionnent, simplifient et organisent ce qui mérite d'être appris. Autrement dit, ils n'imitent pas seulement le monde : ils en proposent une version. Si leur développement se concentre entre les mains de quelques acteurs privés, des logiques principalement économiques prévaudront. Seule une recherche ouverte et collaborative permettra d'assurer que ces modèles bénéficient à nos priorités collectives. On l'observe déjà en robotique : la mutualisation des données est essentielle pour construire des modèles capables de généraliser. C'est une dynamique que des industries très fermées comme celle de l'automobile auraient intérêt à intégrer.
Au-delà des questions techniques, se dessine un enjeu de souveraineté. Car maîtriser les world models n'est pas seulement produire des outils, c'est aussi définir les environnements dans lesquels les IA physiques apprennent, et donc orienter leurs aptitudes et leurs usages. Au final, c'est décider des types d'IA que nous souhaitons voir émerger, au service de quels objectifs, et pour quelle société.
Cet article est une tribune, rédigée par un auteur extérieur au journal et dont le point de vue n'engage pas la rédaction. Par Patrick Pérez



