Est-il possible pour les ordinateurs d’apprendre le bon sens ?

Points essentiels à retenir

Le sens commun se manifeste par une aptitude à saisir et à agir face aux situations courantes sans excès d'analyse. Il se construit au fil des expériences, des observations et des interactions sociales et culturelles.
Les systèmes informatiques peinent à manifester un sens commun car ils manquent d'une expérience concrète du monde et d'une capacité d'adaptation à de nouvelles situations. Ils sont également confrontés à des règles et des présupposés implicites que les humains comprennent de manière intuitive.
Les chercheurs explorent diverses voies, comme la constitution de vastes bases de données, l'externalisation du sens commun et l'apprentissage de l'IA via des environnements virtuels, pour permettre aux ordinateurs de développer un sens commun. Des progrès sont notables, mais le chemin à parcourir reste long.

Le sens commun. Un concept que nous pensons tous posséder. Mais quelle est sa véritable nature? Les ordinateurs ou les systèmes d’intelligence artificielle parviendront-ils un jour à le maîtriser ?

Définition et acquisition du sens commun chez l'humain

Le sens commun représente cette capacité fondamentale à percevoir, comprendre et évaluer les choses d'une manière considérée comme normale par la plupart des gens. C'est un ensemble de connaissances, de données et de règles empiriques que nous accumulons grâce à nos expériences et observations tout au long de la vie. Ce sens commun nous permet d'agir et de réagir de manière adaptée face aux situations du quotidien, sans besoin d'une analyse approfondie.

L'acquisition du sens commun commence dès le plus jeune âge. Les bébés commencent à saisir les relations de cause à effet, par exemple, pleurer entraîne d'être nourri ou changé. La répétition de ces expériences permet d'accumuler des connaissances pratiques sur le monde. Toucher une surface chaude brûle, ce qui conduit à éviter ces surfaces par la suite.

L'enfance est une période où le sens commun se développe par l'expérimentation, l'observation et l'interaction avec l'entourage. Nous apprenons que le linge doit être lavé, qu'il est incorrect de parler la bouche pleine et qu'un verre renversé cause des dégâts. Les corrections de la part des parents, des frères et sœurs, des enseignants et autres adultes nous permettent d'intérioriser les normes sociales. Ces apprentissages deviennent avec le temps des piliers de notre sens commun.

Au-delà des expériences personnelles, le sens commun est influencé par les normes sociétales et culturelles. Ce qui peut être considéré comme du bon sens dans une culture (comme se déchausser en entrant dans une maison) peut être différent dans une autre.

Notre sens commun évolue au fur et à mesure que nous grandissons et que nous rencontrons de nouvelles personnes et de nouveaux environnements. Un enfant ayant grandi dans une petite ville aura une compréhension de la vie adaptée à ce contexte. Un adulte qui déménage dans une grande métropole devra ajuster son sens commun au nouvel environnement.

Le sens commun est donc un apprentissage continu, enrichi par toutes les expériences que nous vivons.

Les défis du sens commun pour les ordinateurs

Plusieurs raisons expliquent pourquoi le sens commun est difficile à implémenter dans les systèmes informatiques.

D'une part, le sens commun humain se construit sur des années d'interaction avec le monde. Nous expérimentons, nous tirons des leçons de nos erreurs et nous mémorisons les résultats. Les ordinateurs ne possèdent pas cette base d'expérience réelle. Ils ne connaissent que ce que les humains leur communiquent explicitement.

Par exemple, voici la question que j'ai posée à ChatGPT (GPT 3.5) :

Janet gère une laverie. Elle lave les vêtements de ses clients et les étend au soleil pour sécher. Un jour, Janet a lavé cinq chemises et les a étendues. Il a fallu cinq heures pour que les chemises sèchent. Combien de temps faudra-t-il pour faire sécher 30 chemises ?

Et voici sa réponse :

Un autre défi est la dépendance du sens commun au contexte. Un ordinateur programmé selon des règles spécifiques aura des difficultés à adapter ces règles à de nouveaux contextes, contrairement à l'intuition humaine.

Supposons qu'un ordinateur ait appris comment réagir en cas de pluie. Cela semble simple, n'est-ce pas? Mais qu'en est-il si, au lieu de la pluie, c'est un arroseur qui se déclenche ? Ou si la scène se déroule à l'intérieur d'une épicerie et que de l'eau commence à tomber du plafond ? Nous saurions instantanément comment nous adapter à ces variations, tandis qu'un ordinateur suivrait aveuglément sa règle "s'il pleut, rentrez", ce qui deviendrait alors inapproprié.

Il existe également des règles et des présupposés que les humains intègrent de manière inconsciente. Par exemple, à quelle distance se tenir de quelqu'un pour ne pas créer d'inconfort ? Les humains connaissent instinctivement la réponse, sans forcément pouvoir l'expliquer précisément. Ces normes sociales implicites sont particulièrement difficiles à décoder pour les ordinateurs à partir de simples données.

Ainsi, le sens commun demeure actuellement l'une des faiblesses majeures de l'IA face à l'intelligence humaine. C'est une compétence naturelle pour l'humain, mais complexe à reproduire pour les machines.

Les voies d'apprentissage du sens commun pour les ordinateurs

Après une phase d'optimisme initial dans les années 1970 et 1980, les chercheurs ont pris conscience de la complexité de la tâche d'enseigner le sens commun aux ordinateurs. Cependant, des approches novatrices apparaissent prometteuses pour doter les systèmes d'IA d'une compréhension du monde physique et social.

L'une de ces approches consiste à construire de manière manuelle des bases de données exhaustives, répertoriant les faits et les règles qui régissent le fonctionnement du monde. Le projet Cyc, lancé en 1984 par Doug Lenat, en est un exemple ambitieux.

Des centaines de logiciens ont passé des décennies à encoder des millions d'axiomes logiques dans Cyc. Le résultat est un système doté d'une vaste connaissance du monde réel. Cyc est par exemple capable de considérer qu'une tomate est techniquement un fruit, mais qu'elle n'a pas sa place dans une salade de fruits, grâce à sa connaissance des saveurs culinaires.

L'externalisation du sens commun avec ConceptNet

Des bases de données plus récentes, telles que ConceptNet, adoptent une approche d'externalisation pour rassembler des affirmations relevant du sens commun. L'idée est qu'au lieu de confier à des experts ou à l'IA la tâche de trouver tous les faits et relations fondamentales du monde, chacun peut contribuer avec ses propres connaissances.

Cette approche permet à ces bases de données de bénéficier de l'intelligence collective de nombreuses personnes sur Internet. En accumulant des milliers d'éléments de sens commun provenant de cette contribution collaborative, ConceptNet a constitué un référentiel de connaissances de base étonnamment vaste. Et grâce à l'apport continu de nouveaux contributeurs, ces connaissances ne cessent de s'accroître.

L'apprentissage du sens commun par l'expérience

Une autre approche intéressante est la création d'environnements virtuels détaillés dans lesquels les agents d'IA peuvent interagir et apprendre les lois de la physique ainsi que développer leur intuition par la pratique.

Les chercheurs conçoivent des univers virtuels en 3D, remplis d'objets du quotidien qui imitent le monde réel, comme la maison numérique "AI2 THOR" construite par l'Institut Allen. Dans ces environnements, les robots IA peuvent explorer différentes interactions pour acquérir une compréhension intuitive des concepts que les humains considèrent comme allant de soi.

Par exemple, un robot IA peut se voir attribuer un corps virtuel et essayer de saisir des blocs, de les empiler, de les renverser, etc. En observant la manière dont les blocs tombent et interagissent de manière réaliste, le robot apprend des notions de base comme la solidité, la gravité et la dynamique physique. Aucune règle n'est nécessaire, seule l'expérience.

Le robot peut également expérimenter d'autres actions comme laisser tomber un objet en verre et le voir se briser en touchant le sol. Il peut également découvrir les propriétés de l'eau en versant des liquides et en observant comment ils s'écoulent et s'accumulent. Ces leçons pratiques permettent à l'IA d'acquérir des connaissances basées sur l'expérience sensorielle et non uniquement sur des modèles de données.

Des techniques basées sur l'analyse de données, telles que le pré-entraînement de modèles linguistiques volumineux et puissants, se sont également révélées étonnamment efficaces pour détecter des schémas relevant du sens commun. Les modèles d'IA comme GPT-3.5 et GPT-4 sont capables de générer un texte incroyablement proche du langage humain après avoir "lu" de grandes quantités de données provenant d'Internet.

Bien que ces modèles fassent parfois des propositions irréalistes (connues sous le nom d'hallucination de l'IA), l'approche d'apprentissage statistique leur permet d'imiter certains aspects du sens commun. Cependant, un débat subsiste sur la question de savoir s'il s'agit réellement d'un sens commun authentique ou plutôt d'une exploitation habile des biais des données.

Évaluer le sens commun chez les ordinateurs

Crédit image : freepik/pik gratuit

À mesure que les systèmes d'intelligence artificielle se voient confier des tâches plus complexes dans le monde réel, il devient crucial d'évaluer leur niveau de "sens commun".

Le sens commun physique

Un axe d'évaluation est le sens commun physique, c'est-à-dire l'intuition sur les objets, les forces et les propriétés fondamentales du monde.

Par exemple, montrez à un système de vision artificielle une image d'un livre flottant en l'air et demandez-lui de décrire la scène. Est-ce que le système remarque que quelque chose d'inhabituel se produit avec ce livre ? Ou bien proposez au système d'IA des scénarios étranges comme "l'homme a coupé une pierre avec une miche de pain" et voyez si cela suscite une réaction d'incohérence.

L'environnement AI2 THOR de l'Institut Allen simule des tours de blocs, des tasses renversées et d'autres scènes pour tester ce genre d'intuition physique.

Les humains possèdent également un sens commun social, une compréhension tacite des motivations, des relations et des normes sociales. Pour évaluer cet aspect chez l'IA, soumettez-lui des situations avec des pronoms ou des motivations ambigus et observez si le système les interprète de manière cohérente.

Par exemple, j'ai demandé à ChatGPT si "ça" faisait référence à la valise ou au trophée dans l'instruction suivante:

Le trophée ne rentrait pas dans la valise car elle était trop petite.

Le système a échoué au test. Un humain comprendrait immédiatement que le mot "elle" faisait référence à la valise.

Ce type de test s'appelle le Winograd Schema Challenge, conçu spécifiquement pour évaluer le sens commun social.

Sécurité et éthique

Il est essentiel de vérifier si les systèmes d'IA ont assimilé des schémas dangereux ou contraires à l'éthique. Analysez si l'IA présente des biais préjudiciables basés sur le sexe, l'origine ethnique ou d'autres caractéristiques lors de ses prises de décision.

Vérifiez si elle effectue des distinctions éthiques logiques. Tuer un ours pour sauver un enfant peut être considéré comme légitime, tandis que déclencher une bombe nucléaire dans le même but ne le serait pas. Signalez toute recommandation concernant des actes manifestement contraires à l'éthique.

Performances en conditions réelles

Évaluez le sens commun en observant le fonctionnement des systèmes d'IA dans des environnements réels. Par exemple, les voitures autonomes identifient-elles et réagissent-elles correctement aux objets et aux piétons ? Un robot peut-il se déplacer dans différents environnements domestiques sans casser d'objets de valeur ou blesser des animaux de compagnie ?

Les tests en conditions réelles mettent en évidence des lacunes du sens commun qui ne seraient pas détectables dans des conditions de laboratoire limitées.

Des progrès, mais un travail encore nécessaire pour l'IA et le sens commun

Certains experts estiment que l'IA ne pourra jamais acquérir un sens commun comparable à celui de l'humain sans développer des structures cérébrales et corporelles similaires aux nôtres. D'un autre côté, les esprits numériques ne sont pas soumis aux préjugés et aux raccourcis mentaux humains, et pourraient donc théoriquement les surpasser. Néanmoins, il n'y a probablement pas lieu de s'inquiéter d'une IA super intelligente pour le moment.

À court terme, la meilleure solution semble être une IA qui combine un sens commun appris avec une programmation traditionnelle de qualité. De cette façon, des erreurs stupides, comme confondre une tortue avec un fusil, pourront être évitées, espérons-le.

Nous n'en sommes pas encore là, mais le sens commun n'est plus le point aveugle de l'IA : des avancées sont en cours. Il n'en reste pas moins qu'une bonne dose de sens commun humain sera nécessaire pour appliquer ces technologies pendant un certain temps.