La combinaison des neurosciences, de la psychologie et de l'IA donne un modèle fondamental de la pensée humaine PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

La combinaison des neurosciences, de la psychologie et de l'IA produit un modèle fondamental de la pensée humaine

Progrès dans intelligence artificielle a permis la création d'IA qui effectuent des tâches que l'on pensait auparavant réservées aux humains, telles que traduire des langues, conduire des voitures, jouer à des jeux de société au niveau d'un champion du monde, ainsi que extraire la structure des protéines. Cependant, chacune de ces IA a été conçue et entraînée de manière exhaustive pour une tâche unique et a la capacité d'apprendre uniquement ce qui est nécessaire pour cette tâche spécifique.

Des IA récentes qui produisent texte fluide, y compris lors de conversations avec des humains, et générer un art impressionnant et unique peut donner le fausse impression d'un esprit au travail. Mais même il s’agit de systèmes spécialisés qui exécutent des tâches étroitement définies et nécessitent une formation massive.

Il reste toujours un défi de taille de combiner plusieurs IA en une seule capable d'apprendre et d'effectuer de nombreuses tâches différentes, et encore moins de poursuivre l'ensemble des tâches effectuées par les humains ou de tirer parti de la gamme d'expériences disponibles pour les humains qui réduisent la quantité de données autrement nécessaires pour apprendre à effectuer ces tâches. Les meilleures IA actuelles en la matière, comme AlphaZero ainsi que Chat, peut gérer une variété de tâches qui correspondent à un seul moule, comme jouer à un jeu. Intelligence Artificielle Générale (IAG) capable d'accomplir un large éventail de tâches reste insaisissable.

En fin de compte, les AGI il faut pouvoir interagir efficacement les uns avec les autres et avec les personnes dans divers environnements physiques et contextes sociaux, intégrer la grande variété de compétences et de connaissances nécessaires pour ce faire, et apprendre de manière flexible et efficace de ces interactions.

Construire des AGI revient à construire des esprits artificiels, bien que grandement simplifiés par rapport aux esprits humains. Et pour construire un esprit artificiel, il faut commencer par un modèle de cognition.

De l’intelligence générale humaine à l’intelligence artificielle

Les humains disposent d’un ensemble presque illimité de compétences et de connaissances et apprennent rapidement de nouvelles informations sans avoir besoin d’être repensés pour ce faire. Il est concevable qu’une AGI puisse être construite en utilisant une approche fondamentalement différente de l’intelligence humaine. Cependant, comme trois chercheurs in AI ainsi que sciences cognitives, notre approche consiste à s’inspirer et à s’inspirer de la structure de l’esprit humain. Nous travaillons vers l'AGI en essayant de mieux comprendre l'esprit humain, et de mieux comprendre l'esprit humain en travaillant vers l'AGI.

De la recherche en neurosciences, des sciences cognitives et de la psychologie, nous savons que le cerveau humain n’est ni un immense ensemble homogène de neurones ni un ensemble massif de programmes spécifiques à des tâches qui résolvent chacun un problème unique. Il s'agit plutôt d'un ensemble de régions avec des propriétés différentes qui soutiennent les capacités cognitives de base qui forment ensemble l’esprit humain.

Ces capacités incluent la perception et l'action ; mémoire à court terme de ce qui est pertinent dans la situation actuelle ; mémoires à long terme pour les compétences, l'expérience et les connaissances ; raisonnement et prise de décision; émotion et motivation; et acquérir de nouvelles compétences et connaissances à partir de l’ensemble de ce qu’une personne perçoit et expérimente.

Au lieu de se concentrer isolément sur des capacités spécifiques, le pionnier de l’IA Allen Newell en 1990, a suggéré de développer Théories unifiées de la cognition qui intègrent tous les aspects de la pensée humaine. Les chercheurs ont pu créer des logiciels appelés architectures cognitives qui incarnent de telles théories, permettant de les tester et de les affiner.

Les architectures cognitives s’appuient sur de multiples domaines scientifiques aux perspectives distinctes. Les neurosciences se concentrent sur l'organisation du cerveau humain, la psychologie cognitive sur le comportement humain dans le cadre d'expériences contrôlées et l'intelligence artificielle sur les capacités utiles.

Le modèle commun de cognition

Nous avons été impliqués dans le développement de trois architectures cognitives : ACT-R, Monter, ainsi que Sigma. D’autres chercheurs se sont également penchés sur des approches alternatives. Un papier identifié près de 50 architectures cognitives actives. Cette prolifération d'architectures est en partie le reflet direct des multiples perspectives impliquées, et en partie l'exploration d'un large éventail de solutions potentielles. Pourtant, quelle qu’en soit la cause, cela soulève des questions embarrassantes à la fois sur le plan scientifique et quant à la recherche d’une voie cohérente vers l’AGI.

Heureusement, cette prolifération a amené ce domaine à un point d’inflexion majeur. Nous avons tous les trois identifié une convergence frappante entre les architectures, reflétant une combinaison d'études neuronales, comportementales et informatiques. En réponse, nous avons lancé un effort communautaire pour capturer cette convergence d'une manière semblable à celle Modèle standard de la physique des particules qui a émergé dans la seconde moitié du XXe siècle.

un graphique montrant une tête et un cerveau humains à gauche, une tête de robot avec des circuits à droite et un tableau avec cinq blocs de couleur et des flèches reliant les blocs
Ce modèle de base de la cognition explique à la fois la pensée humaine et fournit un modèle pour une véritable intelligence artificielle. Andrea Stocco, CC BY-ND

Ce Modèle commun de cognition divise la pensée humaine en plusieurs modules, avec un module de mémoire à court terme au centre du modèle. Les autres modules (perception, action, compétences et connaissances) interagissent à travers lui.

L’apprentissage, plutôt que de se produire intentionnellement, se produit automatiquement en tant qu’effet secondaire du traitement. En d’autres termes, vous ne décidez pas de ce qui est stocké dans la mémoire à long terme. Au lieu de cela, l’architecture détermine ce qui est appris en fonction de ce à quoi vous pensez. Cela peut permettre d’apprendre de nouveaux faits auxquels vous êtes exposé ou de nouvelles compétences que vous essayez. Cela peut également permettre d’affiner les faits et compétences existants.

Les modules eux-mêmes fonctionnent en parallèle ; par exemple, vous permettre de vous souvenir de quelque chose tout en écoutant et en regardant autour de vous. Les calculs de chaque module sont massivement parallèles, ce qui signifie que de nombreuses petites étapes de calcul se déroulent en même temps. Par exemple, en récupérant un fait pertinent à partir d’une vaste collection d’expériences antérieures, le module de mémoire à long terme peut déterminer simultanément la pertinence de tous les faits connus, en une seule étape.

Ouvrir la voie à l’intelligence générale artificielle

Le modèle commun est basé sur le consensus actuel dans la recherche sur les architectures cognitives et a le potentiel de guider la recherche sur l’intelligence générale naturelle et artificielle. Lorsqu’il est utilisé pour modéliser les schémas de communication dans le cerveau, le modèle commun produit des résultats plus précis que les principaux modèles issus des neurosciences. Ce étend sa capacité à modéliser les humains- le seul système prouvé capable d'une intelligence générale - au-delà des considérations cognitives pour inclure l'organisation du cerveau lui-même.

Nous commençons à voir des efforts visant à relier les architectures cognitives existantes au modèle commun et à l'utiliser comme base de référence pour de nouveaux travaux, par exemple une IA interactive. conçu pour coacher les gens vers de meilleurs comportements en matière de santé. L'un de nous a participé au développement d'une IA basée sur Soar, baptisée Rosie, qui apprend de nouvelles tâches via des instructions en anglais données par des enseignants humains. Il apprend 60 puzzles et jeux différents et peut transférer ce qu'il apprend d'un jeu à un autre. Il apprend également à contrôler un robot mobile pour des tâches telles que récupérer et livrer des colis et patrouiller dans les bâtiments.

Rosie n'est qu'un exemple de la façon de construire une IA qui approche l'AGI via une architecture cognitive bien caractérisée par le modèle commun. Dans ce cas, l'IA acquiert automatiquement de nouvelles compétences et connaissances au cours d'un raisonnement général qui combine l'enseignement du langage naturel par des humains et une quantité minimale d'expérience. En d'autres termes, une IA qui fonctionne plus comme un esprit humain que les IA d'aujourd'hui, qui apprennent via des méthodes brutes. force de calcul et quantités massives de données.

D'un point de vue plus large de l'AGI, nous considérons le modèle commun à la fois comme un guide pour le développement de telles architectures et IA, et comme un moyen d'intégrer les informations dérivées de ces tentatives dans un consensus qui mènera finalement à l'AGI.The Conversation

Cet article est republié de The Conversation sous une licence Creative Commons. Lis le article original.

Crédit image: Shutterstock.com/wowowG

Horodatage:

Plus de Singularity Hub