DeepMind a donné une « intuition » à l'IA en l'entraînant comme un bébé PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

DeepMind a donné une 'intuition' à l'IA en l'entraînant comme un bébé

image

Les bébés sont des boules de joie pétillantes, câlines et riantes. Ce sont aussi des machines d'apprentissage extrêmement puissantes. À trois mois, ils ont déjà une intuition sur la façon dont les choses se comportent autour d'eux, sans que personne ne leur enseigne explicitement les règles du jeu.

Cette capacité, surnommée « physique intuitive », semble extrêmement triviale à première vue. Si je remplis un verre d'eau et que je le pose sur la table, je sais que le verre est un objet, quelque chose que je peux envelopper dans mes mains sans qu'il ne fonde dans mes paumes. Il ne coulera pas à travers la table. Et s'il commençait à léviter, je le regardais puis courais immédiatement vers la porte.

Les bébés développent rapidement cette capacité en absorbant les données de leur environnement externe, formant une sorte de « bon sens » sur la dynamique du monde physique. Lorsque les choses ne bougent pas comme prévu - par exemple, dans des tours de magie où des objets disparaissent - ils montreront de la surprise.

Pour l'IA, c'est une toute autre affaire. Alors que les modèles d'IA récents ont déjà battu les humains du jeu à la résolution de problèmes vieux de plusieurs décennies énigmes scientifiques, ils ont encore du mal à développer une intuition sur le monde physique.

Ce mois-ci, les chercheurs de DeepMind, propriété de Google, se sont inspirés de la psychologie du développement et construit une IA qui extrait naturellement des règles simples sur le monde en regardant des vidéos. Netflix et chill ne fonctionnaient pas seuls; le modèle d'IA orien appris les règles de notre monde physique lorsqu'on leur a donné une idée de base des objets, comme quelles sont leurs limites, où ils se trouvent et comment ils se déplacent. Semblable aux bébés, l'IA a exprimé sa «surprise» lorsqu'elle a montré des situations magiques qui n'avaient pas de sens, comme une balle roulant sur une rampe.

Surnommée PLATO (pour Physics Learning through Auto-encoding and Tracking Objects), l'IA était étonnamment flexible. Il lui suffisait d'un ensemble relativement restreint d'exemples pour développer son « intuition ». Une fois qu'il a appris cela, le logiciel a pu généraliser ses prédictions sur la façon dont les choses se déplaçaient et interagissaient avec d'autres objets, ainsi que sur des scénarios jamais rencontrés auparavant.

D'une certaine manière, PLATO atteint le juste milieu entre la nature et l'acquis. Les psychologues du développement se demandent depuis longtemps si l'apprentissage chez les bébés peut être réalisé en trouvant des modèles dans les données des seules expériences. PLATO suggère que la réponse est non, du moins pas pour cette tâche particulière. Les connaissances et l'expérience intégrées sont essentielles pour mener à bien toute l'histoire de l'apprentissage.

Pour être clair, PLATO n'est pas une réplique numérique d'un bébé de trois mois et n'a jamais été conçu pour l'être. Cependant, cela donne un aperçu de la façon dont notre propre esprit se développe potentiellement.

"Le travail… repousse les limites de ce que l'expérience quotidienne peut et ne peut pas expliquer en termes d'intelligence", commenté Drs. Susan Hespos et Apoorva Shivaram, respectivement de la Northwestern University et de la Western Sydney University, qui n'ont pas participé à l'étude. Cela peut "nous dire comment construire de meilleurs modèles informatiques qui simulent l'esprit humain".

L'énigme du bon sens

À seulement trois mois, la plupart des bébés ne broncheront pas s'ils laissent tomber un jouet et qu'il tombe par terre; ils ont déjà compris le concept de gravité.

La façon dont cela se produit est toujours déroutante, mais il y a quelques idées. À cet âge, les bébés ont encore du mal à se tortiller, à ramper ou à se déplacer. Leur apport du monde extérieur se fait principalement par l'observation. C'est une excellente nouvelle pour l'IA : cela signifie que plutôt que de construire des robots pour explorer physiquement leur environnement, il est possible d'imprégner un sens de la physique dans l'IA à travers des vidéos.

C'est une théorie approuvée par le Dr Yann LeCun, un expert en IA de premier plan et scientifique en chef de l'IA chez Meta. Dans une conférence de 2019, il a postulé que les bébés apprennent probablement par l'observation. Leurs cerveaux s'appuient sur ces données pour former une idée conceptuelle de la réalité. En revanche, même les modèles d'apprentissage en profondeur les plus sophistiqués ont encore du mal à se faire une idée de notre monde physique, ce qui limite leur capacité à interagir avec le monde, ce qui en fait presque littéralement des esprits dans les nuages.

Alors, comment mesurez-vous la compréhension d'un bébé de la physique quotidienne ? "Heureusement pour nous, les psychologues du développement ont passé des décennies à étudier ce que les nourrissons savent du monde physique", écrit scientifique principal, le Dr Luis Piloto. Un test particulièrement puissant est le paradigme de la violation des attentes (VoE). Montrez à un bébé une balle roulant sur une colline, disparaissant au hasard ou allant soudainement dans la direction opposée, et le bébé fixera l'anomalie plus longtemps qu'il ne le ferait s'il observait ses attentes normales. Quelque chose d'étrange se prépare.

Space Oddity

Dans la nouvelle étude, l'équipe a adapté la VoE pour tester l'IA. Ils ont abordé cinq concepts physiques différents pour construire PLATO. Parmi ceux-ci figurent la solidité, c'est-à-dire que deux objets ne peuvent pas passer l'un à travers l'autre ; et la continuité – l'idée que les choses existent et ne s'effacent pas même lorsqu'elles sont cachées par un autre objet (le test du « coup d'œil »).

Pour construire PLATO, l'équipe a d'abord commencé avec une méthode standard en IA avec une approche à deux volets. Un composant, le modèle perceptif, prend des données visuelles pour analyser des objets discrets dans une image. Vient ensuite le prédicteur dynamique, qui utilise un réseau de neurones pour considérer l'historique des objets précédents et prédire le comportement du suivant. En d'autres termes, le modèle construit une sorte de "moteur physique" qui cartographie des objets ou des scénarios et devine comment quelque chose se comporterait dans la vie réelle. Cette configuration a donné à PLATO une première idée des propriétés physiques des objets, telles que leur position et la vitesse à laquelle ils se déplacent.

Vient ensuite la formation. L'équipe a montré à PLATO moins de 30 heures de vidéos synthétiques d'un ensemble de données open source. Ce ne sont pas des vidéos d'événements réels. Imaginez plutôt des animations en blocs de type Nintendo à l'ancienne d'une balle roulant sur une rampe, rebondissant dans une autre balle ou disparaissant soudainement. PLATO a finalement appris à prédire comment un seul objet se déplacerait dans l'image vidéo suivante, et a également mis à jour sa mémoire pour cet objet. Avec l'entraînement, ses prédictions sur la prochaine "scène" sont devenues plus précises.

L'équipe a ensuite jeté une clé dans les rayons. Ils ont présenté à PLATON à la fois une scène normale et une scène impossible, comme une balle qui disparaît soudainement. En mesurant la différence entre l'événement réel et les prédictions de PLATO, l'équipe a pu mesurer le niveau de «surprise» de l'IA, qui a explosé pour les événements magiques.

L'apprentissage s'est généralisé à d'autres objets en mouvement. Défié avec un ensemble de données complètement différent développé par le MIT, mettant en vedette, entre autres, des lapins et des quilles, PLATO a savamment discriminé les événements impossibles et réalistes. PLATON n'avait jamais "vu" un lapin auparavant, mais sans aucun réentraînement, il a montré sa surprise lorsqu'un lapin a défié les lois de la physique. Semblable aux bébés, PLATO a pu capturer son intuition physique avec aussi peu que 28 heures de formation vidéo.

Pour Hespos et Shivaram, "Ces résultats sont également parallèles aux caractéristiques que nous voyons dans les études sur les nourrissons."

Intuition numérique

PLATO n'est pas conçu comme un modèle d'IA pour le raisonnement infantile. Mais cela montre que puiser dans nos cerveaux de bébé en plein essor peut inspirer aux ordinateurs un sens de la physique, même lorsque le «cerveau» logiciel est littéralement piégé dans une boîte. Il ne s'agit pas seulement de construire des robots humanoïdes. Des prothèses aux voitures autonomes, une compréhension intuitive du monde physique relie le monde numérique amorphe des 0 et des 1 à la réalité quotidienne et banale.

Ce n'est pas la première fois que les scientifiques de l'IA pensent à dynamiser les esprits des machines avec une touche d'ingéniosité pour les tout-petits. Une idée est de donner à l'IA un sens de la théorie de l'esprit - la capacité de se distinguer des autres et de pouvoir s'imaginer à la place des autres. C'est une capacité qui vient naturellement chez les enfants d'environ quatre ans, et si elle est intégrée dans les modèles d'IA, elle pourrait considérablement l'aider à comprendre les interactions sociales.

La nouvelle étude s'appuie sur nos premiers mois de vie en tant que ressource riche pour développer l'IA avec bon sens. Pour l'instant, le domaine n'en est qu'à ses balbutiements. Les auteurs publient leur ensemble de données pour que d'autres puissent s'appuyer sur et explorer la capacité d'un modèle d'IA à interagir avec des concepts physiques plus complexes, y compris des vidéos du monde réel. Pour l'instant, "ces études pourraient constituer une opportunité synergique entre l'IA et la science du développement", ont déclaré Hespos et Shivaram.

Crédit image: ledanw De Pixabay

Horodatage:

Plus de Singularity Hub