Apprentissage actif multi-doigts

image

Il s'agit d'une revue d'un article universitaire de 2020 sur l'utilisation de systèmes d'apprentissage pour entraîner les bras et les mains robotiques à saisir des objets.

Les approches basées sur l'apprentissage pour comprendre la planification sont préférées aux méthodes analytiques en raison de leur capacité à mieux généraliser à de nouveaux objets partiellement observés. Cependant, la collecte de données reste l’un des principaux obstacles aux méthodes d’apprentissage de la préhension, en particulier pour les mains à plusieurs doigts. L'espace de configuration dimensionnel relativement élevé des mains, associé à la diversité des objets courants dans la vie quotidienne, nécessite un nombre important d'échantillons pour produire des classificateurs de réussite de préhension robustes et sûrs. Dans cet article, les chercheurs présentent la première approche active d’apprentissage profond de la saisie qui recherche de manière unifiée l’espace de configuration de la saisie et la confiance du classificateur. Les chercheurs fondent leur approche sur le succès récent de la planification de saisies à plusieurs doigts sous forme d'inférence probabiliste avec une fonction de vraisemblance apprise d'un réseau neuronal. Ils intègrent cela dans une formulation de bandit multi-armés de sélection d’échantillons. Ils montrent que leur approche d’apprentissage actif par saisie utilise moins d’échantillons de formation pour produire des taux de réussite comparables à la méthode d’apprentissage supervisé passif entraînée avec des données de saisie générées par un planificateur analytique. En 2020, les chercheurs montrent par ailleurs que les maîtrises générées par l’apprenant actif présentent une plus grande diversité qualitative et quantitative dans leur forme.

Arxiv – Apprentissage actif à plusieurs doigts

La planification de la compréhension basée sur l'apprentissage est devenue populaire au cours de la dernière décennie, en raison de sa capacité à bien se généraliser à de nouveaux objets avec seulement des informations sur les objets à vue partielle. Ces approches nécessitent de grandes quantités de données pour la formation, en particulier celles qui utilisent des réseaux neuronaux profonds. Cependant, la collecte de données à grande échelle reste un défi pour une compréhension multi-doigts, car (1)
les objets courants dans la vie quotidienne présentent de grandes variations en termes de géométrie, de texture, de propriétés inertielles et d'apparence ; et
(2) la dimension relativement élevée des configurations de préhension à plusieurs doigts (par exemple 22 dimensions pour la configuration de
pose de la main et du poignet dans cet article).

Les nouvelles approches d'apprentissage actif apprennent de manière interactive un modèle de saisie qui couvre mieux l'espace de configuration de saisie sur différents objets en utilisant moins d'échantillons par rapport à un apprenant de saisie passif et supervisé. Au lieu d'induire passivement une hypothèse pour expliquer les données d'entraînement disponibles comme dans l'apprentissage supervisé standard, l'apprentissage actif développe et teste de nouvelles hypothèses de manière continue et interactive.

L'apprentissage actif est plus approprié lorsque 1) les échantillons de données non étiquetés sont nombreux, 2) de nombreuses données étiquetées sont nécessaires pour former un système d'apprentissage supervisé précis et 3) les échantillons de données peuvent être facilement collectés ou synthétisés. L'apprentissage des saisies satisfait chacune de ces conditions : 1) il existe une infinité de saisies possibles, 2) un grand nombre d'échantillons d'entraînement étiquetés sont nécessaires pour couvrir l'espace, et 3) le robot est son propre oracle - il peut essayer une saisie et automatiquement détecter le succès ou l’échec sans étiquetage humain.

Tesla dispose déjà d'un étiquetage automatique des objets dans le monde physique.

Brian Wang est un leader d'opinion futuriste et un blogueur scientifique populaire avec 1 million de lecteurs par mois. Son blog Nextbigfuture.com est classé #1 Science News Blog. Il couvre de nombreuses technologies et tendances de rupture, notamment l'espace, la robotique, l'intelligence artificielle, la médecine, la biotechnologie anti-âge et la nanotechnologie.

Connu pour identifier les technologies de pointe, il est actuellement co-fondateur d'une startup et collecte de fonds pour des entreprises en démarrage à fort potentiel. Il est le responsable de la recherche pour les allocations pour les investissements technologiques en profondeur et un investisseur providentiel chez Space Angels.

Conférencier fréquent dans des entreprises, il a été conférencier TEDx, conférencier de la Singularity University et invité à de nombreuses interviews pour la radio et les podcasts. Il est ouvert aux prises de parole en public et aux missions de conseil.

Horodatage:

Plus de Prochains grands avenirs