Børneerfaring lærer AI at forstå og tale sprog

Børneerfaring lærer AI at forstå og tale sprog

Child Experience Teaches AI to Understand and Speak Language PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Forskere trænede en AI på headcam-optagelser fra et barns perspektiv, hvilket gjorde det muligt for det at lære ord og begreber fra barnets miljø. 

Børn er bedre til at lære end selv de allerbedste store sprogmodeller. ChatGPT blev trænet i massive datasæt indeholdende millioner eller endda en billion ord til at skrive på acceptabelt engelsk. 

Når børn er i en alder af tre, kan de kommunikere på sofistikerede måder, selvom de kun har adgang til en lille brøkdel af disse data.

En gruppe akademikere ved New York University overvejede dog, om kunstig intelligens (AI) kan lære som en baby. Brenden Sø, en forfatter til undersøgelsen og en computerkognitiv videnskabsmand ved New York University, sagde, at AI-modellen formåede at matche ord med de objekter, de repræsenterer. Ifølge ham er der nok data, selv i denne blip af barnets oplevelse, til at det kan udføre ægte ordindlæring.

Eksperimentet

Forskerne brugte 61 timers optagelser fra et australsk barns hjelmkamera til denne undersøgelse. I halvandet år, fra han var seks måneder gammel til lige efter sin anden fødselsdag, bar det barn, Sam, kameraet med mellemrum. 

Omkring én procent af Sams vågne timer blev brugt på at se på og være opmærksom på, hvad der blev optaget på video. Sams to katte, forældre, legetøj og tremmeseng, hjem, mad og andre ting blev alle dokumenteret. Lake forklarede, at dette datasæt var unikt. Ifølge ham er dette det mest ligefremme syn, de nogensinde har haft af, hvad der er tilgængeligt for et enkelt barn.

For at træne modellen brugte Lake og hans kolleger 600,000 videorammer og 37,500 "ytringer" - sætninger, som Sams forældre eller andre personer i rummet sagde, da billedet blev taget. Indimellem matchede emnerne og ordene. Det gjorde de ikke altid. For eksempel bemærker en forælder: "Du kan lide strengen", mens Sam undersøger en formsorterer i et stillbillede. "Du vil også have blokkene," tilføjer en forælder og peger på en anden voksen hånd, der dækker nogle blokke.

Stikord givet af holdet

Holdet gav to stikord til modellen. Ord og objekter, der vises sammen, kan indikere, at de kan være forbundet. Det er dog et tegn på, at de ikke er et match, når de ikke sker sammen.

Wai Keen Vong, forfatteren af ​​undersøgelsen og en computerkognitiv videnskabsmand ved New York University, sagde, at de har denne form for sammentrækning og skubbe fra hinanden, som forekommer i modellen. Han fortsatte med at sige, at håbet er, at der er nok tilfælde i dataene, hvor barnet, når forælderen siger ordet 'bold', ser en bold.

Selvom det kan virke ligetil, kræver det arbejde at matche ord til det objekt, de repræsenterer. For at få en idé om problemet, forestil dig stuen til en familie med små børn. Ud over de typiske stuemøbler har den en del rod. Legetøj er overalt på gulvet. Der er farveblyanter over hele sofabordet. En snackkop er placeret på kanten, og en stol har vasketøj. Et lille barn kan forbinde ordet "bold" med en bold, hvis de hører det. Det kan dog også referere til ethvert andet legetøj, sofaen, bukserne eller en genstands form, farve eller tidspunkt på dagen. Ifølge Lake kan ethvert ord have et uendeligt antal betydninger.

Tidsstempel:

Mere fra MetaNews