ChatGPT nadomešča ljudi v študijah človeškega vedenja – in deluje presenetljivo dobro

ChatGPT nadomešča ljudi v študijah človeškega vedenja – in deluje presenetljivo dobro

ChatGPT nadomešča ljudi v študijah o človeškem vedenju – in deluje presenetljivo dobro PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Sem velik oboževalec potovalne oddaje Anthonyja Bourdaina Neznani deli. V vsaki epizodi kuhar obišče oddaljene vasi po vsem svetu in z odprtim srcem in umom dokumentira življenja, hrano in kulturo regionalnih plemen.

Predstava ponuja vpogled v osupljivo raznolikost človeštva. Družboslovci imajo podoben cilj – razumevanje vedenja različnih ljudi, skupin in kultur – vendar uporabljajo različne metode v nadzorovanih situacijah. Za oba so zvezde teh iskanj subjekti: ljudje.

Kaj pa, če bi ljudi zamenjali s klepetalnimi roboti AI?

Ideja se sliši nesmiselno. Vendar pa se zaradi pojava ChatGPT in drugih velikih jezikovnih modelov (LLM) družboslovci spogledujejo z idejo o uporabi teh orodij za hitro sestavo različnih skupin »simuliranih ljudi« in izvajanje poskusov, da bi preiskali njihovo vedenje in vrednote kot približek njihovih bioloških dvojnikov.

Če si predstavljate digitalno poustvarjene človeške ume, to ni to. Ideja je izkoristiti strokovno znanje ChatGPT pri posnemanju človeških odzivov. Ker modeli črpajo ogromne količine spletnih podatkov – bloge, komentarje na YouTubu, leposlovje oboževalcev, knjige – zlahka zajamejo razmerja med besedami v več jezikih. Ti sofisticirani algoritmi lahko tudi dekodirajo niansirane vidike jezika, kot so ironija, sarkazem, metafore in čustveni toni, kritični vidik človeške komunikacije v vsaki kulturi. Te prednosti postavljajo LLM-je tako, da posnemajo več sintetičnih osebnosti s širokim spektrom prepričanj.

Še en bonus? V primerjavi s človeškimi udeleženci se ChatGPT in drugi LLM-ji ne utrudijo, kar znanstvenikom omogoča zbiranje podatkov in preizkušanje teorij o človeškem vedenju z izjemno hitrostjo.

Ideja, čeprav sporna, že ima podporo. Nedavni članek pregled nastajajočega področja je ugotovil, da so v določenih skrbno zasnovanih scenarijih odgovori ChatGPT korelirali z odzivi približno 95 odstotkov človeških udeležencev.

AI "lahko spremeni igro družboslovnih raziskav," je dejal dr. Igorja Grossmana z Univerze Waterloo, ki je s sodelavci pred kratkim napisal članek o pogledu naprej v Znanost. Ključ za uporabo Homo silicus v raziskavi? Previdno upravljanje pristranskosti in zvestoba podatkov, je dejala ekipa.

Preiskovanje človeškega družbenega uma

Kaj pravzaprav je družboslovje?

Preprosto povedano, preučuje, kako se ljudje – bodisi kot posamezniki bodisi kot skupina – obnašajo v različnih okoliščinah, kako medsebojno sodelujejo in se razvijajo kot kultura. Je dežnik akademskega udejstvovanja z več vejami: ekonomijo, politologijo, antropologijo in psihologijo.

Disciplina obravnava široko paleto tem, ki so pomembne v trenutnem duhu časa. Kakšen je vpliv socialnih medijev na duševno zdravje? Kakšen je trenutni odnos javnosti do podnebnih sprememb, ko se poslabšanje vremenskih razmer povečuje? Kako različne kulture cenijo metode komunikacije – in kaj sproža nesporazume?

Družboslovna študija se začne z vprašanjem in hipotezo. Eden mojih najljubših: ali kulture različno prenašajo telesni vonj? (Brez heca, tema so preučevali kar nekaj, in ja, obstaja razlika!)

Znanstveniki nato uporabijo različne metode, kot so vprašalniki, vedenjski testi, opazovanje in modeliranje, da preizkusijo svoje zamisli. Ankete so še posebej priljubljeno orodje, saj je mogoče vprašanja natančno oblikovati in preveriti ter zlahka dosežejo širok krog ljudi, ko jih razdelimo na spletu. Znanstveniki nato analizirajo pisne odgovore in poiščejo vpogled v človeško vedenje. Z drugimi besedami, udeleženčeva uporaba jezika je kritična za te študije.

Torej, kako se ChatGPT prilega?

'Homo Silicus'

Za Grossmana LLM-ji, ki stojijo za chatboti, kot sta ChatGPT ali Googlov Bard, predstavljajo priložnost brez primere za preoblikovanje družboslovnih eksperimentov.

Ker se usposabljajo na ogromnih zbirkah podatkov, LLM "lahko predstavljajo široko paleto človeških izkušenj in perspektiv," so povedali avtorji. Ker modeli prosto »potujejo« brez meja po internetu – kot ljudje, ki pogosto potujejo v tujino – lahko sprejmejo in prikažejo širši razpon odzivov v primerjavi z rekrutiranimi človeškimi subjekti.

ChatGPT prav tako ni pod vplivom drugih članov študije ali utrujenosti, kar mu lahko omogoči ustvarjanje manj pristranskih odgovorov. Te lastnosti so lahko še posebej uporabne pri »projektih z visokim tveganjem« – na primer posnemanje odzivov ljudi, ki živijo v državah v vojni ali pod težkimi režimi, prek objav v družabnih medijih. Po drugi strani bi lahko odzivi posredovali intervencije v resničnem svetu.

Podobno bi lahko magisterji magistrskega študija, usposobljeni za vroče kulturne teme, kot so spolna identiteta ali dezinformacije, reproducirali različne teoretične ali ideološke šole mišljenja, da bi oblikovali politike. Namesto skrbnega anketiranja več sto tisoč človeških udeležencev lahko AI hitro ustvari odgovore na podlagi spletnega diskurza.

Poleg morebitne uporabe v resničnem življenju lahko LLM delujejo tudi kot digitalni subjekti, ki komunicirajo s človeškimi udeleženci v družboslovnih eksperimentih, kar je nekoliko podobno neigralskim likom (NPC) v video igrah. LLM bi lahko na primer prevzel različne »osebnosti« in komuniciral s prostovoljci po vsem svetu na spletu z uporabo besedila, tako da bi jim postavil isto vprašanje. Ker algoritmi ne spijo, lahko deluje 24/7. Dobljeni podatki lahko nato pomagajo znanstvenikom raziskati, kako različne kulture ocenjujejo podobne informacije in kako se mnenja – in dezinformacije – širijo.

Otroški koraki

Zamisel o uporabi chatbotov namesto ljudi v študijah še ni uveljavljena.

Vendar obstajajo zgodnji dokazi, da bi lahko delovalo. A študija prednatisa ki so ga ta mesec objavili Georgia Tech, Microsoft Research in Olin College, so ugotovili, da je LLM ponovil človeške odzive v številnih klasičnih psiholoških poskusih, vključno z zloglasnim Milgramovi šok poskusi.

Vendar ostaja kritično vprašanje: kako dobro lahko ti modeli resnično zajamejo človeški odziv?

Kamnov spotike je več.

Prva je kakovost algoritma in podatkov o usposabljanju. Večino spletnih vsebin prevladuje le peščica jezikov. LLM, ki se je usposabljal na teh podatkih, bi zlahka posnemal čustva, perspektivo ali celo moralno presojo ljudi, ki uporabljajo te jezike – po drugi strani pa bi podedoval pristranskost iz podatkov o usposabljanju.

"Ta reprodukcija pristranskosti je velika skrb, ker bi lahko povečala same razlike, ki si jih družboslovci prizadevajo odkriti v svojih raziskavah," je dejal Grossman.

Nekateri znanstveniki so tudi zaskrbljeni, da so LLM samo regurgitacijo kar jim je povedano. Je antipod družboslovne študije, katere glavna točka je zajeti človeštvo v vsej njegovi raznoliki in kompleksni lepoti. Po drugi strani pa je znano, da ChatGPT in podobni modeli "halucinirati,« izmišljevanje informacij, ki se slišijo verjetne, a so napačne.

Za zdaj se "veliki jezikovni modeli opirajo na 'sence' človeških izkušenj," je dejal Grossman. Ker so ti sistemi umetne inteligence večinoma črne skrinjice, je težko razumeti, kako in zakaj ustvarjajo določene odzive – kar je nekoliko zaskrbljujoče, če jih uporabljamo kot človeški posrednik v vedenjskih poskusih.

Kljub omejitvam "LLM družboslovcem omogoča, da se odmaknejo od tradicionalnih raziskovalnih metod in svojemu delu pristopijo na inovativen način," so povedali avtorji. Kot prvi korak bi Homo silicus lahko pomagal pri razmišljanju in hitrem testiranju hipotez, obetavne pa bi bile dodatno potrjene v človeški populaciji.

Toda da bi družbene vede resnično pozdravile umetno inteligenco, bodo morali obstajati preglednost, pravičnost in enak dostop do teh močnih sistemov. Šolanje LLM-jev je težko in drago, najnovejši modeli pa so vedno bolj zaprti za velikimi plačilnimi zidovi.

"Zagotoviti moramo, da so družboslovni LLM-ji, tako kot vsi znanstveni modeli, odprtokodni, kar pomeni, da so njihovi algoritmi in v idealnem primeru podatki na voljo vsem, da jih natančno pregledajo, testirajo in spreminjajo," je dejal avtorica študije dr. Dawn Parker z Univerze Waterloo. "Samo z ohranjanjem preglednosti in ponovljivosti lahko zagotovimo, da družboslovne raziskave s pomočjo umetne inteligence resnično prispevajo k našemu razumevanju človeških izkušenj."

Kreditno slike: Gerd Altmannpixabay

Časovni žig:

Več od Središče singularnosti