Povzetek obljub in pasti – prvi del » Blog CCC

Povzetek obljub in pasti – prvi del » Blog CCC

CCC je podprl tri znanstvene seje na letošnji letni konferenci AAAS in če se niste mogli udeležiti osebno, bomo povzeli vsako sejo. Ta teden bomo povzeli poudarke seje, “Generativna umetna inteligenca v znanosti: obljube in pasti.” V prvem delu bomo povzeli uvod in predstavitev dr. Rebecce Willett.

Prvi panel CCC AAAS na letnem srečanju 2024 je potekal v petek, 16. februarja, drugi dan konference. Panel, ki ga moderira sam CCC Matej Turk dr, predsednik Toyotinega tehnološkega inštituta v Chicagu, je bil sestavljen iz strokovnjakov, ki uporabljajo umetno inteligenco na različnih znanstvenih področjih. Dr. Rebecca Willett, profesorica statistike in računalništva na Univerzi v Chicagu, je svojo predstavitev osredotočila na to, kako je mogoče generativne modele uporabiti v znanosti in zakaj standardni modeli niso dovolj za uporabo v znanstvenih raziskavah. Markus Buehler, profesor inženiringa na Massachusetts Institute of Technology, je govoril o generativnih modelih v uporabi v znanosti o materialih in Dr. Duncan Watson-Parris, docent na Scripps Institution of Oceanography in Halıcıoğlu Data Science Institute na UC San Diego, razpravljali o tem, kako je mogoče generativne modele uporabiti pri preučevanju podnebnih znanosti.

Dr. Turk, strokovnjak za računalniški vid in interakcijo med človekom in računalnikom, je panel začel z razlikovanjem generativne umetne inteligence od vse umetne inteligence. "V jedru generativnih aplikacij AI so generativni modeli, sestavljeni iz globokih nevronskih mrež, ki se naučijo strukture svojih obsežnih podatkov o usposabljanju in nato ustvarijo nove podatke na podlagi tega, kar so se naučili."

Dr. Turk je izpostavil tudi priljubljene pomisleke glede generativnih sistemov, tako zaradi napak samih sistemov, kot so tisti, ki citirajo neobstoječe pravne dokumente, kot tudi zaradi njihove uporabe s strani slabih akterjev za ustvarjanje lažne vsebine, kot je lažni zvok ali videoposnetkov politikov ali zvezdnikov.

"Natančneje," je dejal dr. Turk, "se bo ta seja osredotočila na uporabo generativne umetne inteligence v znanosti, kot transformativno silo pri prizadevanju za znanost in tudi kot potencialno tveganje motenj."

Dr. Rebecca Willett je svojo predstavitev začela z opisom, kako je mogoče uporabiti generativno umetno inteligenco za podporo procesu znanstvenih odkritij. Najprej se je osredotočila na delovanje generativnih modelov. Spodnja slika iz diapozitivov Dr. Willett prikazuje, kako jezikovni model, kot je ChatGPT, oceni verjetnost, da se beseda pojavi glede na prejšnji niz besed, in kako model za ustvarjanje slike, kot je DALL-E 2, ustvari sliko iz danega poziva z uporabo verjetnostnih porazdelitev, pridobljenih iz milijard slik med usposabljanjem.

Povzetek obljub in pasti – prvi del » CCC Blog PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

»Z uporabo tega načela verjetnostnih porazdelitev, ki je podlaga za vse generativne modele, je te modele mogoče uporabiti za ideje o mesečnih posnetkih v znanosti, kot je ustvarjanje možnih podnebnih scenarijev glede na trenutno podnebje in potencialne politike ali ustvarjanje novih mikrobiomov s ciljno usmerjeno funkcionalnostjo, kot je npr. ki je še posebej učinkovit pri razgradnji plastike,« pravi dr. Willett.

Vendar pa ni dovolj, da za znanstvene raziskave uporabite standardna generativna orodja, kot sta ChatGPT ali DALL-E 2. Ta orodja so bila ustvarjena v okolju, ki se zelo razlikuje od konteksta, v katerem delujejo znanstveniki. Ena očitna razlika med standardnim generativnim modelom in znanstvenim modelom so podatki. V znanosti je pogosto zelo malo podatkov, na katerih bi lahko postavili hipoteze. Znanstveni podatki običajno izhajajo iz simulacij in poskusov, ki so pogosto dragi in dolgotrajni. Zaradi teh omejitev morajo znanstveniki skrbno izbrati, katere poskuse bodo izvajali in kako povečati učinkovitost in uporabnost teh sistemov. Nasprotno pa standardni modeli pripisujejo veliko manj pomembnosti temu, od kod prihajajo podatki, namesto da bi povečali količino podatkov, s katerimi lahko delujejo. V znanosti sta natančnost naborov podatkov in njihov izvor izjemno pomembna, saj morajo znanstveniki svoje raziskave utemeljiti s trdnimi empiričnimi dokazi.

"Poleg tega so v znanosti naši cilji drugačni od zgolj ustvarjanja stvari, ki so verjetne," pravi dr. Willett. "Razumeti moramo, kako stvari delujejo zunaj obsega tega, kar smo do zdaj opazili." Ta pristop je v nasprotju z generativnimi modeli umetne inteligence, ki podatke obravnavajo kot reprezentativne za celoten obseg verjetnih opazovanj. Vključevanje fizičnih modelov in omejitev v generativno umetno inteligenco pomaga zagotoviti, da bo ta bolje predstavljala fizične pojave.

Znanstveni modeli morajo biti tudi sposobni zajeti redke dogodke. »Mnogo redkih dogodkov lahko mirno prezremo, ko treniramo ChatGPT, a nasprotno so redki dogodki tisto, kar nas pogosto najbolj zanima v kontekstu znanosti, na primer v podnebnem modelu, ki napoveduje redke vremenske dogodke. Če uporabimo generativni model, ki se izogiba redkim dogodkom in na primer nikoli ne napove orkana, potem ta model v praksi ne bo zelo uporaben.«

Povezan izziv je razvoj generativnih modelov umetne inteligence za kaotične procese, ki so občutljivi na začetne pogoje. Dr. Willett je prikazal spodnji videoposnetek, ki prikazuje dva delca, ki se gibljeta v prostoru po Lorenzovih 63 enačbah. Te enačbe so deterministične, ne naključne, vendar glede na dve rahlo različni začetni lokaciji lahko vidite, da sta lahko delca v katerem koli trenutku na zelo različnih lokacijah. Razvijanje generativnih modelov umetne inteligence, ki napovedujejo natančen potek takšnih procesov, ki se pojavljajo v znanosti o podnebju, turbulencah in dinamiki omrežja, je v osnovi težko, vendar lahko novi pristopi k generativnemu modeliranju zagotovijo, da imajo ustvarjeni procesi ključne statistične značilnosti z resničnimi znanstvenimi podatki.

[Vgrajeni vsebina]

Na koncu je dr. Willett obravnaval dejstvo, da znanstveni podatki pogosto obsegajo ogromen obseg prostorskih in časovnih lestvic. Na primer, v znanosti o materialih raziskovalci preučujejo materiale na nanometrski lestvici za monomere vse do obsežnega sistema, kot je celotno letalo. "Ta razpon lestvic se zelo razlikuje od podatkov, ki se uporabljajo v standardnih modelih, zato moramo razmisliti, kako gradimo te generativne modele na način, ki natančno vpliva na te interakcije med lestvicami."

"Generativni modeli so prihodnost znanosti," pravi dr. Willett, "toda da bi zagotovili njihovo učinkovito uporabo, moramo bistveno napredovati v AI in preseči vstavljanje podatkov v ChatGPT."

Najlepša hvala za branje in prosimo, da se jutri oglasite in preberete povzetek predstavitve dr. Markusa Buehlerja o Generativni AI v mehanobiologiji.

Časovni žig:

Več od CCC blog