Lupaukset ja sudenkuopat Kertomus – Osa yksi » CCC-blogi

Lupaukset ja sudenkuopat Kertomus – Osa yksi » CCC-blogi

CCC tuki kolmea tieteellistä istuntoa tämän vuoden AAAS-vuosikonferenssissa, ja jos et päässyt osallistumaan henkilökohtaisesti, teemme yhteenvedon jokaisesta istunnosta. Tällä viikolla teemme yhteenvedon istunnon kohokohdista "Generatiivinen tekoäly tieteessä: lupaukset ja sudenkuopat.” Ensimmäisessä osassa teemme yhteenvedon tohtori Rebecca Willettin johdannosta ja esityksestä.

CCC:n vuoden 2024 vuosikokouksen ensimmäinen AAAS-paneeli pidettiin perjantaina 16. helmikuuta, konferenssin toisena päivänä. Paneeli, moderaattori CCC:n oma Tohtori Matthew Turk, Chicagon Toyota Technological Instituten johtaja, koostui asiantuntijoista, jotka soveltavat tekoälyä useilla tieteenaloilla. Tohtori Rebecca Willett, tilastotieteen ja tietojenkäsittelytieteen professori Chicagon yliopistosta, keskittyi esityksessään siihen, miten generatiivisia malleja voidaan käyttää tieteissä ja miksi valmiit mallit eivät riitä tieteelliseen tutkimukseen. Tohtori Markus Buehler, tekniikan professori Massachusetts Institute of Technologysta, puhui generatiivisista malleista sovellettaessa materiaalitieteitä, ja Tohtori Duncan Watson-Parris, apulaisprofessori Scripps Institution of Oceanographyssa ja Halıcıoğlu Data Science Institutessa UC San Diegossa, keskusteltiin siitä, miten generatiivisia malleja voidaan käyttää ilmastotieteiden tutkimisessa.

Dr. Turk, tietokonenäön ja ihmisen ja tietokoneen välisen vuorovaikutuksen asiantuntija, aloitti paneelin erottamalla generatiivisen tekoälyn kaikesta tekoälystä. "Generatiivisten tekoälysovellusten ytimessä ovat generatiiviset mallit, jotka koostuvat syistä hermoverkoista, jotka oppivat laajan harjoitusdatan rakenteen ja luovat sitten uutta dataa oppimansa perusteella."

Tohtori Turk hahmotteli myös yleisiä generatiivisia järjestelmiä koskevia huolenaiheita, jotka johtuvat sekä järjestelmien itsensä vioista, kuten olemattomista lakitekstejä lainaavista järjestelmistä, että myös siitä, että huonot toimijat käyttävät niitä väärennetyn sisällön, kuten väärennetyn äänen tai äänen tai muun luomiseen. video poliitikoista tai julkkiksista.

"Erityisesti", tohtori Turk sanoi, "tämä istunto keskittyy generatiivisen tekoälyn käyttöön tieteessä, sekä muuntavana voimana tieteen tavoittelussa että myös mahdollisena häiriöriskinä."

Tohtori Rebecca Willett aloitti esityksensä hahmottelemalla, kuinka generatiivista tekoälyä voidaan hyödyntää tukemaan tieteellistä löytöprosessia. Hän keskittyi ensin generatiivisten mallien toimintaan. Alla oleva kuva tohtori Willettin dioista näyttää, kuinka kielimalli, kuten ChatGPT, arvioi sanan esiintymistodennäköisyyden, kun otetaan huomioon aikaisempi sanajoukko, ja kuinka kuvanmuodostusmalli, kuten DALL-E 2, luo kuvan annetusta kehotteesta käyttämällä harjoituksen aikana miljardeista kuvista opittuja todennäköisyysjakaumia.

Lupaukset ja sudenkuopat Kertomus – Osa yksi » CCC-blogi PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

"Tällä kaikkien generatiivisten mallien taustalla olevalla todennäköisyysjakaumien periaatteella näitä malleja voidaan soveltaa tieteiden kuukautisideoihin, kuten mahdollisten ilmastoskenaarioiden luomiseen nykyisen ilmaston ja mahdollisen politiikan perusteella tai uusien mikrobiomien luomiseen kohdistetuilla toiminnallisuuksilla, kuten esim. joka on erityisen tehokas muovien hajottamisessa”, sanoo tohtori Willett.

Ei kuitenkaan riitä, että tieteelliseen tutkimukseen käytetään valmiita generatiivisia työkaluja, kuten ChatGPT tai DALL-E 2. Nämä työkalut luotiin ympäristössä, joka on hyvin erilainen kuin tiedemiesten toimintaympäristö. Yksi ilmeinen ero hyllystä valmistetun generatiivisen mallin ja tieteellisen mallin välillä on data. Tieteessä on usein hyvin vähän tietoa hypoteesien perustamiseen. Tieteelliset tiedot saadaan tyypillisesti simulaatioista ja kokeista, jotka molemmat ovat usein kalliita ja aikaa vieviä. Näiden rajoitusten vuoksi tutkijoiden on valittava huolellisesti, mitkä kokeet suoritetaan ja miten näiden järjestelmien tehokkuus ja käyttökelpoisuus voidaan maksimoida. Sitä vastoin valmiit mallit antavat paljon vähemmän merkitystä sille, mistä tiedot ovat peräisin, sen sijaan, että ne maksimoivat datan määrän, jota ne voivat käyttää. Tieteessä aineistojen tarkkuus ja niiden alkuperä ovat uskomattoman tärkeitä, koska tutkijoiden on perusteltava tutkimuksensa vankalla empiirisellä todisteella.

"Lisäksi tieteissä tavoitteemme ovat erilaiset kuin pelkkä uskottavien asioiden tuottaminen", sanoo tohtori Willett. "Meidän on ymmärrettävä, miten asiat toimivat tähän mennessä havaitsemiemme rajojen ulkopuolella." Tämä lähestymistapa on ristiriidassa generatiivisten tekoälymallien kanssa, jotka käsittelevät dataa edustavana kaikkia todennäköisiä havaintoja. Fyysisten mallien ja rajoitusten sisällyttäminen generatiiviseen tekoälyyn auttaa varmistamaan, että se edustaa paremmin fyysisiä ilmiöitä.

Tieteellisten mallien tulee myös pystyä vangitsemaan harvinaisia ​​tapahtumia. "Voimme turvallisesti jättää huomioimatta monia harvinaisia ​​tapahtumia, kun harjoittelemme ChatGPT:tä, mutta sitä vastoin harvinaiset tapahtumat ovat usein se, mistä välitämme eniten tieteen kontekstissa, kuten ilmastomallissa, joka ennustaa harvinaisia ​​sääilmiöitä. Jos käytämme generatiivista mallia, joka välttää harvinaiset tapahtumat ja ei esimerkiksi koskaan ennusta hurrikaania, tämä malli ei ole kovin hyödyllinen käytännössä."

Haasteena on kehittää generatiivisia tekoälymalleja kaoottisille prosesseille, jotka ovat herkkiä alkuolosuhteille. Tri Willett näytti alla olevan videon, jossa näkyy kaksi hiukkasta liikkuvan avaruudessa Lorenz 63 -yhtälöiden mukaisesti. Nämä yhtälöt ovat deterministisiä, eivät satunnaisia, mutta kun otetaan huomioon kaksi hieman erilaista aloituspaikkaa, voit nähdä, että kulloinkin nämä kaksi hiukkasta voivat olla hyvin eri paikoissa. Generatiivisten tekoälymallien kehittäminen, jotka ennustavat tällaisten ilmastotieteessä, turbulenssissa ja verkkodynamiikassa ilmenevien prosessien tarkan kulun, on pohjimmiltaan vaikeaa, mutta uudet lähestymistavat generatiiviseen mallinnukseen voivat varmistaa, että generoidut prosessit jakavat keskeiset tilastolliset ominaisuudet todellisen tieteellisen tiedon kanssa.

[Upotetun sisällön]

Lopuksi tohtori Willett käsitteli sitä tosiasiaa, että tieteellinen tieto kattaa usein valtavan valikoiman tilallisia ja ajallisia mittakaavoja. Esimerkiksi materiaalitieteessä tutkijat tutkivat materiaaleja nanometrin mittakaavassa monymeerien osalta aina laajamittaiseen järjestelmään, kuten koko lentokoneeseen asti. "Tämä asteikkoalue on hyvin erilainen kuin valmiissa malleissa käytetyt tiedot, ja meidän on harkittava, kuinka rakennamme näitä generatiivisia malleja tavalla, joka vaikuttaa tarkasti näihin asteikkojen välisiin vuorovaikutuksiin."

"Generatiiviset mallit ovat tieteen tulevaisuus", sanoo tohtori Willett, "mutta varmistaaksemme niiden tehokkaan käytön meidän on edistyttävä tekoälyssä ja mennä pidemmälle kuin liittämällä tietoja ChatGPT:hen".

Kiitos paljon lukemisesta. Ole hyvä ja kuuntele huomenna lukeaksesi yhteenveto tohtori Markus Buehlerin esityksestä Generatiivinen tekoäly mechanobiologiassa.

Aikaleima:

Lisää aiheesta CCC blogi