Promises And Pitfalls Recap – Part One

Taasavaldanud Platon

järgijaid: 0

CCC toetas selle aasta AAAS-i aastakonverentsil kolme teaduslikku seanssi ja kui te ei saanud isiklikult osaleda, teeme iga seansi kokkuvõtte. Sel nädalal teeme kokkuvõtte seansi tipphetkedest, "Generatiivne AI teaduses: lubadused ja lõksud.” Esimeses osas teeme kokkuvõtte sissejuhatusest ja dr Rebecca Willetti ettekandest.

CCC 2024. aasta aastakoosoleku esimene AAAS-paneel toimus reedel, 16. veebruaril, konverentsi teisel päeval. Paneel, mida modereerib CCC oma Dr Matthew Turk, Chicago Toyota Tehnoloogiainstituudi president, koosnes ekspertidest, kes rakendavad tehisintellekti erinevates teadusvaldkondades. Dr Rebecca Willett, Chicago ülikooli statistika ja arvutiteaduse professor, keskendus oma ettekandes sellele, kuidas generatiivseid mudeleid saab teaduses kasutada ja miks ei piisa valmismudelitest teadusuuringutes rakendamiseks. Dr Markus Buehler, Massachusettsi Tehnoloogiainstituudi inseneriprofessor, rääkis generatiivsetest mudelitest, mida kasutatakse materjaliteaduses, ja Dr Duncan Watson-Parris, dotsent Scrippsi okeanograafiainstituudis ja Halıcıoğlu andmeteaduse instituudis UC San Diegos, arutati, kuidas generatiivseid mudeleid saab kasutada kliimateaduste uurimisel.

Dr Turk, arvutinägemise ja inimese ja arvuti interaktsiooni ekspert, alustas paneeli eristamisega generatiivset tehisintellekti kogu tehisintellektist. "Generatiivsete AI-rakenduste keskmes on generatiivsed mudelid, mis koosnevad sügavatest närvivõrkudest, mis õpivad tundma oma mahukate koolitusandmete struktuuri ja genereerivad seejärel õpitu põhjal uusi andmeid."

Dr Turk tõi välja ka generatiivsete süsteemidega seotud populaarsed probleemid, mis on tingitud nii süsteemide endi tõrgetest, nagu need, mis tsiteerivad olematuid juriidilisi juhendeid, kui ka seetõttu, et halvad osalejad kasutavad neid võltssisu, näiteks võltsheli või heli loomiseks. video poliitikutest või kuulsustest.

"Konkreetselt," ütles dr Turk, "see seanss keskendub generatiivse tehisintellekti kasutamisele teaduses nii teaduse poole püüdlemise transformeeriva jõuna kui ka potentsiaalse katkestusriskina."

Dr Rebecca Willett alustas oma ettekannet kirjeldades, kuidas generatiivset tehisintellekti saab teadusliku avastamise protsessi toetamiseks kasutada. Ta keskendus kõigepealt sellele, kuidas generatiivsed mudelid töötavad. Allolev pilt dr Willetti slaididelt näitab, kuidas keelemudel, näiteks ChatGPT, hindab sõna esinemise tõenäosust, arvestades eelnevat sõnade komplekti, ja kuidas kujutise genereerimise mudel, nagu DALL-E 2, kujutise genereerib. antud viipast, kasutades treeningu ajal miljarditelt piltidelt õpitud tõenäosusjaotust.

Promises and Pitfalls Recap – Part One » CCC Blog PlatoBlockchain Data Intelligence. Vertical Search. Ai.

"Kasutades seda tõenäosusjaotuse põhimõtet, mis on kõigi generatiivsete mudelite aluseks, saab neid mudeleid rakendada teaduse moonshot ideede jaoks, näiteks võimalike kliimastsenaariumide loomine, võttes arvesse praegust kliimat ja potentsiaalset poliitikat, või uute sihitud funktsionaalsusega mikrobioomide loomine, näiteks üks, mis on eriti tõhus plastide lõhustamisel,” ütleb dr Willett.

Siiski ei piisa, kui kasutada teadusuuringuteks valmis generatiivseid tööriistu, nagu ChatGPT või DALL-E 2. Need tööriistad loodi keskkonnas, mis erineb teadlaste tegutsemiskontekstist. Üks ilmne erinevus valmis generatiivse mudeli ja teadusliku mudeli vahel on andmed. Teaduses on sageli väga vähe andmeid, millele hüpoteese rajada. Teaduslikud andmed pärinevad tavaliselt simulatsioonidest ja katsetest, mis mõlemad on sageli kallid ja aeganõudvad. Nende piirangute tõttu peavad teadlased hoolikalt valima, milliseid katseid läbi viia ja kuidas nende süsteemide tõhusust ja kasulikkust maksimeerida. Seevastu valmismudelid omistavad andmete päritolule palju vähem tähtsust, eelistades maksimeerida andmemahtu, millega nad saavad töötada. Teaduses on andmekogumite täpsus ja nende päritolu uskumatult olulised, sest teadlased peavad oma uurimistööd põhjendama tugevate empiiriliste tõenditega.

"Lisaks on meie eesmärgid teaduses teised kui lihtsalt usutavate asjade tootmine," ütleb dr Willett. "Peame mõistma, kuidas asjad toimivad väljaspool seda, mida oleme seni jälginud." See lähenemisviis on vastuolus generatiivsete tehisintellekti mudelitega, mis käsitlevad andmeid tõenäoliste vaatluste kogu valikut. Füüsiliste mudelite ja piirangute kaasamine generatiivsesse AI-sse aitab tagada, et see kajastab paremini füüsilisi nähtusi.

Teaduslikud mudelid peavad olema võimelised jäädvustama ka haruldasi sündmusi. "Me võime ChatGPT-d treenides ohutult ignoreerida paljusid haruldasi sündmusi, kuid seevastu on haruldased sündmused sageli need, millest me teaduse kontekstis kõige rohkem hoolime, näiteks kliimamudelis, mis ennustab haruldasi ilmastikunähtusi. Kui kasutame generatiivset mudelit, mis väldib haruldasi sündmusi ja näiteks ei ennusta kunagi orkaani, ei ole see mudel praktikas eriti kasulik.

Seotud väljakutse on generatiivsete AI mudelite väljatöötamine kaootiliste protsesside jaoks, mis on tundlikud algtingimuste suhtes. Dr Willett kuvas allolevat videot, mis näitab kahte osakest, mis liiguvad ruumis vastavalt Lorenz 63 võrranditele. Need võrrandid on deterministlikud, mitte juhuslikud, kuid arvestades kahte veidi erinevat lähtekohta, näete, et igal ajahetkel võivad need kaks osakest olla väga erinevates asukohtades. Generatiivsete tehisintellekti mudelite väljatöötamine, mis ennustavad selliste protsesside täpset kulgu, mis tekivad kliimateaduses, turbulentsis ja võrgudünaamikas, on põhimõtteliselt raske, kuid uudsed lähenemisviisid generatiivsele modelleerimisele võivad tagada, et loodud protsessid jagavad põhilisi statistilisi omadusi tegelike teaduslike andmetega.

[Varjatud sisu]

Lõpuks käsitles dr Willett tõsiasja, et teaduslikud andmed hõlmavad sageli tohutult erinevaid ruumilisi ja ajalisi skaalasid. Näiteks materjaliteaduses uurivad teadlased materjale nanomeetri skaalal monomeeride jaoks kuni suuremahulise süsteemini, näiteks terve lennukini. "See skaalade vahemik on väga erinev valmismudelites kasutatavatest andmetest ja me peame kaaluma, kuidas me loome neid generatiivseid mudeleid viisil, mis mõjutab täpselt neid skaaladevahelisi koostoimeid."

"Generatiivsed mudelid on teaduse tulevik," ütleb dr Willett, "kuid nende tõhusa kasutamise tagamiseks peame tegema tehisintellektis olulisi edusamme ja minema kaugemale andmete ühendamisest ChatGPT-ga."

Tänan teid väga lugemise eest ja kuulake homme, et lugeda kokkuvõtet dr Markus Buehleri ettekandest Generative AI in Mechanobiology.