Recapitulare promisiuni și capcane – Partea întâi » Blogul CCC

Recapitulare promisiuni și capcane – Partea întâi » Blogul CCC

CCC a susținut trei sesiuni științifice la Conferința anuală AAAS din acest an și, în cazul în care nu ați putut participa în persoană, vom recapitula fiecare sesiune. Săptămâna aceasta, vom rezuma cele mai importante momente ale sesiunii, „AI generativă în știință: promisiuni și capcane.” În prima parte, vom rezuma introducerea și prezentarea dr. Rebecca Willett.

Primul panel AAAS al CCC al reuniunii anuale din 2024 a avut loc vineri, 16 februarie, a doua zi a conferinței. Panelul, moderat de cei de la CCC Dr. Matthew Turk, președintele Institutului Tehnologic Toyota din Chicago, a fost compus din experți care aplică inteligența artificială într-o varietate de domenii științifice. Dr. Rebecca Willett, profesor de statistică și informatică la Universitatea din Chicago, și-a concentrat prezentarea asupra modului în care modelele generative pot fi utilizate în științe și de ce modelele standard nu sunt suficiente pentru a fi aplicate cercetării științifice. Dr. Markus Buehler, profesor de inginerie la Institutul de Tehnologie din Massachusetts, a vorbit despre modelele generative aplicate științei materialelor și Dr. Duncan Watson-Parris, profesor asistent la Scripps Institution of Oceanography și Halıcıoğlu Data Science Institute din UC San Diego, a discutat despre modul în care modelele generative pot fi utilizate în studiul științelor climatice.

Dr. Turk, un expert în viziunea computerizată și interacțiunea om-calculator, a început panoul prin a distinge AI generativă de toată IA. „La baza aplicațiilor AI generative sunt modele generative compuse din rețele neuronale profunde care învață structura datelor lor voluminoase de antrenament și apoi generează date noi pe baza a ceea ce au învățat.”

Dr. Turk a subliniat, de asemenea, preocupările populare cu sistemele generative, atât din cauza defecțiunilor sistemelor în sine, cum ar fi cele care citează documente legale inexistente, cât și din cauza utilizării lor de către actori răi pentru a genera conținut fals, cum ar fi cel al audio fals sau video cu politicieni sau celebrități.

„În mod specific”, a spus dr. Turk, „această sesiune se va concentra pe utilizarea IA generativă în știință, atât ca forță transformatoare în urmărirea științei, cât și ca risc potențial de perturbare.”

Dr. Rebecca Willett și-a început prezentarea subliniind modul în care IA generativă poate fi folosită pentru a sprijini procesul de descoperire științifică. Ea sa concentrat mai întâi pe modul în care funcționează modelele generative. Imaginea de mai jos din diapozitivele Dr. Willett afișează modul în care un model de limbă, cum ar fi ChatGPT, evaluează probabilitatea de apariție a unui cuvânt, având în vedere un set anterior de cuvinte și modul în care un model de generare de imagini, cum ar fi DALL-E 2, generează o imagine. dintr-un prompt dat folosind distribuțiile de probabilitate învățate din miliarde de imagini în timpul antrenamentului.

Promises and Pitfalls Recap – Part One » CCC Blog PlatoBlockchain Data Intelligence. Vertical Search. Ai.

„Folosind acest principiu al distribuțiilor de probabilitate, care stă la baza tuturor modelelor generative, aceste modele pot fi aplicate ideilor lunare din științe, cum ar fi generarea de posibile scenarii climatice, având în vedere climatul actual și politicile potențiale, sau generarea de noi microbiomi cu funcționalități țintite, cum ar fi una care este deosebit de eficientă în descompunerea materialelor plastice”, spune dr. Willett.

Cu toate acestea, nu este suficient să folosiți instrumente generative disponibile, cum ar fi ChatGPT sau DALL-E 2 pentru cercetarea științifică. Aceste instrumente au fost create într-un cadru foarte diferit de contextul în care își desfășoară activitatea oamenii de știință. O diferență evidentă între un model generativ standard și un model științific sunt datele. În știință, adesea există foarte puține date pe care să se bazeze ipoteze. Datele științifice provin de obicei din simulări și experimente, ambele fiind adesea costisitoare și consumatoare de timp. Din cauza acestor limitări, oamenii de știință trebuie să aleagă cu atenție ce experimente să ruleze și cum să maximizeze eficiența și utilitatea acestor sisteme. În schimb, modelele standard acordă mult mai puțină importanță de unde provin datele, de preferință maximizarea cantității de date pe care pot opera. În știință, acuratețea seturilor de date și originile lor sunt incredibil de importante, deoarece oamenii de știință trebuie să își justifice cercetările cu dovezi empirice solide.

„În plus, în științe, obiectivele noastre sunt diferite de a produce doar lucruri care sunt plauzibile”, spune dr. Willett. „Trebuie să înțelegem modul în care funcționează lucrurile în afara intervalului a ceea ce am observat până acum.” Această abordare este în contradicție cu modelele AI generative care tratează datele ca fiind reprezentative pentru întreaga gamă de observații probabile. Încorporarea modelelor fizice și a constrângerilor în IA generativă ajută la asigurarea că aceasta va reprezenta mai bine fenomenele fizice.

De asemenea, modelele științifice trebuie să fie capabile să surprindă evenimente rare. „Putem ignora în siguranță o mulțime de evenimente rare atunci când antrenăm ChatGPT, dar, în contrast, evenimentele rare sunt adesea ceea ce ne pasă cel mai mult în contextul științelor, cum ar fi într-un model climatic care prezice evenimente meteorologice rare. Dacă folosim un model generativ care evită evenimente rare și, de exemplu, nu prezice niciodată un uragan, atunci acest model nu va fi foarte util în practică.”

O provocare asociată este dezvoltarea modelelor AI generative pentru procese haotice, care sunt sensibile la condițiile inițiale. Dr. Willett a afișat videoclipul de mai jos, care arată două particule care se mișcă în spațiu conform ecuațiilor Lorenz 63. Aceste ecuații sunt deterministe, nu aleatorii, dar având în vedere două locații de pornire ușor diferite, puteți vedea că, în orice moment, cele două particule se pot afla în locații foarte diferite. Dezvoltarea modelelor AI generative care prezic cursul exact al unor astfel de procese, care apar în știința climatului, turbulențe și dinamica rețelei, este fundamental dificilă, dar abordările noi ale modelării generative pot asigura că procesele generate împărtășesc caracteristici statistice cheie cu date științifice reale.

[Conținutul încorporat]

În cele din urmă, dr. Willett a abordat faptul că datele științifice se întind adesea pe o gamă enormă de scale spațiale și temporale. De exemplu, în știința materialelor, cercetătorii studiază materiale la scara nanometrică pentru monomeri până la sistemul la scară mare, cum ar fi un întreg avion. „Acea gamă de scale este foarte diferită de datele utilizate în modelele standard și trebuie să luăm în considerare modul în care construim aceste modele generative într-un mod care să afecteze cu precizie aceste interacțiuni între scale”.

„Modelele generative sunt viitorul științei”, spune dr. Willett, „dar pentru a ne asigura că sunt utilizate în mod eficient, trebuie să facem progrese fundamentale în AI și să mergem dincolo de conectarea datelor în ChatGPT”.

Vă mulțumesc foarte mult pentru citit și vă rugăm să vă conectați mâine pentru a citi recapitularea prezentării Dr. Markus Buehler despre IA generativă în mecanobiologie.

Timestamp-ul:

Mai mult de la Blog CCC