Löften och fallgropar Sammanfattning – del ett » CCC-blogg

Löften och fallgropar Sammanfattning – del ett » CCC-blogg

CCC stödde tre vetenskapliga sessioner vid årets AAAS årliga konferens, och om du inte kunde närvara personligen kommer vi att sammanfatta varje session. Den här veckan kommer vi att sammanfatta sessionens höjdpunkter, "Generativ AI i vetenskap: löften och fallgropar.” I del ett kommer vi att sammanfatta inledningen och presentationen av Dr. Rebecca Willett.

CCC:s första AAAS-panel för årsmötet 2024 ägde rum fredagen den 16 februari, konferensens andra dag. Panelen, modererad av CCC:s egna Dr Matthew Turk, ordförande för Toyota Technological Institute i Chicago, var sammansatt av experter som tillämpar artificiell intelligens på en mängd olika vetenskapliga områden. Dr Rebecca Willett, professor i statistik och datavetenskap vid University of Chicago, fokuserade sin presentation på hur generativa modeller kan användas inom vetenskapen och varför hyllmodeller inte är tillräckliga för att tillämpas på vetenskaplig forskning. Dr Markus Buehler, professor i teknik vid Massachusetts Institute of Technology, talade om generativa modeller som tillämpas på materialvetenskap, och Dr. Duncan Watson-Parris, biträdande professor vid Scripps Institution of Oceanography och Halıcıoğlu Data Science Institute vid UC San Diego, diskuterade hur generativa modeller kan användas för att studera klimatvetenskapen.

Dr. Turk, expert på datorseende och interaktion mellan människa och dator, inledde panelen med att skilja Generativ AI från all AI. "I kärnan av generativa AI-tillämpningar är generativa modeller sammansatta av djupa neurala nätverk som lär sig strukturen på deras voluminösa träningsdata och sedan genererar ny data baserat på vad de har lärt sig."

Dr. Turk beskrev också populära problem med generativa system, både på grund av fel i själva systemen, såsom de som citerar icke-existerande juridiska briefer, och även på grund av att de används av dåliga aktörer för att generera falskt innehåll, såsom falskt ljud eller video av politiker eller kändisar.

"Särskilt", sa Dr. Turk, "kommer den här sessionen att fokusera på användningen av generativ AI i vetenskapen, både som en transformativ kraft i jakten på vetenskap och även som en potentiell risk för störningar."

Dr. Rebecca Willett började sin presentation med att beskriva hur generativ AI kan utnyttjas för att stödja den vetenskapliga upptäcktsprocessen. Hon fokuserade först på hur generativa modeller fungerar. Bilden nedan från Dr. Willetts bilder visar hur en språkmodell, som ChatGPT, utvärderar sannolikheten för att ett ord ska inträffa, givet en tidigare uppsättning ord, och hur en bildgenereringsmodell, som DALL-E 2, genererar en bild från en given prompt med hjälp av sannolikhetsfördelningar som lärts från miljarder bilder under träning.

Löften och fallgropar Sammanfattning – del ett » CCC-bloggen PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

"Genom att använda den här principen om sannolikhetsfördelningar, som ligger till grund för alla generativa modeller, kan dessa modeller appliceras på moonshot-idéer inom vetenskapen, som att generera möjliga klimatscenarier givet det nuvarande klimatet och potentiella policyer, eller generera nya mikrobiomer med riktad funktionalitet, som t.ex. en som är särskilt effektiv på att bryta ner plast”, säger Dr. Willett.

Det räcker dock inte att använda färdiga generativa verktyg, som ChatGPT eller DALL-E 2 för vetenskaplig forskning. Dessa verktyg skapades i en miljö som skiljer sig mycket från det sammanhang där forskare verkar. En uppenbar skillnad mellan en off-the-shelf generativ modell och en vetenskaplig modell är data. Inom vetenskapen finns det ofta väldigt lite data att basera hypoteser på. Vetenskaplig data kommer vanligtvis från simuleringar och experiment, som båda ofta är dyra och tidskrävande. På grund av dessa begränsningar måste forskare noggrant välja vilka experiment som ska köras och hur de ska maximera effektiviteten och användbarheten av dessa system. Off-the-shelf-modeller, däremot, lägger mycket mindre vikt vid var data kommer ifrån istället för att maximera mängden data de kan arbeta med. Inom vetenskapen är datauppsättningarnas noggrannhet och deras ursprung otroligt viktiga, eftersom forskare måste motivera sin forskning med robusta empiriska bevis.

"Dessutom är våra mål inom vetenskapen annorlunda än att bara producera saker som är rimliga", säger Dr. Willett. "Vi måste förstå hur saker fungerar utanför intervallet för vad vi har observerat hittills." Detta tillvägagångssätt strider mot generativa AI-modeller som behandlar data som representativa för hela spektrumet av troliga observationer. Att införliva fysiska modeller och begränsningar i generativ AI hjälper till att säkerställa att den bättre representerar fysiska fenomen.

Vetenskapliga modeller måste också kunna fånga sällsynta händelser. "Vi kan säkert ignorera många sällsynta händelser när vi tränar ChatGPT, men däremot är sällsynta händelser ofta det vi bryr oss mest om i vetenskapssammanhang, som i en klimatmodell som förutsäger sällsynta väderhändelser. Om vi ​​använder en generativ modell som undviker sällsynta händelser och till exempel aldrig förutsäger en orkan, kommer denna modell inte att vara särskilt användbar i praktiken.”

En relaterad utmaning är att utveckla generativa AI-modeller för kaotiska processer, som är känsliga för initiala förhållanden. Dr. Willett visade videon nedan, som visar två partiklar som rör sig i rymden enligt Lorenz 63-ekvationerna. Dessa ekvationer är deterministiska, inte slumpmässiga, men givet två lite olika startplatser kan du se att de två partiklarna vid varje given tidpunkt kan vara på väldigt olika platser. Att utveckla generativa AI-modeller som förutsäger det exakta förloppet av sådana processer, som uppstår inom klimatvetenskap, turbulens och nätverksdynamik, är i grunden svårt, men nya tillvägagångssätt för generativ modellering kan säkerställa att genererade processer delar viktiga statistiska egenskaper med riktiga vetenskapliga data.

[Inbäddat innehåll]

Slutligen tog Dr. Willett upp det faktum att vetenskapliga data ofta spänner över ett enormt spektrum av rumsliga och tidsmässiga skalor. Till exempel inom materialvetenskap studerar forskare material på nanometerskala för monymer ända upp till det storskaliga systemet, som ett helt flygplan. "Det intervallet av skalor skiljer sig mycket från data som används i standardmodeller, och vi måste överväga hur vi bygger upp dessa generativa modeller på ett sätt som exakt påverkar dessa interaktioner mellan skalor."

"Generativa modeller är vetenskapens framtid", säger Dr. Willett, "men för att säkerställa att de används effektivt måste vi göra grundläggande framsteg inom AI och gå längre än att koppla in data till ChatGPT".

Tack så mycket för att du läser, och vänligen lyssna i morgon för att läsa sammanfattningen av Dr. Markus Buehlers presentation om Generativ AI i mekanobiologi.

Tidsstämpel:

Mer från CCC blogg