Løfter og faldgruber Recap – Del fire » CCC Blog

Løfter og faldgruber Recap – Del fire » CCC Blog

CCC støttede tre videnskabelige sessioner på dette års AAAS årlige konference. I denne uge vil vi opsummere højdepunkterne fra sessionen, "Generativ AI i videnskab: løfter og faldgruber.” Dette panel, modereret af Dr. Matthew Turk, formand for Toyota Technological Institute i Chicago), fremhævede Dr. Rebecca Willett, professor i statistik og datalogi ved University of Chicago, Dr. Markus Buehler, professor i ingeniørvidenskab ved Massachusetts Institute of Technology, og Dr. Duncan Watson-Parris, assisterende professor ved Scripps Institution of Oceanography og Halıcıoğlu Data Science Institute ved UC San Diego. I fjerde del opsummerer vi spørgsmål og svar-delen af ​​panelet. 

En Q&A-session fulgte paneldeltagerens præsentationer, og Dr. Matthew Turk satte diskussionen i gang. "'Løfter og faldgruber' er i titlen på dette panel. Vi har diskuteret mange af løfterne, men vi har ikke behandlet mange af faldgruberne. Hvad bekymrer dig om fremtiden for generativ AI?”

"Plideligheden og troværdigheden af ​​disse modeller er en stor bekymring", begyndte Dr. Rebecca Wilett. "Disse modeller kan forudsige ting, der er plausible, men som mangler vigtige, fremtrædende elementer; Kan jeg som menneske genkende, at der mangler noget der?”

Dr. Markus Buehler tilføjede, at den faktiske forudsigelse af en model kan tage et sekund, men den eksperimentelle proces med validering kan tage måneder eller et år eller længere. Så hvordan skal vi operere i mellemtiden, når vi ikke har verificeret resultaterne? "Vi er også nødt til at uddanne den næste generation af generative AI-udviklere, så de designer modeller, der er troværdige og verificerbare, og at vi kan bruge fysikbaseret indsigt i vores konstruktion af disse modeller."

Dr. Duncan Watson-Parris byggede på begge de foregående punkter og sagde "Fordi disse modeller er designet til at generere plausible resultater, kan vi ikke bare se på resultaterne for at verificere deres nøjagtighed. Generative AI-forskere skal have en dyb forståelse af, hvordan disse modeller fungerer for at verificere deres resultater, og derfor er det så vigtigt at uddanne den næste generation korrekt."

Publikumsmedlem: "I materialevidenskab kender vi retningen fremad for at studere nogle materialer, men for andre, som f.eks. superledere ved stuetemperatur, ved vi ikke, hvordan vi skal komme videre. Hvordan tror du, at vejen frem i studiet af disse ukendte materialer vil se ud? Og hvordan skal denne type forskning muliggøres fra et regulatorisk synspunkt?”

"Nå, jeg er ikke ekspert i superlederforskning," sagde Dr. Buehler, "så jeg vil ikke tale direkte til det, men jeg kan tale generelt om, hvordan vi gør fremskridt inden for materialevidenskab, specifikt inden for mit proteinområde. og udvikling af biomaterialer. Den måde, vi gør fremskridt på, er at have evnen til at presse rammen. Vi kører nye eksperimenter og tester usædvanlige ideer og teorier og ser, hvilke der virker og hvorfor. Med hensyn til, hvordan vi skal muliggøre denne forskning, har vi brug for flere open source-modeller med kollektiv adgang. Jeg vil opfordre politikerne til ikke at overregulere disse teknologier, således at forskere og offentligheden har adgang til disse typer modeller. Jeg tror ikke, det er en god idé at forhindre folk i at bruge disse modeller, især når vi kan crowdsource ideer og udviklinger og introducere viden fra forskellige områder af menneskelig aktivitet. For eksempel, da trykpressen blev opfundet, forsøgte myndighederne at begrænse tilgængeligheden af ​​denne teknologi, så få bøger kunne læses i massevis, men denne indsats mislykkedes dybt. Den bedste måde at beskytte offentligheden på er at lette adgangen til disse modeller på en sådan måde, at vi kan udvikle, udforske og evaluere dem i vid udstrækning til størst mulig gavn for samfundet."

Publikumsmedlem: "De fleste generative AI-modeller i dag er regressionsmodeller, der fokuserer på at simulere eller emulere forskellige scenarier. Opdagelser i videnskaben er imidlertid drevet af de hypoteser og forudsigelser, vi drømmer om. Så hvordan skaber vi modeller, der er beregnet til at udtænke nye forudsigelser i stedet for de nuværende modeller, som mest bruges til eksperimenter?”

Dr. Buehler svarede først og sagde: "Du har ret, de fleste traditionelle maskinlæringsmodeller er ofte regressionsbaserede, men de modeller, vi talte om i dag, fungerer anderledes. Når du sammensætter multi-agent-systemer med mange muligheder, begynder de faktisk at udforske nye scenarier, og de begynder at ræsonnere og lave forudsigelser baseret på de eksperimenter, de har kørt. De bliver mere menneskelige. Du, som forsker, ville ikke køre et eksperiment og bare være færdig – du ville køre et eksperiment og derefter begynde at se på dataene og validere dem og lave nye forudsigelser baseret på disse data, for at forbinde prikkerne og ekstrapolere ved at lave hypoteser og forestille sig, hvordan et nyt scenarie ville udfolde sig. Du ville eksperimentere, indsamle nye data, udvikle en teori og måske foreslå en integreret ramme om et bestemt emne af interesse. Så ville du forsvare dine ideer mod dine kollegers kritik og måske revidere din hypotese, når ny information bliver brugt. Sådan fungerer nye multi-agent kontradiktoriske systemer, men de supplerer selvfølgelig menneskelige færdigheder med en langt større evne til at ræsonnere over enorme mængder af data og repræsentationer af viden. Disse modeller kan allerede generere nye hypoteser, der skubber rammen langt ud over, hvad der allerede er blevet undersøgt, hvilket bidrager til den videnskabelige proces med opdagelse og innovation."

"Jeg ville supplere det," indskød Dr. Willett, "med området for afslutningsopdagelse og symbolsk regression som et andet område, der er meget mere målrettet mod hypotesegenerering. Der er en masse løbende arbejde i dette rum.”

Publikumsmedlem: "Hvordan øger vi adgangen til disse typer modeller og overvinder forhindringer, som de fleste modeller bliver skabt til engelsktalende?"

Dr. Rebecca Willett svarede og sagde: "Mange mennesker har adgang til at bruge disse modeller, men at designe og træne dem koster mange millioner dollars. Hvis kun et lille sæt organisationer er i stand til at opstille disse modeller, så er det kun et meget lille sæt mennesker, der træffer beslutningerne og prioriterer i det videnskabelige samfund. Og ofte er disse organisationers og enkeltpersoners prioriteter profitdrevet. Når det er sagt, tror jeg, at landskabet begynder at ændre sig. Organisationer som NSF forsøger at bygge infrastruktur, der kan tilgås af det bredere videnskabelige samfund. Denne indsats ligner den tidlige udvikling af supercomputere. I de tidlige dage skulle forskere indsende lange forslag for at få adgang til en supercomputer. Jeg tror, ​​vi kommer til at se lignende nye paradigmer inden for AI og generativ AI."

"Jeg er enig," sagde Dr. Watson-Parris. "Hvis dertil kommer fra en regulatorisk side, så tror jeg ikke, vi skal regulere grundforskningen, måske ansøgningsrummene, men ikke selve forskningen."

Tusind tak fordi du læste med, og følg med for oversigterne over vores to andre paneler på AAAS 2024.

Tidsstempel:

Mere fra CCC blog