Løfter og faldgruber Recap – Anden del » CCC Blog

Løfter og faldgruber Recap – Anden del » CCC Blog

CCC støttede tre videnskabelige sessioner på dette års AAAS årlige konference, og hvis du ikke var i stand til at deltage personligt, vil vi opsummere hver session. I denne uge vil vi opsummere højdepunkterne fra sessionen, "Generativ AI i videnskab: løfter og faldgruber." I anden del vil vi opsummere Dr. Markus Buehlers præsentation om Generativ AI i Mechanobiology.

Dr. Markus Buehler indledte sin præsentation med at adressere, hvordan generative modeller kan anvendes i studiet af materialevidenskab. Historisk set inden for materialevidenskab ville forskere indsamle data eller udvikle ligninger til at beskrive, hvordan materialer opfører sig, og løse dem med pen og papir. Fremkomsten af ​​computere gjorde det muligt for forskere at løse disse ligninger meget hurtigere og behandle meget komplekse systemer, for eksempel ved hjælp af statistisk mekanik. For nogle problemer er traditionel computerkraft dog ikke nok. For eksempel viser billedet nedenfor antallet af mulige konfigurationer af et enkelt lille protein (20 ^100  eller 1.27×10^130 designs). Denne mængde af mulige konfigurationer er større end antallet af atomer i det observerbare univers (10^80 atomer), hvilket gør dette problem uløseligt for selv de største supercomputere. 

Promises and Pitfalls Recap – Part Two » CCC Blog PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Før generative modeller var ligningerne og algoritmerne skabt af videnskabsmænd begrænset af en bestemt karakteristik, der blev delt af alle forskere siden tidens begyndelse: menneskeheden. "Generativ AI giver os mulighed for at gå ud over den menneskelige fantasi, så vi kan opfinde og opdage ting, som vi hidtil ikke har været i stand til, enten fordi vi ikke er kloge nok, eller fordi vi ikke har kapaciteten til at have adgang til alle datapunkter på samme tid,” siger Dr. Buehler. "Generativ AI kan bruges til at identificere nye ligninger og algoritmer og kan løse disse ligninger for os. Desuden kan generative modeller også forklare os, hvordan de udviklede og løste disse ligninger, som på høje niveauer af kompleksitet er absolut nødvendige for, at forskere kan forstå modellers 'tankeprocesser'.” Et centralt aspekt af, hvordan disse modeller fungerer, er ved at omsætte information (f.eks. resultater af målinger) til viden ved at lære en grafisk repræsentation af den.  

Promises and Pitfalls Recap – Part Two » CCC Blog PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Kilde: MJ Buehler, Fremskyndelse af videnskabelig opdagelse med generativ vidensekstraktion, grafbaseret repræsentation og multimodal intelligent grafræsonnement, arXiv, 2024

Figuren nedenfor viser et nyt materialedesign, en hierarkisk mycelium-baseret komposit, konstrueret af generativ AI og byder på en aldrig før set kombination af mycelium rhizomorphs, kollagen, mineralfyldstof, overfladefunktionalisering og et komplekst samspil mellem porøsitet og materiale. 

Promises and Pitfalls Recap – Part Two » CCC Blog PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Kilde: MJ Buehler, Accelerating Scientific Discovery with Generative Knowledge Extraction, Graph-Based Repræsentation og Multimodal Intelligent Graph Reasoning, arXiv, 2024. Til venstre: Mycrlium-komposit. Til højre: Proteindesign. 

Desuden kan generativ AI hjælpe os med at visualisere komplekse systemer. I stedet for at beskrive interaktioner mellem atomer, kan AI repræsentere disse interaktioner i grafer, som mekanistisk beskriver, hvordan materialer fungerer, opfører sig og interagerer i forskellige skalaer. Disse værktøjer er kraftfulde, men alene er de ikke stærke nok til at løse den høje kompleksitet af disse problemer. For at løse dette kan vi kombinere mange modeller, såsom en model der kan lave fysiksimuleringer og en anden der kan forudsige kræfter og spændinger og hvordan man designer proteiner. Når disse modeller kommunikerer bliver de til agentmodeller, hvor hver enkelt model er en agent med et specifikt formål. Hver models output kommunikeres til de øvrige modeller og tages med i den overordnede evaluering af modellernes output. Agentmodeller kan køre simuleringer på eksisterende data og generere nye data. Så for områder med begrænset eller nul data kan forskere bruge fysikmodeller til at generere data til at køre simuleringer på. "Denne type modellering er et af de fremtidige vækstområder for generative modeller," siger Dr. Buehler. Disse typer modeller kan løse problemer, der tidligere blev anset for at være uoverskuelige på supercomputere, og nogle af disse modeller kan endda køre på en standard bærbar computer.

En af hovedudfordringerne ved at designe sådanne fysik-inspirerede generative AI-modeller, som forskerne stadig tager fat på, er, hvordan man opbygger modellerne elegant, og hvordan man gør dem mere lig den menneskelige hjerne eller biologiske systemer. Biologiske systemer har evnen til at ændre deres adfærd, som når du skærer din hud, vil snittet heles over tid. Modeller kan bygges til at fungere på samme måde. I stedet for at træne en model til at hele et snit på alle tidspunkter, kan vi træne dem til at have evnen til at samle dem igen til at handle dynamisk – i en eller anden forstand træner vi modeller til først at tænke over det stillede spørgsmål, og hvordan de kan være i stand til at omkonfigurere 'sig selv' for bedst muligt at løse en bestemt opgave. Dette kan bruges til at lave kvantitative forudsigelser (f.eks. løse en meget kompleks opgave for at forudsige et proteins energilandskab), lave kvalitative forudsigelser og ræsonnere over resultaterne og integrere forskellig ekspertise og færdigheder, efterhånden som svar på komplekse opgaver udvikles. Det er vigtigt, at modellerne også kan forklare os, hvordan de nåede frem til løsningen, hvordan et bestemt system fungerer og andre detaljer, der kan være af interesse for den menneskelige videnskabsmand. Vi kan derefter køre eksperimenter for at forudsige og verificere resultaterne af disse simuleringer for tilfælde, der er de mest lovende ideer, såsom for materialedesignapplikationer.

Dr. Buehler talte derefter om specifikke anvendelser af disse generative modeller i materialevidenskab. "For at beregne energilandskabet for at løse det omvendte foldningsproblem givet et bestemt protein, behøver vi ikke engang at vide, hvordan proteinet ser ud, jeg skal bare kende byggestenene og DNA-sekvensen, der definerer dette protein og betingelserne for eksperiment udføres i. Hvis du ønsker en bestemt slags protein med et bestemt energilandskab, kan vi også designe det protein, efter behov. Agentiske modeller kan gøre dette, fordi de har kapacitet til at kombinere forskellige modeller, forudsigelser og data. Dette kan bruges til at syntetisere komplekse nye proteiner, der ikke findes i naturen. Vi kan opfinde proteiner, der har super stærke fibre som erstatning for plast, eller skabe bedre kunstig mad eller nye batterier. Vi kan bruge naturens værktøjskasse til at udvide forbi, hvad naturen har at tilbyde, og gå langt ud over evolutionære principper. For eksempel kan vi designe materialer til bestemte formål, såsom et materiale, der er meget strækbart eller har visse optiske egenskaber, eller materialer, der ændrer deres egenskaber baseret på eksterne signaler. De modeller, der dukker op nu, er ikke kun i stand til at løse disse problemer, men giver også mulighed for at forklare os, hvordan disse problemer løses. De kan også belyse, hvorfor visse strategier virker, og andre ikke gør. De kan forudsige ny forskning, såsom at bede en model om at forudsige, hvordan et bestemt materiale vil opføre sig meget detaljeret, og vi kan validere dette med forskningsundersøgelser i laboratorier eller med fysiksimuleringer. Det er ufatteligt og lyder futuristisk, men det sker faktisk i dag.”

Tidsstempel:

Mere fra CCC blog