Ígéretek és buktatók Összefoglaló – Első rész » CCC Blog

Ígéretek és buktatók Összefoglaló – Első rész » CCC Blog

A CCC három tudományos ülést támogatott az idei AAAS éves konferencián, és ha nem tudott személyesen részt venni, akkor minden ülést összefoglalunk. Ezen a héten összefoglaljuk az ülés legfontosabb eseményeit: „Generatív mesterséges intelligencia a tudományban: Ígéretek és buktatók.” Az első részben Dr. Rebecca Willett bevezetőjét és előadását foglaljuk össze.

A CCC 2024-es éves találkozójának első AAAS-panelére február 16-án, pénteken, a konferencia második napján került sor. A panel, a CCC saját moderátora Dr. Török Máté, a chicagói Toyota Technológiai Intézet elnöke, olyan szakértőkből állt, akik a mesterséges intelligenciát számos tudományterületen alkalmazzák. Dr. Rebecca Willett, a Chicagói Egyetem statisztika és számítástechnika professzora, előadásában arra összpontosított, hogyan használhatók fel a generatív modellek a tudományokban, és miért nem elegendőek a hagyományos modellek a tudományos kutatáshoz. Dr. Markus Buehler, a Massachusetts Institute of Technology mérnökprofesszora beszélt az anyagtudományban alkalmazott generatív modellekről, és Dr. Duncan Watson-Parris, adjunktus a Scripps Oceanográfiai Intézetben és a Halıcıoğlu Adattudományi Intézetben (UC San Diego), arról beszélt, hogyan használhatók a generatív modellek a klímatudományok tanulmányozásában.

Dr. Turk, a számítógépes látás és az ember-számítógép interakció szakértője azzal kezdte a panelt, hogy megkülönböztette a generatív mesterséges intelligenciát az összes mesterséges intelligenciától. "A generatív AI-alkalmazások középpontjában a mély neurális hálózatokból álló generatív modellek állnak, amelyek megtanulják terjedelmes képzési adataik szerkezetét, majd új adatokat generálnak a tanultak alapján."

Dr. Turk felvázolta a generatív rendszerekkel kapcsolatos népszerű aggodalmakat is, amelyek maguknak a rendszereknek a meghibásodásaiból adódnak, például azok, amelyek nem létező jogi tájékoztatót idéznek, valamint azért is, mert rossz szereplők hamis tartalmat, például hamis hangot vagy hanganyagot generálnak. politikusokról vagy hírességekről készült videó.

„Konkrétan – mondta Dr. Turk –, ez az ülés a generatív mesterséges intelligencia tudományban való felhasználására fog összpontosítani, egyrészt a tudományra való törekvés átalakító erejeként, másrészt a zavarok lehetséges kockázataként.

Dr. Rebecca Willett előadását azzal kezdte, hogy felvázolta, hogy a generatív mesterséges intelligencia hogyan használható fel a tudományos felfedezési folyamat támogatására. Először a generatív modellek működésére összpontosított. Az alábbi kép Dr. Willett diáiról bemutatja, hogy egy nyelvi modell, például a ChatGPT hogyan értékeli egy szó előfordulásának valószínűségét egy korábbi szókészlet alapján, és hogyan hoz létre egy képgeneráló modell, például a DALL-E 2 képet. adott promptból a képzés során képmilliárdokból tanult valószínűségi eloszlások segítségével.

Ígéretek és buktatók Összefoglaló – Első rész » CCC blog PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

„Az összes generatív modell alapját képező valószínűségi eloszlás elvének felhasználásával ezek a modellek alkalmazhatók a tudomány moonshot ötleteire, például lehetséges klímaforgatókönyvek generálására a jelenlegi éghajlati és potenciális politikák alapján, vagy új mikrobiomok létrehozására célzott funkcionalitással, mint pl. amely különösen hatékony a műanyagok lebontásában” – mondja Dr. Willett.

A tudományos kutatáshoz azonban nem elegendő olyan kész generatív eszközöket használni, mint a ChatGPT vagy a DALL-E 2. Ezeket az eszközöket olyan környezetben hozták létre, amely nagyon különbözik attól a környezettől, amelyben a tudósok dolgoznak. Az egyik nyilvánvaló különbség a készen kapható generatív modell és a tudományos modell között az adatok. A tudományban gyakran nagyon kevés adat áll rendelkezésre a hipotézisek megalapozásához. A tudományos adatok általában szimulációkból és kísérletekből származnak, amelyek gyakran költségesek és időigényesek. E korlátok miatt a tudósoknak gondosan meg kell választaniuk, hogy mely kísérleteket hajtsák végre, és hogyan maximalizálják e rendszerek hatékonyságát és hasznosságát. Ezzel szemben a kész modellek sokkal kisebb jelentőséget tulajdonítanak annak, hogy honnan származnak az adatok, és inkább maximalizálják a kezelhető adatmennyiséget. A tudományban az adatkészletek pontossága és eredetük hihetetlenül fontos, mivel a tudósoknak robusztus empirikus bizonyítékokkal kell igazolniuk kutatásaikat.

„Emellett a tudományokban mások a céljaink, mint pusztán elfogadható dolgok előállítása” – mondja Dr. Willett. "Meg kell értenünk a dolgok működését az eddig megfigyelt tartományon kívül." Ez a megközelítés ellentétben áll azokkal a generatív mesterséges intelligencia modellekkel, amelyek az adatokat a valószínű megfigyelések teljes körét reprezentatívnak tekintik. A fizikai modellek és korlátok beépítése a generatív MI-be segít abban, hogy az jobban reprezentálja a fizikai jelenségeket.

A tudományos modelleknek alkalmasnak kell lenniük a ritka események megörökítésére is. „Sok ritka eseményt nyugodtan figyelmen kívül hagyhatunk, amikor a ChatGPT-t oktatjuk, de ezzel szemben a ritka események gyakran az, amivel leginkább foglalkozunk a tudományok összefüggésében, például a ritka időjárási eseményeket előrejelző éghajlati modellben. Ha olyan generatív modellt használunk, amely elkerüli a ritka eseményeket, és például soha nem jósol hurrikánt, akkor ez a modell nem lesz túl hasznos a gyakorlatban.

Ehhez kapcsolódó kihívás a generatív mesterséges intelligencia modellek kidolgozása kaotikus folyamatokhoz, amelyek érzékenyek a kezdeti feltételekre. Dr. Willett az alábbi videót jelenítette meg, amely két részecske mozgását mutatja a térben a Lorenz 63 egyenletek szerint. Ezek az egyenletek determinisztikusak, nem véletlenszerűek, de két kissé eltérő kiindulási hely alapján láthatjuk, hogy a két részecske bármikor nagyon eltérő helyen lehet. Az éghajlattudományban, a turbulenciában és a hálózati dinamikában felmerülő folyamatok pontos lefolyását előrejelző generatív mesterséges intelligencia modellek kidolgozása alapvetően nehéz, de a generatív modellezés új megközelítései biztosíthatják, hogy a generált folyamatok kulcsfontosságú statisztikai jellemzőit megosszák valós tudományos adatokkal.

[Beágyazott tartalmat]

Végül Dr. Willett kitért arra a tényre, hogy a tudományos adatok gyakran a térbeli és időbeli léptékek hatalmas skáláját ölelik fel. Például az anyagtudományban a kutatók nanométeres léptékű anyagokat tanulmányoznak a monymerek esetében egészen a nagyméretű rendszerig, például egy egész repülőgépig. „A skálák tartománya nagyon eltér a készen kapható modellekben használt adatoktól, és meg kell fontolnunk, hogyan építjük fel ezeket a generatív modelleket oly módon, hogy az pontosan befolyásolja a skálák közötti interakciókat.”

„A generatív modellek jelentik a tudomány jövőjét”, mondja Dr. Willett, „de a hatékony használatuk biztosításához alapvető előrelépést kell tennünk a mesterséges intelligencia területén, és túl kell lépnünk az adatok ChatGPT-be való csatlakoztatásán”.

Nagyon köszönjük, hogy elolvasta, és kérem, hallgassa meg holnap Dr. Markus Buehler Generative AI in Mechanobiology című előadásának összefoglalóját.

Időbélyeg:

Még több CCC blog