Rekap Janji dan Jebakan – Bagian Satu »Blog CCC

Rekap Janji dan Jebakan – Bagian Satu »Blog CCC

CCC mendukung tiga sesi ilmiah pada Konferensi Tahunan AAAS tahun ini, dan jika Anda tidak dapat hadir secara langsung, kami akan merangkum setiap sesi. Minggu ini, kami akan merangkum hal-hal penting dari sesi ini, “AI Generatif dalam Sains: Janji dan Kesalahan.” Di Bagian Pertama, kami akan merangkum pendahuluan dan presentasi dari Dr. Rebecca Willett.

Panel AAAS pertama CCC pada pertemuan tahunan 2024 berlangsung pada hari Jumat, 16 Februari, hari kedua konferensi. Panel tersebut, dimoderatori oleh CCC sendiri Dr.Matthew Turki, presiden Institut Teknologi Toyota di Chicago, terdiri dari para ahli yang menerapkan kecerdasan buatan pada berbagai bidang ilmiah. Dr.Rebecca Willett, profesor statistik dan ilmu komputer di Universitas Chicago, memfokuskan presentasinya pada bagaimana model generatif dapat digunakan dalam sains dan mengapa model yang tersedia tidak cukup untuk diterapkan pada penelitian ilmiah. Dr Markus Buehler, profesor teknik di Massachusetts Institute of Technology, berbicara tentang model generatif yang diterapkan pada ilmu material, dan Dr Duncan Watson-Parris, asisten profesor di Scripps Institution of Oceanography dan Halıcıoğlu Data Science Institute di UC San Diego, membahas bagaimana model generatif dapat digunakan dalam mempelajari ilmu iklim.

Dr. Turk, pakar visi komputer dan interaksi manusia-komputer, memulai panel dengan membedakan AI Generatif dari semua AI. “Inti dari aplikasi AI generatif adalah model generatif yang terdiri dari jaringan saraf mendalam yang mempelajari struktur data pelatihan mereka yang sangat banyak dan kemudian menghasilkan data baru berdasarkan apa yang telah mereka pelajari.”

Dr. Turk juga menguraikan kekhawatiran umum terhadap sistem generatif, baik karena kegagalan sistem itu sendiri, seperti sistem yang mengutip ringkasan hukum yang tidak ada, dan juga karena penggunaannya oleh pelaku kejahatan untuk menghasilkan konten palsu, seperti audio palsu atau video politisi atau selebriti.

“Secara khusus,” kata Dr. Turk, “sesi ini akan berfokus pada penggunaan AI generatif dalam sains, baik sebagai kekuatan transformatif dalam mengejar sains dan juga sebagai potensi risiko gangguan.”

Rebecca Willett memulai presentasinya dengan menguraikan bagaimana AI generatif dapat dimanfaatkan untuk mendukung proses penemuan ilmiah. Dia pertama kali berfokus pada cara kerja model generatif. Gambar di bawah dari slide Dr. Willett menampilkan bagaimana model bahasa, seperti ChatGPT, mengevaluasi kemungkinan kemunculan sebuah kata, berdasarkan kumpulan kata sebelumnya, dan bagaimana model pembuatan gambar, seperti DALL-E 2, menghasilkan gambar dari perintah tertentu menggunakan distribusi probabilitas yang dipelajari dari miliaran gambar selama pelatihan.

Rekap Janji dan Jebakan – Bagian Satu »Blog CCC PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

“Dengan menggunakan prinsip distribusi probabilitas, yang mendasari semua model generatif, model ini dapat diterapkan pada ide-ide ilmiah, seperti menghasilkan skenario iklim yang mungkin terjadi berdasarkan iklim saat ini dan kebijakan potensial, atau menghasilkan mikrobioma baru dengan fungsi yang ditargetkan, seperti salah satu yang sangat mujarab dalam mengurai plastik”, kata Dr. Willett.

Namun, menggunakan alat generatif yang tersedia seperti ChatGPT atau DALL-E 2 untuk penelitian ilmiah saja tidak cukup. Alat-alat ini diciptakan dalam lingkungan yang sangat berbeda dari konteks dimana para ilmuwan beroperasi. Salah satu perbedaan nyata antara model generatif siap pakai dan model ilmiah adalah datanya. Dalam sains, seringkali hanya ada sedikit data yang menjadi dasar hipotesis. Data ilmiah biasanya dihasilkan dari simulasi dan eksperimen, yang keduanya seringkali mahal dan memakan waktu. Karena keterbatasan ini, para ilmuwan harus hati-hati memilih eksperimen mana yang akan dijalankan dan bagaimana memaksimalkan efisiensi dan kegunaan sistem tersebut. Sebaliknya, model siap pakai (off-the-shelf) tidak terlalu mementingkan asal usul data dibandingkan memaksimalkan jumlah data yang dapat digunakan. Dalam sains, keakuratan kumpulan data dan asal usulnya sangatlah penting, karena para ilmuwan perlu membenarkan penelitian mereka dengan bukti empiris yang kuat.

“Selain itu, dalam sains, tujuan kami berbeda dari sekedar menghasilkan hal-hal yang masuk akal”, kata Dr. Willett. “Kita harus memahami cara kerja segala sesuatu di luar jangkauan apa yang telah kita amati sejauh ini.” Pendekatan ini bertentangan dengan model AI generatif yang memperlakukan data sebagai representasi dari keseluruhan kemungkinan observasi. Memasukkan model fisik dan batasan ke dalam AI generatif membantu memastikan bahwa model tersebut akan mewakili fenomena fisik dengan lebih baik.

Model ilmiah juga harus mampu menangkap kejadian langka. “Kita dapat dengan aman mengabaikan banyak kejadian langka saat kita melatih ChatGPT, namun sebaliknya, kejadian langka sering kali merupakan hal yang paling kita pedulikan dalam konteks sains, seperti dalam model iklim yang memprediksi kejadian cuaca langka. Jika kita menggunakan model generatif yang menghindari kejadian langka dan, misalnya, tidak pernah meramalkan terjadinya badai, maka model ini tidak akan berguna dalam praktiknya.”

Tantangan terkait adalah mengembangkan model AI generatif untuk proses chaos yang sensitif terhadap kondisi awal. Dr Willett menampilkan video di bawah ini, yang menunjukkan dua partikel bergerak di ruang angkasa menurut persamaan Lorenz 63. Persamaan ini bersifat deterministik, tidak acak, namun dengan adanya dua lokasi awal yang sedikit berbeda, Anda dapat melihat bahwa pada waktu tertentu kedua partikel tersebut mungkin berada di lokasi yang sangat berbeda. Mengembangkan model AI generatif yang memprediksi jalannya proses tersebut, yang muncul dalam ilmu iklim, turbulensi, dan dinamika jaringan, pada dasarnya sulit dilakukan, namun pendekatan baru terhadap pemodelan generatif dapat memastikan bahwa proses yang dihasilkan memiliki karakteristik statistik utama yang sama dengan data ilmiah nyata.

[Embedded content]

Terakhir, Dr. Willett membahas fakta bahwa data ilmiah sering kali mencakup rentang skala spasial dan temporal yang sangat luas. Misalnya, dalam ilmu material, peneliti mempelajari material pada skala nanometer untuk mononymer hingga sistem skala besar, seperti seluruh pesawat terbang. “Rentang skala tersebut sangat berbeda dari data yang digunakan dalam model siap pakai, dan kita perlu mempertimbangkan bagaimana kita membangun model generatif ini dengan cara yang secara akurat mempengaruhi interaksi antar skala”.

“Model generatif adalah masa depan ilmu pengetahuan”, kata Dr. Willett, “tetapi untuk memastikan model tersebut digunakan secara efektif, kita perlu membuat kemajuan mendasar dalam AI dan lebih dari sekadar memasukkan data ke ChatGPT”.

Terima kasih banyak telah membaca, dan silakan saksikan besok untuk membaca rekap presentasi Dr. Markus Buehler tentang AI Generatif dalam Mekanobiologi.

Stempel Waktu:

Lebih dari Blog CCC