Penerus Wikipedia berbasis AI Meta 'mungkin menjadi terobosan besar berikutnya di NLP' PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Penerus Wikipedia berbasis AI Meta 'mungkin menjadi terobosan besar berikutnya dalam NLP'

Meta telah membuka sumber sumber pembelajaran mesin yang suatu hari nanti dapat menggantikan Wikipedia sebagai basis data verifikasi pengetahuan terbesar yang tersedia untuk umum di dunia.

Dijuluki Sphere, itu dapat digunakan untuk melakukan pemrosesan bahasa alami yang intensif pengetahuan, atau KI-NLP, kami diberitahu. Dalam istilah praktis, itu berarti dapat digunakan untuk menjawab pertanyaan rumit menggunakan bahasa alami, dan menemukan sumber untuk klaim.

Contoh penggunaan yang diberikan adalah menanyakan Sphere, “Siapa Joëlle Sambi Nzeba?” Wikipedia tidak memiliki entri untuknya, tetapi Sphere mengatakan bahwa dia “lahir di Belgia dan sebagian besar di Kinshasa (Kongo). Dia saat ini tinggal di Brussel. Dia adalah seorang penulis dan slammer, di samping aktivismenya dalam gerakan feminis,” dan menautkan ke situs web tempat ia mendapatkan informasi tentang pekerjaannya.

Wikipedia telah cukup banyak berfungsi sebagai kumpulan catatan, tulis kepala telur Meta dalam kertas membahas desain Sphere, mengklaim uber-wiki yang dikelola sukarelawan adalah "akurat, terstruktur dengan baik, dan cukup kecil untuk digunakan dengan mudah di lingkungan pengujian." 

Namun, mencari untuk membangun sesuatu yang lebih besar dan lebih baik daripada Wikipedia, Meta mengumpulkan konten dari seluruh web – tanpa wikipedia.org – untuk membentuk “sumber pengetahuan universal, tidak terkurasi, dan tidak terstruktur untuk beberapa tugas KI-NLP sekaligus.” Hasilnya adalah Sphere, yang kurang lebih merupakan kumpulan data yang diproses yang dapat ditanyakan menggunakan banyak alat pembelajaran mesin.

Tim menambahkan bahwa Sphere “dapat menyamai dan mengungguli baseline yang didasarkan pada Wikipedia” pada beberapa tugas menggunakan MELIPAT tolok ukur AI. Artinya, Sphere berkinerja lebih baik daripada sistem AI yang dibangun di atas konten Wikipedia.

Tujuan utama Sphere adalah untuk melihat dampak apa yang menggantikan Wikipedia, sebagai sumber, terhadap kinerja sistem pengetahuan-intensif, dan sementara tim melaporkan bahwa Sphere memiliki beberapa masalah, kinerjanya menunjukkan bahwa, paling tidak, itu dapat menambah nilai pada tugas KI-NLP di luar apa yang dapat ditawarkan oleh korpora Wikipedia. 

Para peneliti di balik Sphere mengklaim pekerjaan mereka menandai "pertama kalinya indeks pencarian tujuan umum meningkatkan model bahasa pada tugas akal sehat." 

Sphere bukan satu-satunya platform AI yang dirilis Meta di GitHub: minggu lalu dirilis NLLB-200, AI terjemahan pertama yang melewati ambang 200 bahasa, atau begitulah klaim induk Facebook. Seperti Sphere, NLLB-200 telah digunakan di Wikipedia; sistem pertama untuk secara otomatis memeriksa kutipan dalam artikel yang diedit, dan yang terakhir untuk meningkatkan terjemahan halaman ke dalam bahasa yang kurang umum digunakan.

Saat beralih ke korpus web, kami tidak lagi memiliki kepastian bahwa dokumen apa pun baik, benar, atau unik

Sphere melampaui korpora web serupa dalam hal skala, terdiri dari 906 juta bagian dan 134 juta dokumen. Bagian terbesar berikutnya dalam hal bagian/dokumen adalah Dialog Tambahan Internet generator, yang menarik data dari 250 juta bagian dan 109 juta dokumen. 

Tetapi internet tidak memiliki kontrol untuk kualitas atau akurasi, yang diakui oleh para peneliti adalah masalah utama untuk benar-benar menyebarkan hal ini. “Menggunakan Wikipedia sebagai sumber pengetahuan memungkinkan peneliti untuk mengasumsikan kualitas tinggi dari dokumen korpus. Saat beralih ke korpus web, kami tidak lagi memiliki kepastian bahwa dokumen apa pun baik, benar, atau unik,” tulis para peneliti. 

Pembuat Sphere berpikir bahwa upaya berulang harus fokus pada penilaian kualitas data yang diambilnya, mendeteksi klaim dan kontradiksi yang salah, menentukan bagaimana memprioritaskan sumber yang dapat dipercaya, dan kapan memutuskan untuk tidak menjawab pertanyaan karena kurangnya informasi. Anda tahu, membuatnya benar-benar berguna.

Jika berhasil mengubah Sphere menjadi AI kotak putih dengan informasi yang andal dan dapat dipercaya, Meta mengatakan, Sphere “mungkin menjadi terobosan besar berikutnya dalam NLP.” ®

Stempel Waktu:

Lebih dari Pendaftaran