Meta Membangun AI untuk Memeriksa Fakta Wikipedia—semua 6.5 ​​Juta Artikel PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Meta Membangun AI untuk Memeriksa Fakta Wikipedia—semua 6.5 ​​Juta Artikel

gambar

Kebanyakan orang yang berusia lebih dari 30 tahun mungkin ingat melakukan penelitian dengan ensiklopedia kuno yang bagus. Anda akan menarik volume besar dari rak, memeriksa indeks untuk topik yang Anda minati, lalu membalik ke halaman yang sesuai dan mulai membaca. Itu tidak semudah mengetik beberapa kata ke dalam bilah pencarian Google, tetapi di sisi positifnya, Anda tahu bahwa informasi yang Anda temukan di halaman Inggris atau itu Buku Dunia adalah akurat dan benar.

Tidak demikian dengan penelitian internet saat ini. Banyaknya sumber yang luar biasa cukup membingungkan, tetapi menambahkan proliferasi informasi yang salah dan mengherankan jika ada di antara kita yang mempercayai kata yang kita baca secara online.

Wikipedia adalah contohnya. Pada awal 2020, versi bahasa Inggris situs ini rata-rata sekitar 255 juta tampilan halaman per hari, menjadikannya situs web kedelapan yang paling banyak dikunjungi di internet. Pada bulan lalu, itu telah pindah ke tempat nomor tujuh, dan versi bahasa Inggris saat ini telah berakhir 6.5 juta artikel.

Namun, setinggi lalu lintas sumber informasi yang masuk ini, keakuratannya menyisakan sesuatu yang diinginkan; itu halaman tentang keandalan situs itu sendiri menyatakan, "Ensiklopedia online tidak menganggap dirinya dapat diandalkan sebagai sumber dan membuat pembaca enggan menggunakannya dalam pengaturan akademis atau penelitian."

Meta—dari mantan Facebook—ingin mengubah ini. Di sebuah posting blog diterbitkan bulan lalu, karyawan perusahaan menjelaskan bagaimana AI dapat membantu membuat Wikipedia lebih akurat.

Meskipun puluhan ribu orang berpartisipasi dalam mengedit situs, fakta yang mereka tambahkan belum tentu benar; bahkan ketika kutipan ada, mereka tidak selalu akurat atau bahkan relevan.

Meta sedang mengembangkan model pembelajaran mesin yang memindai kutipan ini dan merujuk silang kontennya ke artikel Wikipedia untuk memverifikasi bahwa tidak hanya topik yang sesuai, tetapi angka spesifik yang dikutip adalah akurat.

Ini bukan hanya soal memilih angka dan memastikannya cocok; AI Meta perlu "memahami" konten sumber yang dikutip (meskipun "memahami" adalah keliru, karena peneliti teori kompleksitas Melanie Mitchell akan memberitahumu, karena AI masih dalam fase "sempit", artinya itu adalah alat untuk pengenalan pola yang sangat canggih, sedangkan "pemahaman" adalah kata yang digunakan untuk kognisi manusia, yang masih merupakan hal yang sangat berbeda).

Model Meta akan "memahami" konten bukan dengan membandingkan string teks dan memastikan mereka berisi kata-kata yang sama, tetapi dengan membandingkan representasi matematis dari blok teks, yang diperoleh dengan menggunakan teknik pemahaman bahasa alami (NLU).

“Apa yang telah kami lakukan adalah membangun indeks dari semua halaman web ini dengan membaginya menjadi beberapa bagian dan memberikan representasi yang akurat untuk setiap bagian,” Fabio Petroni, manajer utama teknologi Meta's Fundamental AI Research, mengatakan Digital Trends. “Itu tidak mewakili kata demi kata bagian itu, tetapi arti dari bagian itu. Itu berarti bahwa dua potongan teks dengan arti yang sama akan direpresentasikan dalam posisi yang sangat dekat di ruang n-dimensi yang dihasilkan di mana semua bagian ini disimpan.”

AI sedang dilatih pada satu set empat juta kutipan Wikipedia, dan selain memilih kutipan yang salah di situs, penciptanya ingin akhirnya dapat menyarankan sumber yang akurat untuk menggantikan mereka, menarik dari indeks besar data yang terus-menerus memperbarui.

Satu masalah besar yang tersisa untuk diselesaikan adalah bekerja dalam sistem penilaian untuk keandalan sumber. Makalah dari jurnal ilmiah, misalnya, akan mendapat nilai lebih tinggi daripada posting blog. Jumlah konten online sangat luas dan beragam sehingga Anda dapat menemukan "sumber" untuk mendukung hampir semua klaim, tetapi menguraikan informasi yang salah dari disinformasi (yang pertama berarti salah, sedangkan yang terakhir berarti sengaja menipu), dan peer-reviewed dari yang tidak ditinjau oleh rekan sejawat, diperiksa fakta dari yang ditampar dengan tergesa-gesa, bukanlah tugas kecil—tetapi sangat penting dalam hal kepercayaan.

Meta memiliki model open-source, dan mereka yang penasaran dapat melihat demo dari alat verifikasi. Posting blog Meta mencatat bahwa perusahaan tidak bermitra dengan Wikimedia dalam proyek ini, dan masih dalam tahap penelitian dan saat ini tidak digunakan untuk memperbarui konten di Wikipedia.

Jika Anda membayangkan masa depan yang tidak terlalu jauh di mana semua yang Anda baca di Wikipedia akurat dan dapat diandalkan, bukankah itu membuat melakukan penelitian apa pun menjadi terlalu mudah? Ada sesuatu yang berharga tentang memeriksa dan membandingkan sendiri berbagai sumber, bukan? Itu adalah lompatan besar untuk beralih dari membuka halaman melalui buku-buku berat untuk mengetik beberapa kata ke dalam mesin pencari dan menekan "Enter"; apakah kita benar-benar ingin Wikipedia bergerak dari titik awal penelitian ke sumber kata terakhir?

Bagaimanapun, tim peneliti AI Meta akan terus bekerja menuju alat untuk meningkatkan ensiklopedia online. “Saya pikir kami didorong oleh rasa ingin tahu pada akhirnya,” Petroni tersebut. “Kami ingin melihat apa batas dari teknologi ini. Kami sama sekali tidak yakin apakah [AI ini] dapat melakukan sesuatu yang berarti dalam konteks ini. Tidak ada yang pernah mencoba melakukan hal serupa.”

Gambar Kredit: Gerd Altmann dari Pixabay

Stempel Waktu:

Lebih dari Hub Singularity