Chatbot AI Baru 'Jais' dari UEA Melayani Penutur Bahasa Arab

Chatbot AI Baru 'Jais' dari UEA Melayani Penutur Bahasa Arab

Sebuah tim yang terdiri dari akademisi, peneliti, dan insinyur di Uni Emirat Arab (UEA) meluncurkan chatbot AI generatif baru yang disebut 'Jais' untuk melayani secara khusus orang-orang yang berbicara bahasa Arab di seluruh dunia, menurut CNN.

Tim berpendapat bahwa bahasa Arab, yang keenam paling banyak diucapkan bahasa di dunia dengan sekitar 272 juta penutur, โ€œkurang terwakili dalam AI arus utama.โ€ Mereka berharap untuk mengakhiri dominasi bahasa Inggris dalam pelatihan sistem AI yang dikenal sebagai model bahasa besar (LLM).

Chatbot Jais AI berfokus pada Timur Tengah

Masalah bahasa dalam AI menjadi perhatian dunia. Jepang baru-baru ini meninggalkan bahasa Inggris karena negara tersebut membangun ChatGPT versinya sendiri. Peneliti tersebut Meskipun chatbot OpenAI unggul dalam bahasa Inggris, chatbot ini sering kali gagal dalam bahasa Jepang โ€œkarena perbedaan dalam sistem alfabet, keterbatasan data, dan faktor lainnya.โ€

Nama Jais diambil dari nama sebuah gunung di UEA, CNN melaporkan katanya, dan dapat melakukan tugas sesuai perintah, seperti menulis puisi, seperti ChatGPT atau Google Penyair, tetapi dalam skala terbatas. AI dilatih pada 13 miliar parameter data, jauh berbeda dibandingkan dengan ChatGPT 3.5 yang hampir 175 miliar parameter, yang merupakan ukuran model bahasa besar, namun bukan keakuratannya.

Ada rencana untuk memperluas kumpulan data Jais hingga 30 miliar parameter dan memungkinkannya membaca gambar dan grafik, bukan hanya teks, menurut Timothy Baldwin, profesor pemrosesan bahasa alami di Universitas Kecerdasan Buatan Mohamed bin Zayed (MBZUAI) di Abu Dhabi.

Universitas ini bekerja sama dengan Cerebras Systems and Inception dari Silicon Valley, anak perusahaan perusahaan AI G42 yang berbasis di UEA, untuk menciptakan Jais. Baldwin mengatakan meskipun LLM saingannya seperti LLaMA Meta dan GPT OpenAI dapat memahami bahasa Arab, mereka sebagian besar dilatih tentang data bahasa Inggris online.

Bagi Jais, pelatihan ini melibatkan kombinasi data bahasa Inggris dan bahasa Arab, namun dengan fokus pada konten dari Timur Tengah, tempat bahasa Arab digunakan dan ditulis secara luas.

Baldwin mengatakan fokus seperti itu memungkinkan chatbot AI melampaui โ€œapa yang dapat dicapai orang lain dalam bahasa Arab.โ€

Menurut MBZUAI, pelatihan unik Jais membantu chatbot 'memahami nuansa dan dialek budaya', sehingga lebih berguna untuk berbagai industri yang berbeda. Pengembang membuat model ini tersedia untuk umum dalam sumber terbuka, artinya siapa pun dapat menyesuaikannya.

Chatbot AI Baru 'Jais' dari UEA Melayani Penutur Bahasa Arab Kecerdasan Data PlatoBlockchain. Pencarian Vertikal. Ai.

Chatbot AI Baru 'Jais' dari UEA Melayani Penutur Bahasa Arab Kecerdasan Data PlatoBlockchain. Pencarian Vertikal. Ai.

Beralih antar dialek

Baldwin mengatakan kepada CNN bahwa pelatihan data Jais yang beragam akan memungkinkannya beralih antara dialek Bahasa Arab Standar Modern, yang digunakan untuk dokumen resmi dan penulisan formal, dan dialek lokal yang biasanya digunakan di blog atau media sosial.

โ€œTentu saja masih ada ruang untuk perbaikan, namun fokusnya lebih pada ketahanan dalam hal memahami apakah kita mempunyai masukan yang lebih informal terhadap model tersebut,โ€ katanya.

Seperti chatbot AI generatif lainnya, Jais dibuat untuk menolak perintah yang menciptakan โ€œberacun atau berbahayaโ€ jawaban, kata Baldwin, dan tidak akan menanggapi pertanyaan yang โ€œmenyebabkan tindakan menyakiti diri sendiri atau mengarah pada kecanduan.โ€ Topik-topik seperti homoseksualitas adalah hal yang terlarang, sejalan dengan keyakinan Muslim.

Baca juga: Ketergantungan ChatGPT pada 'Bahasa Inggris' Memaksa Jepang Membuat AI Chatbot Sendiri

Menurut Mohammed Soliman, direktur teknologi strategis dan program keamanan siber di Middle East Institute di Washington, DC, bahasa berbasis alfabet Latin seperti bahasa Inggris mendominasi internet, artinya kumpulan data adalah yang terbesar dalam bahasa-bahasa tersebut.

โ€œMembuat akses terhadap alat-alat AI menjadi eksklusif bagi mereka yang dapat berbicara dalam bahasa tertentu dapat mencegah kelompok masyarakat yang kurang beruntung untuk mendapatkan manfaat dari AI,โ€ katanya.

โ€œ[LLM ini] kurang memiliki kesadaran terhadap budaya lain, sehingga berdampak buruk pada pengalaman pengguna bagi orang-orang dari berbagai latar belakang,โ€ tambah Soliman, seperti dilansir CNN.

UEA telah membuat kemajuan signifikan dalam mengembangkan sistem AI generatif. Emirat adalah negara pertama di dunia yang menunjuk a menteri AI pada tahun 2017. Perusahaan ini juga dilaporkan memiliki model AI generatif terbesar di kawasan ini, Falcon, yang dirilis oleh Dewan Riset Teknologi Lanjutan Abu Dhabi dan Institut Inovasi Teknologi (TII) pada bulan Maret.

Stempel Waktu:

Lebih dari Berita Meta