Nowy chatbot AI „Jais” w Zjednoczonych Emiratach Arabskich obsługuje osoby mówiące po arabsku

Nowy chatbot AI „Jais” w Zjednoczonych Emiratach Arabskich obsługuje osoby mówiące po arabsku

Według CNN zespół naukowców, badaczy i inżynierów ze Zjednoczonych Emiratów Arabskich (ZEA) zaprezentował nowego generatywnego chatbota opartego na sztucznej inteligencji o nazwie „Jais”, którego zadaniem jest obsługa osób posługujących się językiem arabskim na całym świecie.

Zespół twierdzi, że arabski, szósty najczęściej mówione język na świecie, którym posługuje się około 272 miliony osób, jest „niedostatecznie reprezentowany w głównym nurcie sztucznej inteligencji”. Mają nadzieję położyć kres dominacji języka angielskiego w systemach szkoleniowych AI znanych jako duże modele językowe (LLM).

Chatbot Jais AI koncentruje się na Bliskim Wschodzie

Problem językowy w sztucznej inteligencji jest problemem ogólnoświatowym. Japonia niedawno porzuciła język angielski, ponieważ kraj tworzy własną wersję ChatGPT. Naukowcy powiedziany chociaż chatbot OpenAI doskonale radzi sobie z językiem angielskim, często nie radzi sobie z językiem japońskim „z powodu różnic w systemie alfabetu, ograniczonych danych i innych czynników”.

Nazwa Jais pochodzi od góry w Zjednoczonych Emiratach Arabskich, CNN raport mówi i może wykonywać zadania na polecenie, takie jak pisanie wierszy, tak jak ChatGPT lub Google Bard, ale na ograniczoną skalę. Sztuczna inteligencja jest szkolona na 13 miliardach parametrów danych, co znacznie różni się od prawie 3.5 miliardów parametrów ChatGPT 175, co jest miarą wielkości dużego modelu językowego, ale nie jego dokładności.

Według Timothy'ego Baldwina, profesora przetwarzania języka naturalnego na Uniwersytecie Sztucznej Inteligencji Mohameda bin Zayeda (MBZUAI) w Abu Zabi planuje się rozszerzenie zbioru danych Jaisa do 30 miliardów parametrów i umożliwienie mu odczytywania obrazów i wykresów zamiast samego tekstu.

Nad stworzeniem Jais uniwersytet współpracował z firmą Cerebras Systems and Inception z Doliny Krzemowej, spółką zależną firmy G42 z siedzibą w Zjednoczonych Emiratach Arabskich, zajmującej się sztuczną inteligencją. Baldwin powiedział, że chociaż konkurencyjne firmy LLM, takie jak LLaMA firmy Meta i GPT firmy OpenAI, potrafią rozumieć język arabski, szkolą się głównie w oparciu o dane dostępne online w języku angielskim.

W przypadku Jaisa szkolenie obejmowało połączenie zbiorów danych w języku angielskim i arabskim, ale ze świadomym skupieniem się na treściach z Bliskiego Wschodu, gdzie powszechnie mówi się i pisze po arabsku.

Baldwin powiedział, że takie skupienie pozwala chatbotowi AI wyjść poza „to, co ktokolwiek inny był w stanie osiągnąć w języku arabskim”.

Według MBZUAI unikalne szkolenie Jaisa pomaga chatbotowi „rozumieć niuanse i dialekty kulturowe”, dzięki czemu jest bardziej przydatny w wielu różnych branżach. Twórcy udostępnili model publicznie w formacie open source, co oznacza, że ​​każdy może go dostosować.

Nowy chatbot AI „Jais” w Zjednoczonych Emiratach Arabskich obsługuje osoby mówiące po arabsku PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Nowy chatbot AI „Jais” w Zjednoczonych Emiratach Arabskich obsługuje osoby mówiące po arabsku PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Przełączanie między dialektami

Baldwin powiedział CNN, że zróżnicowane szkolenie Jaisa w zakresie danych umożliwi mu przełączanie się między dialektami języka Modern Standard Arabic, który jest używany w oficjalnych dokumentach i formalnych pismach, a lokalnymi dialektami, które są zwykle używane na blogach i w mediach społecznościowych.

„Z pewnością jest tu miejsce na ulepszenia, ale skupiono się bardziej na solidności, jeśli chodzi o zdolność zrozumienia, czy rzeczywiście mamy bardziej nieformalne dane wejściowe do modelu” – powiedział.

Podobnie jak inne generatywne chatboty AI, Jais jest zbudowany tak, aby opierać się monitom, które tworzą „toksyczny lub szkodliwy” odpowiedzi, powiedział Baldwin, i nie będzie odpowiadać na pytania, które „prowadzą do samookaleczenia lub sugerują uzależnienie”. Tematy takie jak homoseksualizm są poza zasięgiem, zgodnie z wierzeniami muzułmańskimi.

Przeczytaj także: Zależność ChatGPT od „języka angielskiego” zmusiła Japonię do stworzenia własnego chatbota AI

Według Mohammeda Solimana, dyrektora ds. technologii strategicznych i programu bezpieczeństwa cybernetycznego w Instytucie Bliskiego Wschodu w Waszyngtonie, języki oparte na alfabecie łacińskim, takie jak angielski dominować w Internecie, co oznacza, że ​​zbiory danych w tych językach są największe.

„Udostępnienie narzędzi sztucznej inteligencji wyłącznie osobom znającym określone języki może uniemożliwić grupom społecznym znajdującym się w niekorzystnej sytuacji czerpanie korzyści ze sztucznej inteligencji” – stwierdził.

„[Te LLM] nie mają świadomości innych kultur, co niekorzystnie wpływa na komfort użytkowania osób z różnych środowisk” – dodał Soliman, jak donosi CNN.

Zjednoczone Emiraty Arabskie poczyniły znaczne postępy w opracowywaniu generatywnych systemów sztucznej inteligencji. Emirat był pierwszym krajem na świecie, który wyznaczył minister AI w 2017 r. Podobno może się także pochwalić największym w regionie modelem generatywnej sztucznej inteligencji, Falcon, który został opublikowany w marcu przez Radę ds. Badań nad Zaawansowanymi Technologiami w Abu Zabi i Instytut Innowacji Technologicznych (TII).

Znak czasu:

Więcej z MetaWiadomości