O novo AI Chatbot 'Jais' dos Emirados Árabes Unidos atende a falantes de árabe

O novo AI Chatbot 'Jais' dos Emirados Árabes Unidos atende a falantes de árabe

Uma equipe de acadêmicos, pesquisadores e engenheiros dos Emirados Árabes Unidos (EAU) revelou um novo chatbot generativo de IA chamado ‘Jais’ para atender especificamente pessoas que falam a língua árabe em todo o mundo, de acordo com a CNN.

A equipe argumenta que o árabe, o sexto mais falado língua no mundo, com cerca de 272 milhões de falantes, tem sido “sub-representada na IA convencional”. Eles esperam acabar com o domínio do inglês no treinamento de sistemas de IA conhecidos como grandes modelos de linguagem (LLMs).

O chatbot Jais AI se concentra no Oriente Médio

A questão linguística na IA é uma preocupação mundial. O Japão abandonou recentemente o inglês enquanto o país cria sua própria versão do ChatGPT. Pesquisadores dito embora o chatbot da OpenAI seja excelente em inglês, muitas vezes fica aquém do japonês “devido a diferenças no sistema alfabético, dados limitados e outros fatores”.

Jais tem o nome de uma montanha nos Emirados Árabes Unidos, a CNN Denunciar diz, e pode executar tarefas sob comando, como escrever poemas, assim como ChatGPT ou do Google Bardo, mas em escala limitada. A IA é treinada em 13 bilhões de parâmetros de dados, muito longe em comparação com os quase 3.5 bilhões de parâmetros do ChatGPT 175, uma medida do tamanho de um grande modelo de linguagem, mas não de sua precisão.

Existem planos para expandir o conjunto de dados de Jais para 30 mil milhões de parâmetros e permitir-lhe ler imagens e gráficos em vez de apenas texto, de acordo com Timothy Baldwin, professor de processamento de linguagem natural na Universidade Mohamed bin Zayed de Inteligência Artificial (MBZUAI) de Abu Dhabi.

A universidade trabalhou com a Cerebras Systems and Inception do Vale do Silício, uma subsidiária da empresa de IA G42, sediada nos Emirados Árabes Unidos, para criar a Jais. Baldwin disse que embora LLMs rivais como o LLaMA da Meta e o GPT da OpenAI possam entender árabe, eles são predominantemente treinados em dados online de inglês.

Para Jais, a formação envolveu uma combinação de conjuntos de dados em inglês e árabe, mas com um foco deliberado em conteúdos do Médio Oriente, onde o árabe é amplamente falado e escrito.

Baldwin disse que tal foco permite que o chatbot de IA vá além “do que qualquer outra pessoa conseguiu alcançar com o árabe”.

De acordo com MBZUAI, o treinamento exclusivo de Jais ajuda o chatbot a ‘entender nuances e dialetos culturais’, tornando-o mais útil para uma ampla gama de setores diferentes. Os desenvolvedores disponibilizaram o modelo ao público em código aberto, o que significa que qualquer pessoa pode personalizá-lo.

O novo AI Chatbot 'Jais' dos Emirados Árabes Unidos atende falantes de árabe PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

O novo AI Chatbot 'Jais' dos Emirados Árabes Unidos atende falantes de árabe PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Alternando entre dialetos

Baldwin disse à CNN que o treinamento diversificado de Jais em dados permitirá alternar entre dialetos do árabe padrão moderno, que é usado para documentos oficiais e redação formal, e dialetos locais que geralmente são usados ​​em blogs ou mídias sociais.

“Há certamente espaço para melhorias aí, mas o foco tem sido mais na robustez em termos de sermos capazes de compreender se temos mais contributos informais para o modelo”, disse ele.

Como outros chatbots generativos de IA, o Jais foi desenvolvido para resistir a solicitações que criam “tóxico ou prejudicial” responde, disse Baldwin, e não responderá a perguntas que “levem à automutilação ou sugiram vício”. Tópicos como a homossexualidade estão fora dos limites, em linha com as crenças muçulmanas.

Veja também: A dependência do ChatGPT da 'língua inglesa' forçou o Japão a criar seu próprio chatbot de IA

De acordo com Mohammed Soliman, diretor de tecnologias estratégicas e do programa de segurança cibernética do Middle East Institute em Washington, DC, idiomas baseados no alfabeto latino, como o inglês dominar na Internet, o que significa que os conjuntos de dados são os maiores nessas línguas.

“Tornar o acesso às ferramentas de IA exclusivo para aqueles que falam línguas específicas poderia impedir que setores desfavorecidos das sociedades colhem os benefícios da IA”, disse ele.

“[Esses LLMs] carecem de conhecimento de outras culturas, afetando negativamente a experiência do usuário para pessoas de diversas origens”, acrescentou Soliman, conforme relatado pela CNN.

Os EAU fizeram progressos significativos no desenvolvimento de sistemas generativos de IA. O Emirado foi o primeiro país do mundo a nomear um ministro da IA em 2017. Também alegadamente ostenta o maior modelo generativo de IA da região, o Falcon, que foi lançado pelo Conselho de Investigação de Tecnologia Avançada de Abu Dhabi e pelo Instituto de Inovação Tecnológica (TII) em Março.

Carimbo de hora:

Mais de MetaNotícias