El nuevo chatbot de IA de los Emiratos Árabes Unidos, 'Jais', está dirigido a hablantes de árabe

El nuevo chatbot de IA de los Emiratos Árabes Unidos, 'Jais', está dirigido a hablantes de árabe

Un equipo de académicos, investigadores e ingenieros de los Emiratos Árabes Unidos (EAU) presentó un nuevo chatbot generativo de IA llamado 'Jais' para atender específicamente a las personas que hablan árabe en todo el mundo, según CNN.

El equipo sostiene que el árabe, el sexto más hablado Este idioma en el mundo, con alrededor de 272 millones de hablantes, ha estado "infrarrepresentado en la IA convencional". Esperan poner fin al predominio del inglés en el entrenamiento de sistemas de inteligencia artificial conocidos como modelos de lenguaje grande (LLM).

El chatbot Jais AI se centra en Oriente Medio

La cuestión del lenguaje en la IA es una preocupación mundial. Japón abandonó recientemente el inglés mientras el país crea su propia versión de ChatGPT. Investigadores dijo Si bien el chatbot de OpenAI sobresale en inglés, a menudo se queda corto en japonés "debido a diferencias en el sistema alfabético, datos limitados y otros factores".

Jais lleva el nombre de una montaña en los Emiratos Árabes Unidos, CNN reporte dice y puede realizar tareas cuando se le ordena, como escribir poemas, al igual que ChatGPT o de Google Bardo, pero a escala limitada. La IA está entrenada en 13 mil millones de parámetros de datos, muy lejos en comparación con los cerca de 3.5 mil millones de parámetros de ChatGPT 175, una medida del tamaño de un modelo de lenguaje grande, pero no de su precisión.

Hay planes para ampliar el conjunto de datos de Jais a 30 mil millones de parámetros y permitirle leer imágenes y gráficos en lugar de solo texto, según Timothy Baldwin, profesor de procesamiento del lenguaje natural en la Universidad de Inteligencia Artificial Mohamed bin Zayed (MBZUAI) de Abu Dhabi.

La universidad trabajó con Cerebras Systems e Inception de Silicon Valley, una subsidiaria de la firma de inteligencia artificial G42 con sede en los Emiratos Árabes Unidos, para crear Jais. Baldwin dijo que si bien los LLM rivales como LLaMA de Meta y GPT de OpenAI pueden entender árabe, están capacitados predominantemente con datos en línea en inglés.

Para Jais, la capacitación implicó una combinación de conjuntos de datos en inglés y árabe, pero con un enfoque deliberado en contenido de Medio Oriente, donde el árabe se habla y escribe ampliamente.

Baldwin dijo que ese enfoque permite al chatbot de IA ir más allá de “lo que nadie ha podido lograr con el árabe”.

Según MBZUAI, la formación única de Jais ayuda al chatbot a "comprender matices y dialectos culturales", lo que lo hace más útil para una amplia gama de industrias diferentes. Los desarrolladores pusieron el modelo a disposición del público en código abierto, lo que significa que cualquiera puede personalizarlo.

El nuevo chatbot de IA de los Emiratos Árabes Unidos, 'Jais', está dirigido a los hablantes de árabe PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

El nuevo chatbot de IA de los Emiratos Árabes Unidos, 'Jais', está dirigido a los hablantes de árabe PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Cambiar entre dialectos

Baldwin le dijo a CNN que la capacitación diversa en datos de Jais le permitirá cambiar entre dialectos del árabe estándar moderno, que se usa para documentos oficiales y escritura formal, y dialectos locales que generalmente se usan en blogs o redes sociales.

"Ciertamente hay margen de mejora en ese aspecto, pero la atención se ha centrado más en la solidez en términos de poder comprender si tenemos aportaciones más informales al modelo", afirmó.

Al igual que otros chatbots de IA generativa, Jais está diseñado para resistir indicaciones que crean "tóxico o nocivo” respuestas, dijo Baldwin, y no responderá a consultas que “conduzcan a autolesiones o sugieran adicción”. Temas como la homosexualidad están prohibidos, en consonancia con las creencias musulmanas.

Lea también: La dependencia de ChatGPT del 'idioma inglés' ha obligado a Japón a crear su propio chatbot con IA

Según Mohammed Soliman, director de tecnologías estratégicas y programa de seguridad cibernética del Middle East Institute en Washington, DC, los idiomas basados ​​en el alfabeto latino, como el inglés, dominar Internet, lo que significa que los conjuntos de datos son los más grandes en esos idiomas.

"Hacer que el acceso a las herramientas de IA sea exclusivo para aquellos que pueden hablar idiomas específicos podría evitar que sectores desfavorecidos de las sociedades obtengan los beneficios de la IA", dijo.

"[Estos LLM] carecen de conocimiento de otras culturas, lo que afecta negativamente la experiencia del usuario para personas de diversos orígenes", añadió Soliman, según informó CNN.

Los Emiratos Árabes Unidos han logrado avances significativos en el desarrollo de sistemas generativos de IA. El Emirato fue el primer país del mundo en nombrar un ministro de IA en 2017. También se dice que cuenta con el modelo de IA generativa más grande de la región, Falcon, que fue lanzado por el Consejo de Investigación de Tecnología Avanzada de Abu Dhabi y el Instituto de Innovación Tecnológica (TII) en marzo.

Sello de tiempo:

Mas de MetaNoticias