По данным CNN, команда ученых, исследователей и инженеров из Объединенных Арабских Эмиратов (ОАЭ) представила нового чат-бота с генеративным искусственным интеллектом под названием Jais, предназначенного специально для людей, говорящих на арабском языке по всему миру.
Команда утверждает, что арабский язык, шестой наиболее распространенный язык в мире, на котором говорят около 272 миллионов человек, «недостаточно представлен в основном ИИ». Они надеются положить конец доминированию английского языка в обучающих системах искусственного интеллекта, известных как большие языковые модели (LLM).
Чат-бот Jais AI ориентирован на Ближний Восток
Языковая проблема в искусственном интеллекте вызывает обеспокоенность во всем мире. Япония недавно отказалась от английского языка, поскольку страна создает собственную версию ChatGPT. Исследователи — сказал Хотя чат-бот OpenAI превосходно владеет английским языком, он часто не справляется с японским «из-за различий в системе алфавита, ограниченности данных и других факторов».
Джейс назван в честь горы в ОАЭ, сообщает CNN. отчету говорит и может выполнять задачи по команде, например писать стихи, так же, как и ChatGPT или Google Bard, но в ограниченном масштабе. ИИ обучается на 13 миллиардах параметров данных, что очень далеко по сравнению с почти 3.5 миллиардами параметров ChatGPT 175, что является показателем размера большой языковой модели, но не ее точности.
По словам Тимоти Болдуина, профессора обработки естественного языка в Университете искусственного интеллекта Мохамеда бен Заеда (MBZUAI) в Абу-Даби, планируется расширить набор данных Джайса до 30 миллиардов параметров и позволить ему читать изображения и графики, а не только текст.
Для создания Jais университет работал с Cerebras Systems и Inception из Силиконовой долины, дочерней компанией базирующейся в ОАЭ компании G42, занимающейся искусственным интеллектом. Болдуин сказал, что, хотя конкурирующие LLM, такие как LLaMA от Meta и GPT от OpenAI, понимают арабский язык, они преимущественно обучаются на онлайн-данных на английском языке.
Для Джайса обучение включало сочетание наборов данных как на английском, так и на арабском языках, но с преднамеренным акцентом на контент с Ближнего Востока, где на арабском языке широко говорят и пишут.
Болдуин сказал, что такой фокус позволяет чат-боту с искусственным интеллектом выйти за рамки «того, чего кто-либо другой смог достичь для арабского языка».
По словам MBZUAI, уникальное обучение Джайса помогает чат-боту «понимать культурные нюансы и диалекты», что делает его более полезным для широкого спектра различных отраслей. Разработчики сделали модель общедоступной с открытым исходным кодом, что означает, что каждый может настроить ее.
Переключение между диалектами
Болдуин рассказал CNN, что разнообразная подготовка данных Джайсом позволит ему переключаться между диалектами современного стандартного арабского языка, который используется для официальных документов и формальной письменной речи, и местными диалектами, которые обычно используются в блогах или социальных сетях.
«Конечно, здесь есть возможности для улучшения, но основное внимание уделялось надежности с точки зрения возможности понять, есть ли у нас более неформальные входные данные для модели», — сказал он.
Как и другие чат-боты с генеративным искусственным интеллектом, Jais создан так, чтобы сопротивляться подсказкам, которые создают «токсичный или вредный» отвечает, сказал Болдуин, и не будет отвечать на вопросы, которые «приводят к членовредительству или предполагают зависимость». Такие темы, как гомосексуальность, запрещены в соответствии с мусульманскими верованиями.
Читайте также: Зависимость ChatGPT от «английского языка» вынудила Японию создать собственного чат-бота с искусственным интеллектом
По словам Мохаммеда Солимана, директора стратегических технологий и программы кибербезопасности Института Ближнего Востока в Вашингтоне, округ Колумбия, языки на основе латинского алфавита, такие как английский, господствовать в Интернете, а это означает, что наборы данных являются самыми большими на этих языках.
«Предоставление доступа к инструментам ИИ исключительно тем, кто говорит на определенных языках, может помешать обездоленным слоям общества воспользоваться преимуществами ИИ», — сказал он.
«[Эти LLM] не осведомлены о других культурах, что отрицательно влияет на пользовательский опыт для людей разного происхождения», — добавил Солиман, как сообщает CNN.
ОАЭ добились значительных успехов в разработке генеративных систем искусственного интеллекта. Эмират стал первой страной в мире, назначившей министр искусственного интеллекта в 2017 году. Сообщается, что он также может похвастаться крупнейшей в регионе моделью генеративного искусственного интеллекта Falcon, которая была выпущена Советом по исследованиям передовых технологий Абу-Даби и Институтом технологических инноваций (TII) в марте.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://metanews.com/uaes-new-ai-chatbot-jais-caters-to-arabic-speakers-challenging-english-bias/
- :имеет
- :является
- :нет
- :куда
- 13
- 2017
- 30
- 7
- a
- в состоянии
- ученые
- доступ
- По
- точность
- Достигать
- добавленный
- продвинутый
- Передовые технологии
- неблагоприятно
- затрагивающий
- После
- AI
- AI chatbot
- Системы искусственного интеллекта
- позволяет
- Алфавит
- причислены
- и
- ответы
- кто угодно
- арабский
- Арабские Эмираты
- арабский
- МЫ
- Утверждает
- около
- искусственный
- искусственный интеллект
- AS
- At
- доступен
- осведомленность
- фоны
- было
- не являетесь
- убеждений
- Преимущества
- между
- Beyond
- миллиард
- BIN
- блоги
- хвастается
- изоферменты печени
- оценки
- строит
- построенный
- но
- by
- под названием
- CAN
- обслуживать
- обслуживает
- конечно
- Chatbot
- chatbots
- ChatGPT
- ЦРУ
- CNN
- сочетание
- сравненный
- Беспокойство
- содержание
- может
- Совет
- страна
- Создайте
- культурный
- настроить
- кибер-
- информационная безопасность
- данным
- Наборы данных
- dc
- зависимость
- застройщиков
- развивающийся
- Различия
- различный
- директор
- Разное
- do
- Документация
- Господство
- восток
- еще
- Emirates
- эмираты
- включить
- конец
- Инженеры
- Английский
- Эксклюзивные
- Расширьте
- опыт
- факторы
- Водопад
- далеко
- Большая разница
- Фирма
- Во-первых,
- Фокус
- фокусируется
- Что касается
- формальный
- от
- генеративный
- Генеративный ИИ
- Go
- Графики
- Есть
- he
- помогает
- High
- надеясь
- HTML
- HTTPS
- if
- изображений
- улучшение
- in
- начало
- промышленности
- неформальный
- Инновации
- затраты
- вместо
- Институт
- Интеллекта
- Интернет
- вовлеченный
- вопрос
- IT
- ЕГО
- Япония
- Японский
- JPG
- всего
- известный
- Отсутствие
- язык
- Языки
- большой
- крупнейших
- латинский
- такое как
- Ограниченный
- линия
- Лама
- локальным
- сделанный
- Mainstream
- Создание
- Март
- макс-ширина
- смысл
- проводить измерение
- Медиа
- средняя
- Ближний Восток
- миллиона
- модель
- Модели
- Модерн
- Mohamed
- Мухаммед
- БОЛЕЕ
- гора
- Названный
- натуральный
- Обработка естественного языка
- природа
- Возле
- Новые
- нюансы
- of
- Официальный представитель в Грузии
- .
- on
- онлайн
- открытый
- с открытым исходным кодом
- or
- Другое
- внешний
- собственный
- параметры
- Люди
- Выполнять
- Планы
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- преимущественно
- предотвращать
- обработка
- Профессор
- FitPartner™
- что такое варган?
- Запросы
- ассортимент
- Читать
- жатва
- недавно
- выпустил
- Сообщается
- исследованиям
- исследователи
- Реагируйте
- Соперник
- прочность
- Комната
- s
- Сказал
- говорит
- Шкала
- безопасность
- Короткое
- значительный
- кремний
- шестой
- Размер
- Соцсети
- социальные сети
- Источник
- говорить
- динамики
- конкретный
- конкретно
- говорят
- стандарт
- Стратегический
- успехи
- вспомогательный
- такие
- Коммутатор
- система
- системы
- задачи
- команда
- технологии
- Технологии
- Технологические инновации
- terms
- текст
- который
- Ассоциация
- мир
- Там.
- Эти
- они
- те
- в
- заявил
- инструменты
- Темы
- специалистов
- Обучение
- ОАЭ
- понимать
- созданного
- Объединенный
- Объединенный Араб
- Объединенные Арабские Эмираты
- Университет
- представила
- используемый
- Информация о пользователе
- Пользовательский опыт
- обычно
- версия
- законопроект
- Вашингтон
- we
- который
- в то время как
- КТО
- широкий
- Широкий диапазон
- широко
- будете
- работавший
- Мир
- по всему миру
- письмо
- письменный
- заед
- зефирнет