Корейский веб-гигант Naver на прошлой неделе представил семейство больших языковых моделей под названием HyperCLOVA X, которые, по его утверждению, лучше справляются с межъязыковым рассуждением на азиатских языках, чем другие модели, и, следовательно, могут помочь региону в разработке суверенных больших языковых моделей.
Naver объявило дебют HyperCLOVA X на корейском языке и указал на англоязычную версию технический отчет в журнале открытого доступа arXiv, в котором утверждается: «Мы считаем, что HyperCLOVA X – с его конкурентоспособными возможностями на английском и других языках, помимо корейского, – может предоставить полезное руководство для регионов и стран по развитию собственных независимых программ LLM».
LLM прошли предварительное обучение на данных, «состоящих из корейских, многоязычных и кодовых сегментов».
Многоязычное подмножество состояло преимущественно из английского языка, но также включало множество других языков, таких как японский, немецкий и французский.
Материал на корейском языке составлял около трети данных перед обучением, что указывает на то, что Naver решил улучшить производительность своих моделей на своем родном языке. В процессе предварительной подготовки также учитывались особенности грамматики корейского языка.
Результатом этих усилий, как утверждает Naver, являются модели, «с присущим знанием корейского и английского языков».
Более того, модели демонстрируют «многоязычность» — способность работать на языках, отличных от тех, которым они были обучены.
«Наш анализ показывает, что HyperCLOVA X не только способна расширить свои возможности рассуждения за пределы своих основных целевых языков, но также достичь современного уровня в машинном переводе между корейским и нецелевыми языками, такими как японский и китайский», — заявил исследователь. говорится в техническом отчете. «Впечатляющие многоязычные возможности HyperCLOVA X также включают межъязыковой перевод между корейским и английским языками, при этом настройка инструкций на одном языке может привести к появлению возможностей выполнения инструкций на другом», — добавили в компании.
Результаты многоязычного тестирования привели разработчика к выводу, что HyperCLOVA X «можно перенести на азиатские языки, которые недостаточно представлены в данных предварительного обучения».
Суверенный ИИ становится необходимым национальным потенциалом – средством обеспечения безопасности данных и снижения зависимости от оффшорных поставщиков. Nvidia поддержала эту концепцию, которая по совпадению может создать еще больший рынок для ее продукции.
Но, как отмечается в техническом отчете Naver, английская и североамериканская культуры «чрезвычайно перепредставлены в корпусах предварительной подготовки» для существующих основных программ LLM.
«Следовательно, эти LLM демонстрируют ограничения в своей способности обрабатывать и понимать неанглийские языки, такие как корейский, который воплощает в себе отличительные культурные нюансы, геополитические ситуации и другие региональные особенности, а также уникальные лингвистические атрибуты», — поясняет он.
Региональный тяжеловес Китай стремился развивать LLM в своих национальных интересах – или, по крайней мере, в интересах КПК – чтобы переменный успех. Тем не менее, чат-боты, такие как ERNIE от Baidu, получил более 100 миллионов пользователей к концу 2023 года.
Нак-хо-Сеон, глава подразделения Naver Cloud Hyperscale AI, заявил, что планирует «в будущем создать специализированный сверхмасштабный ИИ для различных регионов и стран».
Между тем, технический отчет включает в себя обязательство «исследовать мультимодальность с целью расширить возможности HyperCLOVA X по беспрепятственной обработке и интеграции различных типов данных, таких как текст, изображения и аудио», стремясь при этом оптимизировать возможности модели для вывода.
Naver заявил, что «активно исследует интеграцию внешних инструментов и API для расширения функциональности модели» — это начинание, по его мнению, «позволит HyperCLOVA X получить доступ к специализированным наборам данных и сервисам». ®
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://go.theregister.com/feed/www.theregister.com/2024/04/08/naver_cloud_hyperclova_llm_sovereign_ai/
- :имеет
- :является
- :нет
- :куда
- $UP
- 100
- 2023
- 7
- a
- способности
- способность
- в состоянии
- доступ
- Учетная запись
- Достигать
- активно
- добавленный
- AI
- Стремясь
- причислены
- американские
- an
- анализ
- и
- API
- МЫ
- около
- AS
- азиатский
- At
- Атрибуты
- аудио
- увеличивать
- Baidu
- BE
- верить
- считает,
- Лучшая
- между
- Beyond
- изоферменты печени
- расширять
- но
- by
- CAN
- возможности
- возможности
- Пропускная способность
- CCP
- отстаивал
- chatbots
- Китай
- китайский
- выбрал
- заявил
- облако
- CO
- код
- конкурентоспособный
- Состоит
- сама концепция
- вывод
- вследствие этого
- страны
- Создайте
- культурный
- культуры
- данным
- безопасность данных
- Наборы данных
- дебют
- дебютировало
- Дебюты
- объявленный
- Зависимость
- развивать
- Застройщик
- развивающийся
- Дисплей
- отличительный
- Разное
- усилие
- воплощает
- появление
- появление
- включить
- конец
- прилагать усилия
- Английский
- обеспечение
- Даже
- проявлять
- существующий
- Объясняет
- Больше
- продлить
- и, что лучший способ
- чрезвычайно
- семья
- Что касается
- Французский
- функциональные возможности
- будущее
- геополитический
- Немецкий
- гигант
- грамматика
- руководство
- было
- обрабатывать
- тяжеловес
- помощь
- полезный
- Главная
- HTML
- HTTPS
- изображений
- впечатляющий
- улучшать
- in
- включены
- включает в себя
- индикация
- свойственный
- интегрировать
- интеграции.
- интерес
- в
- IT
- ЕГО
- Японский
- журнал
- JPG
- Корейский
- язык
- Языки
- большой
- больше
- Фамилия
- вести
- наименее
- привело
- уровень
- такое как
- недостатки
- LLM
- машина
- сделанный
- Mainstream
- рынок
- материала
- Май..
- означает
- миллиона
- модель
- Модели
- Названный
- национальный
- Naver
- необходимо
- север
- нюансы
- Nvidia
- of
- on
- ONE
- только
- открытый
- Оптимизировать
- or
- Другое
- наши
- внешний
- за
- собственный
- особый
- Выполнять
- производительность
- Планы
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- Залог
- пунктов
- потенциал
- преимущественно
- в первую очередь
- процесс
- обеспечивать
- поставщики
- снижение
- область
- региональный
- районы
- отчету
- результат
- Итоги
- Reuters
- s
- легко
- безопасность
- поиск
- сегментами
- Услуги
- Шоу
- обстоятельства
- искать
- суверенная
- специализированный
- современное состояние
- Области
- такие
- целевое
- Технический
- Технологии
- тестXNUMX
- текст
- чем
- который
- Ассоциация
- Будущее
- их
- следовательно
- Эти
- В третьих
- те
- в
- приняли
- инструменты
- специалистов
- перевод
- переданы
- Переводы
- Типы
- недопредставленными
- понимать
- созданного
- пользователей
- разнообразие
- различный
- законопроект
- we
- Web
- неделя
- ЧТО Ж
- были
- который
- в то время как
- будете
- Работа
- X
- еще
- зефирнет