LLaMA, последняя крупная языковая модель Meta, просочилась в Интернет и доступна для загрузки, несмотря на очевидные попытки ограничить доступ только в исследовательских целях.
Владелец Facebook объявило в феврале он выпускал модель ограниченным тиражом, чтобы выбрать ученых, представителей правительства и компании, с которыми можно было бы поиграть на фоне опасений. ЛАМА могут быть использованы не по назначению. Но информация хочет быть бесплатной, или, по крайней мере, некоторые люди хотят, чтобы это было так, и творение Меты все равно попало в сеть, начиная с утечки через торрент.
Большие языковые модели прогнозирования предложений, которые генерируют отрывки текста из подсказок ввода, постоянно развиваются: от автоматического завершения письма до чат-ботов, способных выполнять задачи, когда их об этом просят, используя естественный язык.
Эксперты предупреждают, что эта технология может быть использована для автоматизации производства большого количества поддельных новостей, спама, фишинговых писем, дезинформации, подстрекательства и т. д. на долгие годы. Организации, создающие эти модели, часто держат программное обеспечение в тайне, за API или выпускают ограниченные версии или демоверсии.
«Необходимо провести дополнительные исследования, чтобы устранить риски предвзятости, токсичных комментариев и галлюцинаций в больших языковых моделях», — говорит Мета. — сказал на прошлой неделе.
«Как и другие модели, LLaMA разделяет эти проблемы. В качестве базовой модели LLaMA разработана так, чтобы быть универсальной и может применяться во многих различных случаях использования, в отличие от тонко настроенной модели, предназначенной для конкретной задачи.
«Чтобы сохранить целостность и предотвратить неправильное использование, мы выпускаем нашу модель под некоммерческой лицензией, ориентированной на исследовательские варианты использования. Доступ к модели будет предоставляться академическим исследователям в каждом конкретном случае; те, кто связан с правительственными организациями, гражданским обществом и академическими кругами; и отраслевые исследовательские лаборатории по всему миру».
Практическое руководство
Но попытки Меты контролировать доступ к LLaMA оказались напрасными, по крайней мере, так кажется. Вскоре после обмена моделью с избранными учеными, а также представителями промышленности и гражданского общества, кто-то на 4Chan опубликовал подробную информацию о том, как получить всю модель через одноранговый обмен файлами, и в конечном итоге инструкция как все это скачать были опубликованы на GitHub.
Как всегда, соблюдайте осторожность при извлечении подобных материалов с торрентов на случай, если кто-то спрятал там что-то гнусное. Нам сказали, что модель с 65 миллиардами параметров занимает около 220 ГБ дискового пространства.
Мы отмечаем, что копии LLaMA, доступные через GitHub, кажутся законными. Шон Прессер, Инженер ИИ который написал инструкции по загрузке на сайте обмена кодом Microsoft, показал нам скриншоты того, как он успешно генерирует текст из модели. Он считает, что исследователь, которому был предоставлен доступ к модели из Meta, слил ее, что, возможно, привело к ее более широкому, чем ожидалось, распространению.
Запустите свои двигатели теории заговора.
Прессер считает, что лучше выпускать модель бесплатно без каких-либо оговорок, чем ограничивать ее только утвержденными учеными. «Я думаю, что хорошее перевесит плохое, по крайней мере, в десять раз. Вероятно, ближе к 100x», — сказал он. Регистр.
Вообще говоря, обучение и запуск современных больших языковых моделей стоит дорого; только организации, имеющие доступ к множеству графических процессоров и другой инфраструктуре, могут создавать, настраивать и тестировать их. Исследователи ИИ в Meta построил LLaMA, чтобы быть меньше, что делает его более компактным, чем сегодняшние коммерческие модели, и, следовательно, более доступным для ученых и разработчиков с нетривиальными ИТ-бюджетами.
Гуру машинного обучения Meta заявили, что их система превзошла GPT-3 OpenAI и не уступает другим моделям больших языков, таким как PaLM от Google с 540 миллиардами параметров или Chinchilla от DeepMind с 70 миллиардами параметров. Меньший размер означает, что его будет проще использовать ученым, у которых меньше вычислительных ресурсов. И да, существует множество языковых моделей всех форм и размеров; это больше, чем просто OpenAI и Facebook.
LLaMA по-прежнему требует сотен гигабайт дискового пространства и приличного объема вычислительных ресурсов для его работы. Запустить и запустить модель также непросто, если только вы не привыкли работать с системами такого типа, а перепрофилирование ее для более гнусных действий также потребует дополнительных технических знаний. Несмотря на утечку модели, Meta заявила, что продолжит делиться LLaMA только с избранными исследователями.
Мы считаем, что текущая стратегия выпуска позволяет нам сбалансировать ответственность и открытость.
«Цель Meta — поделиться современными моделями ИИ с членами исследовательского сообщества, чтобы помочь нам оценить и улучшить эти модели», — сказал представитель. Регистр.
«LLaMA был предоставлен для исследовательских целей, в соответствии с тем, как мы делились предыдущими моделями больших языков. Хотя модель доступна не для всех, и некоторые пытались обойти процесс утверждения, мы считаем, что текущая стратегия выпуска позволяет нам сбалансировать ответственность и открытость».
Другими словами, группа Facebook придерживается своего подхода к распространению своих технологий.
Недавние попытки Meta выпустить большие языковые модели не прошли гладко. В прошлом году его болтливый BlenderBot был критике за распространение дезинформации и антисемитских взглядов. «Галактика», призванная обобщить научные знания, была удаленный через три дня после запуска за создание фейкового и расистского контента. ®
- SEO-контент и PR-распределение. Получите усиление сегодня.
- Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. Доступ здесь.
- Источник: https://go.theregister.com/feed/www.theregister.com/2023/03/08/meta_llama_ai_leak/
- :является
- $UP
- 7
- a
- О нас
- Академия
- академический
- доступ
- доступной
- активно
- адрес
- Аффилированные
- После
- AI
- Все
- позволяет
- всегда
- Среди
- количество
- суммы
- и
- API
- очевидный
- появиться
- прикладной
- подхода
- утверждение
- утвержденный
- МЫ
- около
- AS
- At
- попытки
- автоматизировать
- доступен
- Плохой
- Баланс
- основа
- BE
- за
- не являетесь
- верить
- считает,
- Лучшая
- смещение
- Бюджеты
- строить
- Строительство
- by
- CAN
- способный
- случаев
- случаев
- определенный
- проблемы
- chatbots
- заявил
- ближе
- CO
- как
- Комментарии
- коммерческая
- сообщество
- Компании
- Вычисление
- последовательный
- Заговор
- содержание
- продолжать
- контроль
- может
- создание
- Текущий
- Дней
- DeepMind
- Демос
- предназначенный
- Несмотря на
- подробнее
- застройщиков
- различный
- дезинформация
- распространять
- распределение
- скачать
- Драма
- управлять
- легче
- усилия
- Писем
- Двигатели
- оценивать
- со временем
- эволюционировали
- Упражнение
- дорогим
- опыта
- что его цель
- не настоящие
- поддельные новости
- Фэшн
- страх
- февраль
- Файл
- внимание
- Что касается
- вперед
- найденный
- Год основания
- Бесплатно
- от
- далее
- в общем
- порождать
- порождающий
- получающий
- GitHub
- данный
- цель
- хорошо
- Правительство
- Графические процессоры
- предоставленный
- группы
- Управляемость
- Есть
- помощь
- Скрытый
- Как
- How To
- HTTPS
- Сотни
- i
- улучшать
- in
- промышленность
- информация
- Инфраструктура
- вход
- инструкции
- целостность
- IT
- ЕГО
- JPG
- Сохранить
- Вид
- знания
- язык
- большой
- Фамилия
- В прошлом году
- последний
- запустили
- ведущий
- утечка
- Утечки
- Законный
- Лицензия
- такое как
- ОГРАНИЧЕНИЯ
- Ограниченный
- Лама
- поддерживать
- Создание
- многих
- означает
- Мега
- Участники
- Мета
- Microsoft
- дезинформация
- модель
- Модели
- БОЛЕЕ
- имя
- натуральный
- потребности
- Новости
- получать
- of
- on
- ONE
- онлайн
- OpenAI
- Открытость
- организации
- Другое
- владелец
- ладонь
- пиринговых
- Люди
- выполнения
- возможно
- фишинг
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- Играть
- полнокровие
- должность
- размещены
- предотвращать
- предыдущий
- вероятно
- процесс
- опубликованный
- целей
- RE
- последний
- освободить
- требовать
- требуется
- исследованиям
- исследователь
- исследователи
- Полезные ресурсы
- ответственность
- рисках,
- Бег
- s
- Сказал
- научный
- Ученые
- скриншоты
- выбранный
- формы
- Поделиться
- общие
- Акции
- разделение
- вскоре
- должен
- сайте
- Размер
- Размеры
- меньше
- плавно
- So
- Общество
- Software
- некоторые
- Кто-то
- удалось
- Space
- спам
- Говоря
- конкретный
- докладчик
- Распространение
- стоит
- Начало
- современное состояние
- По-прежнему
- диск
- прямой
- Стратегия
- Успешно
- такие
- суммировать
- система
- системы
- принимает
- Сложность задачи
- задачи
- технологии
- Технический
- Технологии
- тестXNUMX
- который
- Ассоциация
- мир
- их
- Их
- Там.
- Эти
- три
- в
- сегодня
- поток
- Типы
- под
- us
- использование
- тщеславный
- разносторонний
- Против
- с помощью
- Просмотры
- Путь..
- неделя
- который
- в то время как
- КТО
- все
- будете
- без
- слова
- Мир
- письмо
- год
- лет
- Ты
- ВАШЕ
- зефирнет