Во вторник OpenAI объявила о выпуске GPT-4, последней вехи в создании моделей глубокого обучения с вызовом и ответом, которая, по-видимому, может превзойти своих плотских создателей на важных экзаменах.
Согласно OpenAI, модель демонстрирует «производительность на уровне человека в различных профессиональных и академических тестах». GPT-4 может сдать смоделированный экзамен на адвоката среди 10% лучших тестируемых, тогда как его предшественник, GPT-3.5 (основа ChatGPT), набрал около 10% худших.
GPT-4 также хорошо показал себя на других экзаменах, таких как SAT Math (700 из 800). Однако он не универсален, набрав всего 2 балла по английскому языку и композиции AP (от 14-го до 44-го процентиля).
GPT-4 — это большая мультимодальная модель, в отличие от большой языковой модели. Он предназначен для приема запросов через ввод текста и изображений с ответами, возвращаемыми в виде текста. Первоначально он доступен через API GPT-4 из списка ожидания и для подписчиков ChatGPT Plus только в текстовом формате. Ввод на основе изображений все еще совершенствуется.
Несмотря на добавление механизма визуального ввода, OpenAI не раскрывает и не обеспечивает наглядность создания своей модели. Выскочка решила не разглашать подробности о своем размере, о том, как его обучали и какие данные использовались в процессе.
«Учитывая как конкурентную среду, так и последствия для безопасности крупномасштабных моделей, таких как GPT-4, этот отчет не содержит дополнительных сведений об архитектуре (включая размер модели), оборудовании, обучающих вычислениях, построении набора данных, методе обучения и т. п.», компания заявила в своем техническая документация [PDF].
В прямая трансляция на YouTube, Грег Брокман, президент и соучредитель OpenAI, продемонстрировал разницу между GPT-4 и GPT-3.5, попросив модели обобщить OpenAI GPT-4. блоге в одном предложении, где каждое слово начинается с буквы «Г».
GPT-3.5 просто не пробовал. GPT 4 ответил: «GPT-4 обеспечивает новаторские, грандиозные достижения, значительно стимулирующие общие цели ИИ». И когда Брокман сказал модели, что включение «ИИ» в предложение не считается, GPT-4 пересмотрел свой ответ в другом предложении, нагруженном G, без «ИИ» в нем.
Затем он попросил GPT-4 сгенерировать код Python для бота Discord. Что еще более впечатляюще, он сфотографировал нарисованный от руки макет веб-сайта с шутками, отправил изображение в Discord, и связанная с ним модель GPT-4 ответила кодом HTML и JavaScript для реализации макета сайта.
Наконец, Брокман настроил GPT-4 для анализа 16 страниц налогового кодекса США, чтобы вернуть стандартный вычет для пары Алисы и Боба с особыми финансовыми обстоятельствами. Модель OpenAI ответила правильным ответом вместе с объяснением задействованных вычислений.
Помимо улучшения рассуждений, о чем свидетельствуют улучшенные результаты тестов, GPT-4 предназначен для более совместной работы (повторение в соответствии с указаниями для улучшения предыдущего вывода), лучшей способности обрабатывать большие объемы текста (анализировать или выводить фрагменты длиной около 25,000 XNUMX слов). , и приема входных данных на основе изображений (для распознавания объектов, хотя эта возможность еще не общедоступна).
Более того, согласно OpenAI, у GPT-4 меньше шансов сойти с рельсов, чем у его предшественников.
«Мы потратили шесть месяцев итеративно выравнивание GPT-4 использует уроки нашей программы состязательного тестирования, а также ChatGPT, что приводит к нашим лучшим результатам (хотя и далеким от совершенства) по фактичности, управляемости и отказу выходить за пределы ограждений», — говорится в сообщении организации. говорит.
Люди могут быть уже знакомы с этим «далеко от совершенства» уровнем безопасности от скалистый дебют возможностей Microsoft Bing для ответов на вопросы, которые, как оказалось, использует GPT-4 в качестве основы для модели Прометея.
OpenAI признает, что GPT-4 «галлюцинирует факты и делает ошибки в рассуждениях», как и его предки, но организация настаивает на том, что модель делает это в меньшей степени.
GPT-4 значительно уменьшает галлюцинации по сравнению с предыдущими моделями
«Хотя GPT-4 все еще представляет собой реальную проблему, он значительно уменьшает галлюцинации по сравнению с предыдущими моделями (которые улучшались с каждой итерацией)», — поясняет компания. «GPT-4 оценивается на 40 процентов выше, чем наш последний GPT-3.5 по нашим внутренним состязательным оценкам достоверности».
Цена GPT-4 составляет 0.03 доллара США за 1 тыс. токенов подсказок и 0.06 доллара США за 1 тыс. токенов завершения, если токен около четырех персонажей. Также существует ограничение скорости по умолчанию: 40,000 200 токенов в минуту и XNUMX запросов в минуту.
Кроме того, OpenAI с открытым исходным кодом Эвалс, программа для оценки и сравнительного анализа моделей машинного обучения, включая собственную.
Несмотря на постоянную озабоченность по поводу рисков, связанных с ИИ, существует спешка с выводом моделей ИИ на рынок. В тот же день, когда прибыл GPT-4, Anthropic, стартап, созданный бывшими сотрудниками OpenAI, выпустили свой собственный помощник на основе чата по имени Клод для обработки сводки и генерации текста, поиска, вопросов и ответов, кодирования и многого другого. Это также доступно через ограниченный предварительный просмотр.
И Google, обеспокоенный отставанием в маркетинге моделей AP, дразнил выкатывать API под названием PaLM для взаимодействия с различными большими языковыми моделями и средой прототипирования под названием MakerSuite.
Несколькими неделями ранее Facebook запустил свой Большая языковая модель LLaMA, который в настоящее время превратился в Альпака модель Стэнфордскими исследователями, которые Регистр будет освещать более подробно позже.
«Предстоит еще много работы, и мы с нетерпением ждем возможности улучшить эту модель благодаря коллективным усилиям сообщества, создающего, исследующего и вносящего свой вклад в модель», — заключает OpenAI. ®
- SEO-контент и PR-распределение. Получите усиление сегодня.
- Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. Доступ здесь.
- Источник: https://go.theregister.com/feed/www.theregister.com/2023/03/14/openai_gpt4_ai/
- :является
- $UP
- 000
- 10
- 7
- a
- в состоянии
- О нас
- академический
- По
- дополнение
- состязательный
- AI
- уже
- анализировать
- анализ
- и
- объявило
- Другой
- ответ
- ответы
- API
- архитектура
- около
- прибытие
- AS
- связанный
- доступен
- бар
- основа
- BE
- за
- не являетесь
- бенчмаркинг
- тесты
- Лучшая
- между
- Bing
- Бот
- Дно
- приносить
- Строительство
- by
- расчеты
- под названием
- CAN
- возможности
- способный
- Пропускная способность
- ChatGPT
- выбранный
- обстоятельства
- требования
- CO
- Соучредитель
- код
- Кодирование
- совместный
- собирательный
- сообщество
- общественное строительство
- Компания
- конкурентоспособный
- завершение
- Вычисление
- Беспокойство
- в заключении исследования, финансируемого Центрами по контролю и профилактике заболеваний (CDC) и написанного бывшим начальником полиции Вермонта
- строительство
- содержит
- содействие
- Пара
- покрытие
- Создатели
- данным
- день
- глубоко
- глубокое обучение
- По умолчанию
- убивают
- предназначенный
- подробность
- подробнее
- разница
- раздор
- каждый
- Ранее
- усилия
- сотрудников
- Английский
- Окружающая среда
- ошибки
- оценки
- оценки
- Каждая
- экзамен
- Экспонаты
- Объясняет
- объяснение
- Исследование
- что его цель
- Падение
- знакомый
- несколько
- финансовый
- Что касается
- сформированный
- Бывший
- вперед
- от
- далее
- Доходы
- порождать
- генерирует
- поколение
- данный
- Go
- Цели
- значительно
- новаторское
- обрабатывать
- Управляемость
- Аппаратные средства
- Есть
- высший
- Как
- Однако
- HTML
- HTTPS
- изображение
- последствия
- важную
- улучшать
- улучшенный
- улучшение
- in
- В том числе
- включение
- первоначально
- вход
- взаимодействующий
- в нашей внутренней среде,
- вовлеченный
- вопрос
- IT
- итерация
- ЕГО
- JavaScript
- JPG
- пейзаж
- язык
- большой
- крупномасштабный
- последний
- запустили
- изучение
- меньшей
- Уроки
- письмо
- уровень
- такое как
- Вероятно
- ОГРАНИЧЕНИЯ
- Ограниченный
- посмотреть
- серия
- сделанный
- ДЕЛАЕТ
- Создание
- рынок
- Маркетинг
- математике
- механизм
- метод
- Microsoft
- веха
- минут
- модель
- Модели
- месяцев
- БОЛЕЕ
- объект
- of
- on
- ONE
- постоянный
- открытый
- OpenAI
- против
- Другое
- опережать
- выходной
- внешнюю
- собственный
- ладонь
- процент
- ИДЕАЛЬНОЕ
- производительность
- картина
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- плюс
- предшественник
- президент
- предварительный просмотр
- предыдущий
- процесс
- профессиональный
- FitPartner™
- макетирования
- обеспечение
- публично
- Питон
- Вопросы и ответы
- квалифицированный
- вопрос
- треков
- Обменный курс
- реальные
- реализовать
- признание
- снижает
- рафинированный
- отказ
- освободить
- отчету
- Запросы
- исследователи
- ответ
- в результате
- Итоги
- возвращают
- рисках,
- торопить
- s
- Сохранность
- Сказал
- то же
- счет
- Поиск
- предложение
- набор
- должен
- существенно
- аналогичный
- просто
- одинарной
- сайте
- ШЕСТЬ
- Шесть месяцев
- Размер
- So
- конкретный
- потраченный
- стандарт
- ввод в эксплуатацию
- По-прежнему
- поток
- Абоненты
- суммировать
- налог
- тестXNUMX
- Тестирование
- который
- Ассоциация
- сами
- Через
- в
- знак
- Лексемы
- топ
- Топ-10
- специалистов
- Обучение
- вторник
- Оказалось
- Выскочка
- us
- различный
- с помощью
- видимость
- Вебсайт
- Недели
- ЧТО Ж
- Что
- который
- в то время как
- будете
- без
- Word
- слова
- Работа
- беспокоиться
- Ты
- YouTube
- зефирнет