OpenAI утверждает, что GPT-4 победит 90% из вас на экзамене

Переиздано Платоном

Читают: 0

OpenAI утверждает, что GPT-4 превзойдет 90% из вас на экзамене PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Во вторник OpenAI объявила о выпуске GPT-4, последней вехи в создании моделей глубокого обучения с вызовом и ответом, которая, по-видимому, может превзойти своих плотских создателей на важных экзаменах.

Согласно OpenAI, модель демонстрирует «производительность на уровне человека в различных профессиональных и академических тестах». GPT-4 может сдать смоделированный экзамен на адвоката среди 10% лучших тестируемых, тогда как его предшественник, GPT-3.5 (основа ChatGPT), набрал около 10% худших.

GPT-4 также хорошо показал себя на других экзаменах, таких как SAT Math (700 из 800). Однако он не универсален, набрав всего 2 балла по английскому языку и композиции AP (от 14-го до 44-го процентиля).

GPT-4 — это большая мультимодальная модель, в отличие от большой языковой модели. Он предназначен для приема запросов через ввод текста и изображений с ответами, возвращаемыми в виде текста. Первоначально он доступен через API GPT-4 из списка ожидания и для подписчиков ChatGPT Plus только в текстовом формате. Ввод на основе изображений все еще совершенствуется.

Несмотря на добавление механизма визуального ввода, OpenAI не раскрывает и не обеспечивает наглядность создания своей модели. Выскочка решила не разглашать подробности о своем размере, о том, как его обучали и какие данные использовались в процессе.

«Учитывая как конкурентную среду, так и последствия для безопасности крупномасштабных моделей, таких как GPT-4, этот отчет не содержит дополнительных сведений об архитектуре (включая размер модели), оборудовании, обучающих вычислениях, построении набора данных, методе обучения и т. п.», компания заявила в своем техническая документация [PDF].

В прямая трансляция на YouTube, Грег Брокман, президент и соучредитель OpenAI, продемонстрировал разницу между GPT-4 и GPT-3.5, попросив модели обобщить OpenAI GPT-4. блоге в одном предложении, где каждое слово начинается с буквы «Г».

GPT-3.5 просто не пробовал. GPT 4 ответил: «GPT-4 обеспечивает новаторские, грандиозные достижения, значительно стимулирующие общие цели ИИ». И когда Брокман сказал модели, что включение «ИИ» в предложение не считается, GPT-4 пересмотрел свой ответ в другом предложении, нагруженном G, без «ИИ» в нем.

Затем он попросил GPT-4 сгенерировать код Python для бота Discord. Что еще более впечатляюще, он сфотографировал нарисованный от руки макет веб-сайта с шутками, отправил изображение в Discord, и связанная с ним модель GPT-4 ответила кодом HTML и JavaScript для реализации макета сайта.

Наконец, Брокман настроил GPT-4 для анализа 16 страниц налогового кодекса США, чтобы вернуть стандартный вычет для пары Алисы и Боба с особыми финансовыми обстоятельствами. Модель OpenAI ответила правильным ответом вместе с объяснением задействованных вычислений.

Помимо улучшения рассуждений, о чем свидетельствуют улучшенные результаты тестов, GPT-4 предназначен для более совместной работы (повторение в соответствии с указаниями для улучшения предыдущего вывода), лучшей способности обрабатывать большие объемы текста (анализировать или выводить фрагменты длиной около 25,000 XNUMX слов). , и приема входных данных на основе изображений (для распознавания объектов, хотя эта возможность еще не общедоступна).

Более того, согласно OpenAI, у GPT-4 меньше шансов сойти с рельсов, чем у его предшественников.

«Мы потратили шесть месяцев итеративно выравнивание GPT-4 использует уроки нашей программы состязательного тестирования, а также ChatGPT, что приводит к нашим лучшим результатам (хотя и далеким от совершенства) по фактичности, управляемости и отказу выходить за пределы ограждений», — говорится в сообщении организации. говорит.

Люди могут быть уже знакомы с этим «далеко от совершенства» уровнем безопасности от скалистый дебют возможностей Microsoft Bing для ответов на вопросы, которые, как оказалось, использует GPT-4 в качестве основы для модели Прометея.

OpenAI признает, что GPT-4 «галлюцинирует факты и делает ошибки в рассуждениях», как и его предки, но организация настаивает на том, что модель делает это в меньшей степени.

GPT-4 значительно уменьшает галлюцинации по сравнению с предыдущими моделями

«Хотя GPT-4 все еще представляет собой реальную проблему, он значительно уменьшает галлюцинации по сравнению с предыдущими моделями (которые улучшались с каждой итерацией)», — поясняет компания. «GPT-4 оценивается на 40 процентов выше, чем наш последний GPT-3.5 по нашим внутренним состязательным оценкам достоверности».

Цена GPT-4 составляет 0.03 доллара США за 1 тыс. токенов подсказок и 0.06 доллара США за 1 тыс. токенов завершения, если токен около четырех персонажей. Также существует ограничение скорости по умолчанию: 40,000 200 токенов в минуту и XNUMX запросов в минуту.

Кроме того, OpenAI с открытым исходным кодом Эвалс, программа для оценки и сравнительного анализа моделей машинного обучения, включая собственную.

Несмотря на постоянную озабоченность по поводу рисков, связанных с ИИ, существует спешка с выводом моделей ИИ на рынок. В тот же день, когда прибыл GPT-4, Anthropic, стартап, созданный бывшими сотрудниками OpenAI, выпустили свой собственный помощник на основе чата по имени Клод для обработки сводки и генерации текста, поиска, вопросов и ответов, кодирования и многого другого. Это также доступно через ограниченный предварительный просмотр.

И Google, обеспокоенный отставанием в маркетинге моделей AP, дразнил выкатывать API под названием PaLM для взаимодействия с различными большими языковыми моделями и средой прототипирования под названием MakerSuite.

Несколькими неделями ранее Facebook запустил свой Большая языковая модель LLaMA, который в настоящее время превратился в Альпака модель Стэнфордскими исследователями, которые Регистр будет освещать более подробно позже.

«Предстоит еще много работы, и мы с нетерпением ждем возможности улучшить эту модель благодаря коллективным усилиям сообщества, создающего, исследующего и вносящего свой вклад в модель», — заключает OpenAI. ®

SEO-контент и PR-распределение. Получите усиление сегодня.
Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. Доступ здесь.
Источник: https://go.theregister.com/feed/www.theregister.com/2023/03/14/openai_gpt4_ai/

Отметка времени: 14 марта 2023

Отметка времени: 9 февраля, 2024

OpenAI утверждает, что GPT-4 победит 90% из вас на экзамене

Переиздано Платоном

Больше от Регистр

OpenAI восстанавливает права ChatGPT на просмотр Интернета

Великобритания запретила Китаю лицензировать технологию роботизированного зрения Манчестер Юни

Британские закупки не подходят для внедрения ИИ в армию

HPE использует OpsRamp, чтобы добавить несколько AIOps в мультиоблачную среду Greenlake

Ограждения безопасности искусственного интеллекта легко сломать, показало исследование безопасности

Генеральный директор SoftBank Масаеши Сон прогнозирует AGI через десять лет

«Серьезный сбой» затронул API ChatGPT и OpenAI

Возможность, вызов, обещание?

Человек побеждает в конкурсе с произведениями искусства, созданными искусственным интеллектом, и некоторые люди недовольны

Масштабирование вершины эффективного ИИ

Индия будет использовать ракету ИИ ответственно, а не регулировать

О Нас

Вертикальный поиск и AI

Платформа

Оставайтесь на связи

Учетная запись