Мы запускаем классификатор, обученный различать текст, написанный искусственным интеллектом, и текст, написанный человеком.
Мы обучили классификатор различать текст, написанный человеком, и текст, написанный ИИ от разных поставщиков. Хотя невозможно надежно обнаружить весь текст, написанный ИИ, мы считаем, что хорошие классификаторы могут информировать о смягчении ложных утверждений о том, что текст, созданный ИИ, был написан человеком: например, запуск автоматизированные кампании дезинформации, использование инструментов ИИ для академической нечестности и позиционирование чат-бота с искусственным интеллектом как человека.
Наш классификатор не является полностью надежным. В наших оценках «проблемного набора» английских текстов наш классификатор правильно идентифицировал 26% написанного ИИ текста (истинные положительные результаты) как «вероятно написанный ИИ», в то время как текст, написанный человеком, неправильно помечал как написанный ИИ 9% текстов. время (ложные срабатывания). Надежность нашего классификатора обычно повышается по мере увеличения длины входного текста. По сравнению с нашим ранее выпущенный классификатор, этот новый классификатор значительно надежнее работает с текстом из более поздних систем искусственного интеллекта.
Мы сделали этот классификатор общедоступным, чтобы получить отзывы о том, полезны ли такие несовершенные инструменты, как этот. Наша работа по обнаружению текста, сгенерированного ИИ, будет продолжена, и мы надеемся поделиться улучшенными методами в будущем.
Попробуйте наш бесплатный классификатор незавершенных работ самостоятельно:
ограничения
Наш классификатор имеет ряд важных ограничений. Его не следует использовать в качестве основного инструмента принятия решений., а вместо этого как дополнение к другим методам определения источника фрагмента текста.
- Классификатор очень ненадежен для коротких текстов (менее 1,000 символов). Даже более длинные тексты иногда неправильно помечаются классификатором.
- Иногда текст, написанный человеком, будет ошибочно, но уверенно помечен нашим классификатором как написанный ИИ.
- Мы рекомендуем использовать классификатор только для английского текста. Он работает значительно хуже на других языках и ненадежен в коде.
- Текст, который очень предсказуем, не может быть надежно идентифицирован. Например, невозможно предсказать, кем был составлен список первых 1,000 простых чисел: искусственным интеллектом или людьми, потому что правильный ответ всегда один и тот же.
- Текст, написанный ИИ, можно редактировать, чтобы избежать классификатора. Такие классификаторы, как наш, можно обновлять и переобучать на основе успешных атак, но неясно, имеет ли обнаружение преимущество в долгосрочной перспективе.
- Известно, что классификаторы на основе нейронных сетей плохо откалиброваны вне своих обучающих данных. Для входных данных, которые сильно отличаются от текста в нашем обучающем наборе, классификатор иногда очень уверен в неправильном прогнозе.
Обучение классификатора
Наш классификатор представляет собой языковую модель, точно настроенную на наборе данных, состоящем из пар текста, написанного человеком, и текста, написанного ИИ, по одной и той же теме. Мы собрали этот набор данных из различных источников, которые, как мы полагаем, написаны людьми, таких как данные предварительной подготовки и демонстрации людьми на подсказках, отправленных в ИнструктироватьGPT. Мы разделили каждый текст на подсказку и ответ. На эти запросы мы генерировали ответы из множества различных языковых моделей, обученных нами и другими организациями. Для нашего веб-приложения мы настраиваем порог достоверности, чтобы поддерживать низкий уровень ложных срабатываний; Другими словами, мы помечаем текст как вероятно написанный ИИ только в том случае, если классификатор очень уверен.
Воздействие на педагогов и призыв к участию
Мы признаем, что идентификация текста, написанного ИИ, была важным предметом обсуждения среди преподавателей, и не менее важно признать ограничения и влияние классификаторов текста, созданных ИИ, в классе. Мы разработали предварительный ресурс об использовании ChatGPT для преподавателей, в котором описаны некоторые варианты использования и связанные с ними ограничения и соображения. Хотя этот ресурс предназначен для преподавателей, мы ожидаем, что наш классификатор и связанные с ним инструменты классификатора окажут влияние на журналистов, исследователей недостоверной/дезинформации и другие группы.
Мы взаимодействуем с преподавателями в США, чтобы узнать, что они видят в своих классах, и обсудить возможности и ограничения ChatGPT, и мы будем продолжать расширять нашу работу по мере изучения. Это важные обсуждения, которые являются частью нашей миссии — безопасного развертывания больших языковых моделей в прямом контакте с пострадавшими сообществами.
Если эти проблемы непосредственно затрагивают вас (включая, помимо прочего, учителей, администраторов, родителей, учащихся и поставщиков образовательных услуг), сообщите нам об этом, используя эта форма. Прямая обратная связь по предварительный ресурс полезно, и мы также приветствуем любые ресурсы, которые педагоги разрабатывают или сочли полезными (например, руководства по курсу, обновления кодекса чести и политики, интерактивные инструменты, программы повышения грамотности в области ИИ).
- SEO-контент и PR-распределение. Получите усиление сегодня.
- Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. Доступ здесь.
- Источник: https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/
- 000
- 1
- 26%
- 7
- a
- академический
- администраторы
- плюс
- AI
- AI chatbot
- Все
- всегда
- среди
- и
- ответ
- приложение
- связанный
- нападки
- доступен
- основанный
- , так как:
- верить
- ниже
- между
- расширять
- призывают
- не могу
- возможности
- символы
- Chatbot
- ChatGPT
- требования
- код
- Сообщества
- сравненный
- комплемент
- доверие
- уверенный
- уверенно
- соображения
- обращайтесь
- продолжать
- Беседы
- "Курс"
- данным
- Принятие решений
- развертывание
- обнаружение
- определения
- развитый
- развивающийся
- различный
- направлять
- непосредственно
- обсуждать
- обсуждение
- выделить
- Разделенный
- каждый
- Обучение
- педагогов
- привлечение
- Английский
- одинаково
- оценки
- Даже
- пример
- ожидать
- чрезвычайно
- Обратная связь
- First
- внимание
- найденный
- Бесплатно
- от
- полностью
- будущее
- генерируется
- получить
- хорошо
- Группы
- методические рекомендации
- полезный
- надежды
- HTTPS
- человек
- Людей
- идентифицированный
- идентифицирует
- идентифицирующий
- Влияние
- влияние
- Воздействие
- важную
- что она
- улучшенный
- in
- В других
- В том числе
- неверно
- Увеличивает
- вход
- вместо
- интерактивный
- вопросы
- IT
- Журналисты
- Сохранить
- известный
- маркировка
- язык
- Языки
- большой
- запуск
- УЧИТЬСЯ
- Длина
- Вероятно
- недостатки
- Ограниченный
- рамки
- Список
- грамотность
- долгосрочный
- дольше
- Низкий
- Создание
- отметка
- методы
- дезинформация
- Наша миссия
- модель
- Модели
- БОЛЕЕ
- сетей
- нейронные сети
- Новые
- номер
- номера
- ONE
- OpenAI
- организации
- Другое
- контуры
- аутрич
- внешнюю
- пар
- родители
- часть
- выполняет
- кусок
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- пожалуйста
- Точка
- политика
- позиционирование
- положительный
- предсказывать
- предсказуемый
- прогноз
- первичный
- Простое число
- Программы
- обеспечивать
- поставщики
- публично
- Обменный курс
- последний
- признавать
- рекомендовать
- выпустил
- надежность
- складская
- исследователи
- ресурс
- Полезные ресурсы
- ответ
- Бег
- безопасно
- то же
- видя
- обслуживание
- поставщики услуг
- набор
- Поделиться
- Короткое
- должен
- существенно
- некоторые
- Источник
- Источники
- Студенты
- представленный
- успешный
- такие
- системы
- учителя
- Ассоциация
- Источник
- их
- порог
- в
- инструменты
- тема
- специалистов
- Обучение
- правда
- типично
- обновление
- Updates
- us
- использование
- разнообразие
- Web
- добро пожаловать
- Что
- будь то
- который
- в то время как
- будете
- слова
- Работа
- письменный
- Неправильно
- себя
- зефирнет