Новый классификатор AI для обозначения текста, написанного AI

Переиздано Платоном

Читают: 0

Новый классификатор ИИ для обозначения написанного ИИ текста PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Мы запускаем классификатор, обученный различать текст, написанный искусственным интеллектом, и текст, написанный человеком.

Мы обучили классификатор различать текст, написанный человеком, и текст, написанный ИИ от разных поставщиков. Хотя невозможно надежно обнаружить весь текст, написанный ИИ, мы считаем, что хорошие классификаторы могут информировать о смягчении ложных утверждений о том, что текст, созданный ИИ, был написан человеком: например, запуск автоматизированные кампании дезинформации, использование инструментов ИИ для академической нечестности и позиционирование чат-бота с искусственным интеллектом как человека.

Наш классификатор не является полностью надежным. В наших оценках «проблемного набора» английских текстов наш классификатор правильно идентифицировал 26% написанного ИИ текста (истинные положительные результаты) как «вероятно написанный ИИ», в то время как текст, написанный человеком, неправильно помечал как написанный ИИ 9% текстов. время (ложные срабатывания). Надежность нашего классификатора обычно повышается по мере увеличения длины входного текста. По сравнению с нашим ранее выпущенный классификатор, этот новый классификатор значительно надежнее работает с текстом из более поздних систем искусственного интеллекта.

Мы сделали этот классификатор общедоступным, чтобы получить отзывы о том, полезны ли такие несовершенные инструменты, как этот. Наша работа по обнаружению текста, сгенерированного ИИ, будет продолжена, и мы надеемся поделиться улучшенными методами в будущем.

Попробуйте наш бесплатный классификатор незавершенных работ самостоятельно:

ограничения

Наш классификатор имеет ряд важных ограничений. Его не следует использовать в качестве основного инструмента принятия решений., а вместо этого как дополнение к другим методам определения источника фрагмента текста.

Классификатор очень ненадежен для коротких текстов (менее 1,000 символов). Даже более длинные тексты иногда неправильно помечаются классификатором.
Иногда текст, написанный человеком, будет ошибочно, но уверенно помечен нашим классификатором как написанный ИИ.
Мы рекомендуем использовать классификатор только для английского текста. Он работает значительно хуже на других языках и ненадежен в коде.
Текст, который очень предсказуем, не может быть надежно идентифицирован. Например, невозможно предсказать, кем был составлен список первых 1,000 простых чисел: искусственным интеллектом или людьми, потому что правильный ответ всегда один и тот же.
Текст, написанный ИИ, можно редактировать, чтобы избежать классификатора. Такие классификаторы, как наш, можно обновлять и переобучать на основе успешных атак, но неясно, имеет ли обнаружение преимущество в долгосрочной перспективе.
Известно, что классификаторы на основе нейронных сетей плохо откалиброваны вне своих обучающих данных. Для входных данных, которые сильно отличаются от текста в нашем обучающем наборе, классификатор иногда очень уверен в неправильном прогнозе.

Обучение классификатора

Наш классификатор представляет собой языковую модель, точно настроенную на наборе данных, состоящем из пар текста, написанного человеком, и текста, написанного ИИ, по одной и той же теме. Мы собрали этот набор данных из различных источников, которые, как мы полагаем, написаны людьми, таких как данные предварительной подготовки и демонстрации людьми на подсказках, отправленных в ИнструктироватьGPT. Мы разделили каждый текст на подсказку и ответ. На эти запросы мы генерировали ответы из множества различных языковых моделей, обученных нами и другими организациями. Для нашего веб-приложения мы настраиваем порог достоверности, чтобы поддерживать низкий уровень ложных срабатываний; Другими словами, мы помечаем текст как вероятно написанный ИИ только в том случае, если классификатор очень уверен.

Воздействие на педагогов и призыв к участию

Мы признаем, что идентификация текста, написанного ИИ, была важным предметом обсуждения среди преподавателей, и не менее важно признать ограничения и влияние классификаторов текста, созданных ИИ, в классе. Мы разработали предварительный ресурс об использовании ChatGPT для преподавателей, в котором описаны некоторые варианты использования и связанные с ними ограничения и соображения. Хотя этот ресурс предназначен для преподавателей, мы ожидаем, что наш классификатор и связанные с ним инструменты классификатора окажут влияние на журналистов, исследователей недостоверной/дезинформации и другие группы.

Мы взаимодействуем с преподавателями в США, чтобы узнать, что они видят в своих классах, и обсудить возможности и ограничения ChatGPT, и мы будем продолжать расширять нашу работу по мере изучения. Это важные обсуждения, которые являются частью нашей миссии — безопасного развертывания больших языковых моделей в прямом контакте с пострадавшими сообществами.

Если эти проблемы непосредственно затрагивают вас (включая, помимо прочего, учителей, администраторов, родителей, учащихся и поставщиков образовательных услуг), сообщите нам об этом, используя эта форма. Прямая обратная связь по предварительный ресурс полезно, и мы также приветствуем любые ресурсы, которые педагоги разрабатывают или сочли полезными (например, руководства по курсу, обновления кодекса чести и политики, интерактивные инструменты, программы повышения грамотности в области ИИ).

SEO-контент и PR-распределение. Получите усиление сегодня.
Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. Доступ здесь.
Источник: https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/

Отметка времени: 31 января 2023

Отметка времени: 25 Марта, 2024

Переиздано Платоном

Представляем ChatGPT Enterprise

Демократический вклад в ИИ

Быстрые гранты на супервыравнивание

Снижение предвзятости и повышение безопасности в DALL·E 2

Эффективное обучение языковых моделей для заполнения середины

Плагины ChatGPT

Модели генерации видео как симуляторы мира

Демократический вклад в программу грантов на ИИ: извлеченные уроки и планы реализации

Представляем API ChatGPT и Whisper

Сора: Первые впечатления

О Нас

Вертикальный поиск и AI

Платформа

Оставайтесь на связи

Учетная запись