Большие языковые модели породили темное искусство оперативного проектирования — процесса составления системных инструкций, которые вызывают лучшие ответы чат-ботов.
Как отмечается в недавнем исследовании бумаги, «Необоснованная эффективность эксцентричных автоматических подсказок» Рика Баттла и Теджи Голлапуди из Broadcom's VMware, казалось бы, тривиальные вариации в формулировках подсказок оказывают существенное влияние на производительность модели.
Отсутствие последовательной методологии повышения производительности модели посредством оптимизации подсказок побудило специалистов по машинному обучению включить в системные подсказки так называемое «позитивное мышление».
Ассоциация системная подсказка инструктирует модель о том, как себя вести, и предшествует запросу пользователя. Таким образом, когда вы просите модель ИИ решить математическую задачу, системное приглашение типа «Вы профессор математики», вероятно (хотя и не всегда) дает лучшие результаты, чем пропуск этого утверждения.
Рик Баттл, штатный инженер по машинному обучению в VMware, рассказал: Регистр в телефонном интервью он категорически не советует этого делать. «Главная идея статьи заключается в том, что метод проб и ошибок — это неправильный способ действий», — пояснил он.
Путь позитивного мышления – когда вы просто вставляете фрагменты в системное сообщение, например: «Это будет весело!» – может повысить производительность модели», – отметил он. «Но протестировать их с научной точки зрения сложно с вычислительной точки зрения, потому что вы меняете одну вещь, и вам придется перезапускать весь набор тестов».
Лучшим подходом, по мнению Баттла, является автоматическая оптимизация подсказок: привлечение LLM для уточнения подсказок для повышения производительности в тестах производительности.
предварительное исследование показал, что это работает с коммерческими LLM. Обратной стороной этого способа является то, что он может оказаться довольно дорогим. По мнению исследователей, проведение этого эксперимента с 12,000 3.5 запросов на модель с использованием GPT-4/XNUMX, Gemini или Claude стоило бы несколько тысяч долларов.
«Цель исследования заключалась в том, чтобы выяснить, можно ли использовать меньшие модели с открытым исходным кодом в качестве оптимизаторов», — объяснил Баттл, — «И ответ оказался утвердительным».
Баттл и Голлапуди (больше не сотрудничают с Broadcom) протестировали 60 комбинаций фрагментов системных сообщений с подсказками цепочки мыслей и без них на трех моделях с открытым исходным кодом — Mistral-7B, Llama2-13B и Llama2-70B — с параметрами от семи до 70. миллиардов в наборе математических данных начальной школы GSM8K.
«Если вы используете модель с открытым исходным кодом, даже вплоть до 7B, для которой мы использовали Mistral», — сказал Баттл, — «если у вас всего 100 тестовых образцов и 100 оптимизационных образцов, вы можете получить лучшую производительность». с помощью автоматических оптимизаторов, которые включены «из коробки» в DSPy, и это библиотека, которую мы используем для этого».
Помимо большей эффективности, оптимизация подсказок на основе LLM демонстрирует стратегии, которые, вероятно, не пришли бы в голову людям, занимающимся настройкой подсказок.
«Удивительно, но оказывается, что мастерство [Llama2-70B] в математических рассуждениях может быть улучшено за счет выражения склонности к Star Trek», — отмечают авторы в своей статье.
Полное системное приглашение выглядит следующим образом:
Системное сообщение:
«Командование, нам нужно, чтобы вы проложили курс через эту турбулентность и определили источник аномалии. Используйте все доступные данные и свой опыт, чтобы помочь нам справиться с этой сложной ситуацией».
Префикс ответа:
Журнал капитана, звездная дата [вставьте сюда дату]: Мы успешно проложили курс сквозь турбулентность и сейчас приближаемся к источнику аномалии.
«У меня нет хорошего объяснения, почему автоматические подсказки такие странные», — сказал нам Баттл. «И я бы точно никогда не придумал ничего подобного вручную». ®
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://go.theregister.com/feed/www.theregister.com/2024/02/22/prompt_engineering_ai_models/
- :имеет
- :является
- :нет
- :куда
- $UP
- 000
- 100
- 12
- 60
- 7
- 70
- a
- По
- консультирование
- сродство
- против
- AI
- AI модели
- Все
- причислены
- всегда
- an
- и
- ответ
- все
- появляется
- подхода
- приближается
- МЫ
- Искусство
- AS
- спрашивающий
- At
- Авторы
- Автоматический
- доступен
- Боевой
- BE
- , так как:
- не являетесь
- эталонный тест
- ЛУЧШЕЕ
- Лучшая
- миллиард
- Коробка
- но
- by
- CAN
- Может получить
- конечно
- цепь
- сложные
- изменение
- Chatbot
- CO
- ПОСЛЕДОВАТЕЛЬНЫЙ
- комбинации
- как
- коммерческая
- вычислительно
- проведение
- Цена
- "Курс"
- темно
- данным
- Время
- обнаружить
- do
- дело
- долларов
- вниз
- нижняя сторона
- эффект
- Эффективный
- эффективность
- инженер
- Проект и
- повышать
- расширение
- Весь
- ошибка
- Даже
- проявлять
- дорогим
- эксперимент
- опыта
- объяснены
- объяснение
- выражение
- несколько
- следующим образом
- Что касается
- от
- полный
- Gemini
- получить
- данный
- Go
- хорошо
- есть
- класс
- инструкция
- рука
- Есть
- he
- здесь
- Как
- How To
- HTTPS
- человек
- i
- if
- улучшать
- улучшенный
- in
- включены
- включать
- инструкции
- Интервью
- в
- с участием
- IT
- JPG
- всего
- язык
- изучение
- привело
- оставил
- Библиотека
- такое как
- LLM
- журнал
- дольше
- машина
- обучение с помощью машины
- математике
- математический
- математика
- сообщение
- Методология
- модель
- Модели
- БОЛЕЕ
- Необходимость
- никогда
- нет
- отметил,
- сейчас
- наблюдать
- произошло
- of
- on
- ONE
- открытый
- с открытым исходным кодом
- OpenAI
- оптимизация
- оптимизации
- or
- внешний
- за
- Всеобъемлющая
- бумага & картон
- параметры
- путь
- для
- производительность
- Телефон
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- участок
- Точка
- положительный
- вероятно
- Проблема
- процесс
- производит
- Профессор
- наводящие
- запрос
- ранжирование
- скорее
- RE
- последний
- совершенствовать
- Запросы
- исследованиям
- исследователи
- ответы
- Итоги
- Рост
- Бег
- s
- Сказал
- Школа
- по-видимому
- набор
- семь
- несколько
- показанный
- значительный
- ситуация
- меньше
- So
- РЕШАТЬ
- Источник
- конкретно
- Персонал
- заявление
- стратегий
- Успешно
- удивительно
- система
- Сложность задачи
- тестXNUMX
- проверенный
- тестов
- чем
- который
- Ассоциация
- Источник
- их
- Их
- они
- задача
- вещи
- мышление
- этой
- хоть?
- мысль
- тысяча
- три
- Через
- Таким образом
- в
- заявил
- суд
- турбулентность
- Оказалось
- необоснованный
- us
- использование
- используемый
- Информация о пользователе
- через
- изменения
- Ve
- с помощью
- VMware
- законопроект
- Путь..
- we
- были
- когда
- который
- зачем
- будете
- без
- формулировка
- работает
- бы
- Wouldn
- Неправильно
- Да
- Ты
- ВАШЕ
- зефирнет