Підведення підсумків книг із людським відгуком

Перевидано Платоном

читають: 0

Резюме книг із людським відгуком

To безпечно Щоб розгорнути в майбутньому потужний штучний інтелект загального призначення, нам потрібно переконатися, що моделі машинного навчання діють відповідно до намірів людини. Цей виклик став відомий як проблема вирівнювання.

Масштабоване рішення проблеми вирівнювання має працювати над завданнями, оцінка яких результатів моделі складна або потребує багато часу. Щоб перевірити методи масштабованого вирівнювання, ми навчили модель підсумовувати цілі книги, як показано в наступних зразках.^[1] Наша модель працює так, що спочатку підсумовуються невеликі розділи книги, потім узагальнюються ці резюме в резюме вищого рівня тощо.

Дослідіть більше зразків

Наша найкраща модель налаштована на основі GPT-3 і генерує розумні резюме цілих книг, іноді навіть відповідаючи середній якості резюме, написаних людиною: вона отримує оцінку 6/7 (подібно до середнього резюме, написаного людиною) від людей які прочитали книгу 5% часу та оцінку 5/7 15% часу. Наша модель також досягає найсучасніших результатів на Набір даних BookSum для конспектування книги. Модель нульових запитань і відповідей може використовувати підсумки нашої моделі для отримання конкурентних результатів на Набір даних NarrativeQA для відповіді на питання довжини книги.^[2]

Наш підхід: поєднання навчання за допомогою зворотного зв’язку людини та рекурсивної декомпозиції завдань

Розглянемо завдання на конспектування фрагмента тексту. Великий попередньо підготовлені моделі не дуже добре підводять підсумки. У минулому ми виявили, що навчання моделі з навчання з підкріпленням на основі зворотного зв’язку людини допоміг узгодити модель резюме з уподобаннями людини щодо коротких дописів і статей. Але оцінка коротких викладів цілих книг потребує багато зусиль, оскільки людині потрібно буде прочитати всю книгу, що займає багато годин.

Для вирішення цієї проблеми ми додатково використовуємо рекурсивна декомпозиція задачі: ми процедурно розбиваємо складне завдання на легше. У цьому випадку ми розбиваємо резюме довгого фрагмента тексту на кілька коротших фрагментів. Порівняно з наскрізною процедурою навчання, рекурсивна декомпозиція завдання має такі переваги:

Декомпозиція дозволяє людям швидше оцінювати резюме моделі, використовуючи резюме менших частин книги, а не читаючи вихідний текст.
Легше простежити процес написання конспекту. Наприклад, ви можете простежити, щоб знайти, де в оригінальному тексті відбуваються певні події зі зведення. Дивіться самі на наш провідник підсумків!
Наш метод можна використовувати для підсумовування книг необмеженої довжини, необмеженої довжиною контексту моделей трансформаторів, які ми використовуємо.

Чому ми працюємо над цим

Tйого робота є частиною нашої постійний дослідження у вирівнювання передових систем ШІ, що є ключовим для Наша місія. Оскільки ми навчаємо наші моделі виконувати дедалі складніші завдання, робити обґрунтовані оцінки результатів моделей ставатиме все важче для людей. Це ускладнює виявлення тонких проблем у вихідних даних моделі, які можуть призвести до негативних наслідків під час розгортання цих моделей. Тому ми хочемо, щоб наша здатність оцінювати наші моделі зростала разом із зростанням їхніх можливостей.

Наш поточний підхід до цієї проблеми полягає в тому надати людям можливість оцінювати результати моделі машинного навчання за допомогою інших моделей. У цьому випадку для оцінки резюме книг ми надаємо людям можливість отримувати окремі підсумки розділів, написані нашою моделлю, що економить їхній час під час оцінки цих резюме порівняно з читанням вихідного тексту. Наш прогрес у підсумковуванні книги є першою широкомасштабною емпіричною роботою з методів вирівнювання масштабу.

У майбутньому ми досліджуємо кращі способи допомогти людям оцінювати поведінку моделі з метою пошуку методів, які масштабуються для вирівнювання загального штучного інтелекту.

Ми завжди шукаємо більше талановитих людей, щоб приєднатися до нас; тому, якщо ця робота вас зацікавила, будь ласка подати заявку на приєднання до нашої команди!

Часова мітка: Вересень 23, 2021

Часова мітка: Січень 31, 2023

Резюме книг із людським відгуком

Перевидано Платоном

Наш підхід: поєднання навчання за допомогою зворотного зв’язку людини та рекурсивної декомпозиції завдань

Чому ми працюємо над цим

Більше від OpenAI

Вирівнювання мовних моделей відповідно до інструкцій

Нові моделі та продукти для розробників, анонсовані на DevDay

Демократичний внесок у грантову програму ШІ: отримані уроки та плани впровадження

Прогнозування потенційних зловживань мовними моделями для кампаній з дезінформації та як зменшити ризик

DALL E: Представляємо Outpainting

Вчимося грати в Майнкрафт за допомогою відеопопереднього навчання

Сора: Перші враження

Демократичний внесок у ШІ

Про нас

Вертикальний пошук & Ai

платформа

Залишайтеся на зв'язку

рахунки