Meta створює штучний інтелект для перевірки фактів Вікіпедія — усі 6.5 мільйонів статей PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Meta створює штучний інтелект для перевірки фактів у Вікіпедії — усі 6.5 мільйона статей

зображення

Більшість людей старше 30, мабуть, пам’ятають, як досліджували старі добрі енциклопедії. Ви дістаєте з полиці важкий том, перевіряєте покажчик теми, яка вас цікавить, потім перегортаєте потрібну сторінку й починаєте читати. Це було не так просто, як ввести кілька слів у пошуковий рядок Google, але, з іншого боку, ви знали, що інформація, яку ви знаходите на сторінках Британіка або Світова книга було точним і правдивим.

З Інтернет-дослідженнями сьогодні це не так. Переважна кількість джерел досить заплутала, але додайте поширення дезінформації, і дивно, що хтось із нас повірить слову, яке прочитає в Інтернеті.

Показовим прикладом є Вікіпедія. Станом на початок 2020 року англійська версія сайту становила в середньому близько 255 млн переглядів сторінок на день, що робить його восьмим за відвідуваністю веб-сайтом в Інтернеті. Станом на минулий місяць він піднявся на перше місце номер сім, а англійська версія наразі закінчилася 6.5 млн статті

Але яким би високим трафіком не було це джерело інформації, його точність залишає бажати кращого; в сторінка про власну надійність сайту зазначено: «Онлайн-енциклопедія не вважає себе надійним джерелом і не заохочує читачів використовувати її в академічних чи дослідницьких умовах».

Meta — колишній Facebook — хоче це змінити. В блог опублікованому минулого місяця, співробітники компанії описують, як ШІ може допомогти зробити Вікіпедію точнішою.

Хоча десятки тисяч людей беруть участь у редагуванні сайту, факти, які вони додають, не обов’язково є правильними; навіть якщо цитати є, вони не завжди точні чи навіть доречні.

Meta розробляє модель машинного навчання, яка сканує ці цитати та перехресно посилається на їхній вміст на статті Вікіпедії, щоб переконатися, що не лише теми збігаються, але й конкретні цитовані цифри точні.

Це не просто питання вибору чисел і переконання, що вони збігаються; ШІ Meta повинен буде «розуміти» зміст цитованих джерел (хоча «розуміти» є неправильним словом, як вважає дослідник теорії складності Мелані Мітчелл сказав би вам, тому що штучний інтелект все ще перебуває у «вузькій» фазі, тобто це інструмент для високоскладного розпізнавання образів, тоді як «розуміння» — це слово, яке використовується для людського пізнання, яке все ще зовсім інше).

Модель Meta «розуміє» вміст не шляхом порівняння текстових рядків і переконання, що вони містять однакові слова, а шляхом порівняння математичних представлень блоків тексту, до яких вона приходить за допомогою методів розуміння природної мови (NLU).

«Ми створили індекс усіх цих веб-сторінок, розділивши їх на уривки та забезпечивши точне представлення кожного уривка», – Фабіо Петроні, провідний технічний менеджер Meta Fundamental AI Research, сказав цифрові Тенденції. «Це не слово за словом представляє уривок, а значення уривка. Це означає, що два фрагменти тексту зі схожими значеннями будуть представлені в дуже близькому місці в отриманому n-вимірному просторі, де зберігаються всі ці уривки».

Штучний інтелект навчається на наборі з чотирьох мільйонів цитат у Вікіпедії, і окрім вибору помилкових цитат на сайті, його творці хотіли б, щоб він зрештою міг пропонувати точні джерела на їхнє місце, витягуючи з величезного індексу даних, які постійно оновлюється.

Залишилося вирішити одне велике питання – це робота в системі оцінювання надійності джерел. Стаття з наукового журналу, наприклад, отримає вищу оцінку, ніж публікація в блозі. Обсяг контенту в Інтернеті настільки великий і різноманітний, що ви можете знайти «джерела» на підтримку практично будь-яких тверджень, але аналізуючи дезінформацію з дезінформації (перша означає неправильну, а друга означає навмисне оманливе), і рецензовані від неперевіреного, перевіреного фактами від нашвидкуруч зібраного — це непросте завдання, але дуже важливе, коли справа доходить до довіри.

Meta має відкритий код своєї моделі, і ті, кому цікаво, можуть переглянути a демонстрація інструменту перевірки. У дописі в блозі Meta зазначено, що компанія не співпрацює з Wikimedia у цьому проекті, і що він все ще перебуває на стадії дослідження і наразі не використовується для оновлення вмісту у Wikipedia.

Якщо ви уявите собі не надто віддалене майбутнє, де все, що ви читаєте у Вікіпедії, буде точним і надійним, чи не стане це надто легким проведення будь-яких досліджень? Є щось цінне в тому, щоб самі перевіряти та порівнювати різні джерела, чи не так? Перейти від гортання важких книжок до введення кількох слів у пошуковій системі та натискання «Enter» був великим кроком; чи справді ми хочемо, щоб Вікіпедія перейшла від дослідницької відправної точки до джерела, де читають останнє слово?

У будь-якому випадку дослідницька команда Meta AI продовжить роботу над інструментом для покращення онлайн-енциклопедії. «Зрештою, я думаю, що нами керувала цікавість», — Петроні сказав. «Ми хотіли побачити, чим обмежена ця технологія. Ми були абсолютно не впевнені, чи зможе [цей ШІ] зробити щось значуще в цьому контексті. Ніхто ніколи не намагався зробити щось подібне».

Зображення Фото: Герд Альтман від Pixabay

Часова мітка:

Більше від Хаб сингулярності