У піонерському дослідженні команда з Університету Північної Кароліни, Чапел-Хілл, пролила світло на нагальну проблему збереження даних у великих мовних моделях (LLM), таких як ChatGPT від OpenAI і Bard від Google.
Незважаючи на спроби видалення, тонкощі цих моделей ШІ продовжують виривати конфіденційні дані, викликавши серйозну дискусію про інформаційну безпеку та етику ШІ.
Головоломка з даними, які не можна видалити
Дослідники розпочали пошуки, щоб дослідити видалення конфіденційної інформації з LLM. Однак вони натрапили на одкровення. Видалення таких даних складне, але перевірка видалення є не меншою проблемою. Після навчання на великих наборах даних ці гіганти ШІ зберігають дані у складному лабіринті параметрів і ваг.
Це скрутне становище стає зловісним, коли Моделі AI ненавмисно розповсюджувати конфіденційні дані, такі як особисті ідентифікатори або фінансові записи, потенційно закладаючи основу для нечесного використання.
Дослідники виявили, що такі LLM, як ChatGPT, видають конфіденційні дані навіть після того, як їх було «видалено» – https://t.co/P5QG8eGxwE
— ⚡️Джон Колекціонер⚡️ (@JohnTheCollectr) Жовтень 2, 2023
Крім того, суть проблеми полягає в дизайні цих моделей. Попередній етап передбачає навчання на величезних базах даних і тонке налаштування для забезпечення узгоджених результатів. Термінологія «генеративний попередньо навчений трансформатор», інкапсульована в GPT, пропонує короткий погляд на цей механізм.
Вчені UNC розкрили гіпотетичний сценарій, за яким магістр права, поласувавши великою кількістю конфіденційних банківських даних, стає потенційною загрозою. Сучасні огорожі, які використовують розробники штучного інтелекту, не можуть заспокоїти цю проблему.
Ці захисні заходи, такі як жорстко закодовані підказки або парадигма, відома як підкріплююче навчання на основі зворотного зв’язку людини (RLHF), відіграють важливу роль у стримуванні небажаних результатів. Однак вони все ще залишають дані, що ховаються в безодні моделі, готові бути викликані простим перефразуванням підказки.
Подолання прогалини в безпеці
Незважаючи на застосування найсучасніших методів редагування моделей, таких як Rank-One Model Editing, команда UNC виявила, що значна фактична інформація залишається доступною. Їхні висновки показали, що факти можуть бути відроджені приблизно в 38% і 29% випадків за допомогою атак whitebox і blackbox відповідно.
У своїх пошуках дослідники використовували модель, відому як GPT-J. З його 6 мільярдами параметрів, це карлик порівняно з колосальним GPT-3.5, a базова модель для ChatGPT зі 170 мільярдами параметрів. Цей яскравий контраст натякає на монументальне завдання очищення більших моделей, таких як GPT-3.5, від необґрунтованих даних.
Крім того, вчені UNC розробили нові методи захисту, щоб захистити LLM від конкретних «атак вилучення». Ці підлі схеми використовують огорожі моделі, щоб виловити конфіденційні дані. Тим не менш, газета зловісно натякала на вічну гру в кішки-мишки, де захисні стратегії вічно переслідуватимуть наступальну тактику, що розвивається.
Microsoft делегує ядерну команду для підтримки штучного інтелекту
У зв’язку з цим зростаюча сфера штучного інтелекту спонукала таких технічних гігантів, як Microsoft, вирушити на незвідані території. Нещодавнє створення Microsoft команди ядерної енергетики для підтримки ініціатив штучного інтелекту підкреслює ескалацію потреб і взаємопов’язане майбутнє ШІ та енергетичних ресурсів. З розвитком моделей штучного інтелекту зростає їхній апетит до енергії, прокладаючи шлях для інноваційних рішень, які задовольнять зростаючий попит.
Microsoft створить команду ядерної енергетики для підтримки ШІ: звітhttps://t.co/OvAGclfMnt#News #crypto # Бітін #машинненавчання #Microsoft #news # Технологія https://t.co/OvAGclfMnt
— Останні новини про криптовалюти та біткойни (@CryptoBreakNews) Жовтень 1, 2023
Дискурс навколо збереження та видалення даних у LLM виходить за межі академічних коридорів. Це спонукає до ретельного вивчення та загальногалузевого діалогу для сприяння надійній структурі, яка забезпечує безпеку даних, одночасно сприяючи зростанню та потенціалу ШІ.
Ця ініціатива дослідників UNC є значним кроком до розуміння та остаточного вирішення проблеми «невидалюваних» даних, кроком ближче до того, щоб зробити штучний інтелект безпечнішим інструментом у цифрову епоху.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://metanews.com/llms-like-chatgpt-persistently-leak-sensitive-data-despite-deletion-efforts/
- : має
- :є
- :де
- 1
- 7
- a
- академічний
- доступною
- після
- вік
- AI
- Моделі AI
- an
- та
- апетит
- навколо
- AS
- At
- нападки
- Спроби
- Banking
- BE
- стає
- було
- Бегемоти
- Мільярд
- Біткойн
- Новини Bitcoin
- план
- підсилювач
- Розрив
- останні новини
- бурхливий
- але
- by
- КПП
- виклик
- погоня
- ChatGPT
- ближче
- КОГЕРЕНТНИЙ
- порівняний
- комплекс
- Занепокоєння
- сучасний
- продовжувати
- контрастність
- Розмова
- Core
- може
- створений
- крипто
- стримування
- дані
- безпеку даних
- базами даних
- набори даних
- оборони
- оборонний
- доступ делегат
- Попит
- запити
- розгортання
- дизайн
- розробників
- Діалог
- цифровий
- цифровому столітті
- мова
- відкритий
- приступив
- працевлаштований
- інкапсульований
- енергія
- забезпечувати
- гарантує
- рівним
- етика
- Навіть
- врешті-решт
- еволюціонувати
- еволюціонує
- експансивний
- Експлуатувати
- Факти
- Падати
- зворотний зв'язок
- фінансовий
- знайти
- результати
- риба
- для
- назавжди
- форма
- освіта
- Сприяти
- Рамки
- від
- майбутнє
- гра
- Проблиск
- Google,
- основи
- Зростання
- Зростання
- гавань
- має
- підказки
- Однак
- HTTPS
- людина
- ідентифікатори
- in
- ненавмисно
- інформація
- інформаційна безпека
- ініціативи
- інноваційний
- переплетені
- в
- тонкощі
- дослідити
- питання
- IT
- ЙОГО
- відомий
- мова
- великий
- більше
- останній
- витік
- вивчення
- Залишати
- світло
- як
- LLM
- Робить
- заходи
- механізм
- меров
- методика
- Microsoft
- модель
- Моделі
- монументальний
- Нові
- новини
- На північ
- Північна Кароліна
- ядерний
- Атомна енергетика
- виховання
- of
- наступ
- Пропозиції
- on
- один раз
- or
- з
- вихід
- Папір
- парадигма
- параметри
- Мощення
- Вічний
- наполегливо
- персонал
- фаза
- Піонерський
- plato
- Інформація про дані Платона
- PlatoData
- Play
- позах
- потенціал
- потенційно
- влада
- пресування
- Проблема
- рухомий
- Захисні
- пошук
- готовий
- царство
- останній
- облік
- пов'язаний
- залишився
- Дослідники
- ресурси
- відповідно
- утримання
- Показали
- одкровення
- міцний
- Роль
- безпечніше
- сценарій
- схеми
- Вчені
- безпеку
- чутливий
- важкий
- пролити
- Щит
- Короткий
- значний
- Рішення
- Розв’язування
- конкретний
- різко
- впроваджений
- Крок
- Як і раніше
- стратегії
- крок
- Вивчення
- істотний
- такі
- підтримка
- тактика
- команда
- технології
- термінологія
- території
- Що
- Команда
- їх
- Ці
- вони
- це
- загроза
- через
- час
- до
- інструмент
- до
- навчений
- Навчання
- переступає
- трансформатор
- правда
- повороти
- незвіданий
- нижнє підкреслення
- розуміння
- університет
- на
- використовує
- використовувати
- величезний
- підприємство
- перевірка
- життєво важливий
- шлях..
- коли
- в той час як
- з
- в
- б
- зефірнет