Firmy LLM, takie jak ChatGPT, stale wyciekają poufne dane

Opublikowane ponownie przez Plato

Obserwuje: 0

Firmy LLM, takie jak ChatGPT, stale wyciekają wrażliwe dane PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

W pionierskim badaniu zespół z Uniwersytetu Północnej Karoliny w Chapel Hill rzucił światło na palącą kwestię zatrzymywania danych w dużych modelach językowych (LLM), takich jak ChatGPT firmy OpenAI i Bard firmy Google.

Pomimo prób usunięcia zawiłości modeli sztucznej inteligencji w dalszym ciągu powracają na światło dzienne dane wrażliwe, wywołując poważną dyskusję na temat bezpieczeństwa informacji i etyki sztucznej inteligencji.

Zagadka danych „nieusuwalnych”.

Naukowcy rozpoczęli badania nad usuwaniem wrażliwych informacji z LLM. Jednak natknęli się na objawienie. Usunięcie takich danych jest trudne, ale weryfikacja usunięcia stanowi równie wyzwanie. Po przeszkoleniu na rozległych zbiorach danych te monstra AI przechowują dane w złożonym labiryncie parametrów i wag.

Ta sytuacja staje się złowieszcza, gdy Modele AI nieumyślnie ujawnić wrażliwe dane, takie jak identyfikatory osobiste lub dokumentację finansową, potencjalnie kładąc podwaliny pod niecne zastosowania.

Badacze odkryli, że LLM, takie jak ChatGPT, generują poufne dane nawet po ich „usunięciu” – https://t.co/P5QG8eGxwE

— ⚡️John Kolekcjoner⚡️ (@JohnTheCollectr) 2 października 2023 r.

Co więcej, sedno problemu leży w projekcie tych modeli. Faza wstępna obejmuje szkolenia w zakresie rozległych baz danych i dopracowanie w celu zapewnienia spójnych wyników. Terminologia „generatywny transformator wstępnie przeszkolony” zawarta w GPT umożliwia wgląd w ten mechanizm.

Naukowcy z UNC wyjaśnili hipotetyczny scenariusz, w którym LLM, nakarmiony skarbnicą wrażliwych danych bankowych, staje się potencjalnym zagrożeniem. Współczesne poręcze stosowane przez twórców sztucznej inteligencji nie łagodzą tych obaw.

Te środki ochronne, takie jak zakodowane na stałe podpowiedzi lub paradygmat znany jako uczenie się przez wzmacnianie na podstawie informacji zwrotnej od ludzi (RLHF), odgrywają kluczową rolę w ograniczaniu niepożądanych wyników. Jednak nadal pozostawiają dane czające się w otchłani modelu, gotowe do przywołania poprzez zwykłe przeformułowanie podpowiedzi.

Niwelowanie luki w bezpieczeństwie

Pomimo zastosowania najnowocześniejszych metod edycji modeli, takich jak edycja modelu rangi pierwszego, zespół UNC odkrył, że istotne informacje oparte na faktach pozostają dostępne. Ich ustalenia wykazały, że fakty można przywrócić w około 38% i 29% przypadków odpowiednio za pomocą ataków białej i czarnej skrzynki.

W swoich poszukiwaniach badacze wykorzystali model znany jako GPT-J. Ze swoimi 6 miliardami parametrów jest karłem w porównaniu z kolosalnym GPT-3.5, a model podstawowy dla ChatGPT ze 170 miliardami parametrów. Ten wyraźny kontrast wskazuje na monumentalne wyzwanie, jakim jest oczyszczenie większych modeli, takich jak GPT-3.5, z nieuzasadnionych danych.

Co więcej, uczeni z UNC opracowali nowe metody obrony, aby chronić LLM przed konkretnymi „atakami ekstrakcyjnymi”. Te nikczemne plany wykorzystują bariery ochronne modelu do wyładunku wrażliwych danych. Niemniej jednak gazeta złowieszczo wskazywała na ciągłą grę w kotka i myszkę, w której strategie defensywne zawsze będą gonić ewoluującą taktykę ofensywną.

Microsoft deleguje zespół nuklearny do wzmocnienia sztucznej inteligencji

Podobnie rozwijająca się dziedzina sztucznej inteligencji popchnęła gigantów technologicznych, takich jak Microsoft, do zapuszczania się na niezbadane terytoria. Niedawne utworzenie przez Microsoft zespołu ds. energetyki jądrowej w celu wspierania inicjatyw związanych ze sztuczną inteligencją podkreśla rosnące wymagania i powiązaną przyszłość sztucznej inteligencji i zasobów energetycznych. W miarę ewolucji modeli sztucznej inteligencji rośnie ich apetyt na energię, torując drogę innowacyjnym rozwiązaniom umożliwiającym zaspokojenie tego rosnącego zapotrzebowania.

Microsoft utworzy zespół ds. energetyki jądrowej, który będzie wspierał sztuczną inteligencję: raporthttps://t.co/OvAGclfMnt #news #crypto #Bitcoin #nauczanie maszynowe #microsoft #Aktualności #Technologia https://t.co/OvAGclfMnt

— Najświeższe informacje o kryptowalutach: najnowsze wiadomości o kryptowalutach i bitcoinach (@CryptoBreakNews) 1 października 2023 r.

Dyskurs na temat zatrzymywania i usuwania danych w LLM wykracza poza akademickie korytarze. Wymaga to dokładnej analizy i dialogu w całej branży, aby stworzyć solidne ramy zapewniające bezpieczeństwo danych, jednocześnie wspierając rozwój i potencjał sztucznej inteligencji.

To przedsięwzięcie badaczy z UNC stanowi znaczący krok w kierunku zrozumienia i ostatecznego rozwiązania problemu „nieusuwalnych” danych, a także krok bliżej do uczynienia sztucznej inteligencji bezpieczniejszym narzędziem w epoce cyfrowej.

Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
Źródło: https://metanews.com/llms-like-chatgpt-persistently-leak-sensitive-data-despite-deletion-efforts/

Znak czasu: 3 października 2023 r.

Znak czasu: Październik 7, 2023

Opublikowane ponownie przez Plato

Biały Dom podejmuje kroki w celu zbadania ryzyka AI

Centra danych podwajają się, ponieważ pożeracze wody chłodzą sztuczną inteligencję

Pod ostrzałem FBI zaleca instalowanie programów blokujących reklamy

Lookonchain ujawnia fałszywe transakcje WETH, których celem są znane portfele

Czaszka i kości są tutaj i są źródłem przygody na pełnym morzu

Gen-AI znajduje się na szczycie listy priorytetów inwestycyjnych dyrektora generalnego pomimo obaw

O nas

Wyszukiwanie pionowe i AI

Platforma

Pozostań w kontakcie

Konto