W pionierskim badaniu zespół z Uniwersytetu Północnej Karoliny w Chapel Hill rzucił światło na palącą kwestię zatrzymywania danych w dużych modelach językowych (LLM), takich jak ChatGPT firmy OpenAI i Bard firmy Google.
Pomimo prób usunięcia zawiłości modeli sztucznej inteligencji w dalszym ciągu powracają na światło dzienne dane wrażliwe, wywołując poważną dyskusję na temat bezpieczeństwa informacji i etyki sztucznej inteligencji.
Zagadka danych „nieusuwalnych”.
Naukowcy rozpoczęli badania nad usuwaniem wrażliwych informacji z LLM. Jednak natknęli się na objawienie. Usunięcie takich danych jest trudne, ale weryfikacja usunięcia stanowi równie wyzwanie. Po przeszkoleniu na rozległych zbiorach danych te monstra AI przechowują dane w złożonym labiryncie parametrów i wag.
Ta sytuacja staje się złowieszcza, gdy Modele AI nieumyślnie ujawnić wrażliwe dane, takie jak identyfikatory osobiste lub dokumentację finansową, potencjalnie kładąc podwaliny pod niecne zastosowania.
Badacze odkryli, że LLM, takie jak ChatGPT, generują poufne dane nawet po ich „usunięciu” – https://t.co/P5QG8eGxwE
— ⚡️John Kolekcjoner⚡️ (@JohnTheCollectr) 2 października 2023 r.
Co więcej, sedno problemu leży w projekcie tych modeli. Faza wstępna obejmuje szkolenia w zakresie rozległych baz danych i dopracowanie w celu zapewnienia spójnych wyników. Terminologia „generatywny transformator wstępnie przeszkolony” zawarta w GPT umożliwia wgląd w ten mechanizm.
Naukowcy z UNC wyjaśnili hipotetyczny scenariusz, w którym LLM, nakarmiony skarbnicą wrażliwych danych bankowych, staje się potencjalnym zagrożeniem. Współczesne poręcze stosowane przez twórców sztucznej inteligencji nie łagodzą tych obaw.
Te środki ochronne, takie jak zakodowane na stałe podpowiedzi lub paradygmat znany jako uczenie się przez wzmacnianie na podstawie informacji zwrotnej od ludzi (RLHF), odgrywają kluczową rolę w ograniczaniu niepożądanych wyników. Jednak nadal pozostawiają dane czające się w otchłani modelu, gotowe do przywołania poprzez zwykłe przeformułowanie podpowiedzi.
Niwelowanie luki w bezpieczeństwie
Pomimo zastosowania najnowocześniejszych metod edycji modeli, takich jak edycja modelu rangi pierwszego, zespół UNC odkrył, że istotne informacje oparte na faktach pozostają dostępne. Ich ustalenia wykazały, że fakty można przywrócić w około 38% i 29% przypadków odpowiednio za pomocą ataków białej i czarnej skrzynki.
W swoich poszukiwaniach badacze wykorzystali model znany jako GPT-J. Ze swoimi 6 miliardami parametrów jest karłem w porównaniu z kolosalnym GPT-3.5, a model podstawowy dla ChatGPT ze 170 miliardami parametrów. Ten wyraźny kontrast wskazuje na monumentalne wyzwanie, jakim jest oczyszczenie większych modeli, takich jak GPT-3.5, z nieuzasadnionych danych.
Co więcej, uczeni z UNC opracowali nowe metody obrony, aby chronić LLM przed konkretnymi „atakami ekstrakcyjnymi”. Te nikczemne plany wykorzystują bariery ochronne modelu do wyładunku wrażliwych danych. Niemniej jednak gazeta złowieszczo wskazywała na ciągłą grę w kotka i myszkę, w której strategie defensywne zawsze będą gonić ewoluującą taktykę ofensywną.
Microsoft deleguje zespół nuklearny do wzmocnienia sztucznej inteligencji
Podobnie rozwijająca się dziedzina sztucznej inteligencji popchnęła gigantów technologicznych, takich jak Microsoft, do zapuszczania się na niezbadane terytoria. Niedawne utworzenie przez Microsoft zespołu ds. energetyki jądrowej w celu wspierania inicjatyw związanych ze sztuczną inteligencją podkreśla rosnące wymagania i powiązaną przyszłość sztucznej inteligencji i zasobów energetycznych. W miarę ewolucji modeli sztucznej inteligencji rośnie ich apetyt na energię, torując drogę innowacyjnym rozwiązaniom umożliwiającym zaspokojenie tego rosnącego zapotrzebowania.
Microsoft utworzy zespół ds. energetyki jądrowej, który będzie wspierał sztuczną inteligencję: raporthttps://t.co/OvAGclfMnt#news #crypto #Bitcoin #nauczanie maszynowe #microsoft #Aktualności #Technologia https://t.co/OvAGclfMnt
— Najświeższe informacje o kryptowalutach: najnowsze wiadomości o kryptowalutach i bitcoinach (@CryptoBreakNews) 1 października 2023 r.
Dyskurs na temat zatrzymywania i usuwania danych w LLM wykracza poza akademickie korytarze. Wymaga to dokładnej analizy i dialogu w całej branży, aby stworzyć solidne ramy zapewniające bezpieczeństwo danych, jednocześnie wspierając rozwój i potencjał sztucznej inteligencji.
To przedsięwzięcie badaczy z UNC stanowi znaczący krok w kierunku zrozumienia i ostatecznego rozwiązania problemu „nieusuwalnych” danych, a także krok bliżej do uczynienia sztucznej inteligencji bezpieczniejszym narzędziem w epoce cyfrowej.
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
- PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
- PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
- Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
- Źródło: https://metanews.com/llms-like-chatgpt-persistently-leak-sensitive-data-despite-deletion-efforts/
- :ma
- :Jest
- :Gdzie
- 1
- 7
- a
- akademicki
- dostępny
- Po
- wiek
- AI
- Modele AI
- an
- i
- apetyt
- na około
- AS
- At
- Ataki
- Próby
- Bankowość
- BE
- staje się
- być
- Behemoty
- Miliard
- Bitcoin
- Bitcoin Aktualności
- plan
- grzbiet
- Przełamując
- Najnowsze wiadomości
- pączkujący
- ale
- by
- CAT
- wyzwanie
- pościg
- ChatGPT
- bliższy
- ZGODNY
- w porównaniu
- kompleks
- Troska
- współczesny
- kontynuować
- kontrast
- Rozmowa
- rdzeń
- mógłby
- wykonane
- Crypto
- ograniczenie
- dane
- bezpieczeństwo danych
- Bazy danych
- zbiory danych
- Obrona
- obronny
- Dostęp delegat
- Kreowanie
- wymagania
- wdrażanie
- Wnętrze
- deweloperzy
- Dialog
- cyfrowy
- Era cyfrowa
- rozprawiać
- odkryty
- zaokrętowany
- zatrudniony
- obudowane
- energia
- zapewnić
- zapewnia
- równy
- etyka
- Parzyste
- ostatecznie
- ewoluuje
- ewoluuje
- ekspansywny
- Wykorzystać
- fakty
- Spadać
- informacja zwrotna
- budżetowy
- Znajdź
- Ustalenia
- Ryba
- W razie zamówieenia projektu
- na zawsze
- Nasz formularz
- formacja
- Sprzyjać
- Framework
- od
- przyszłość
- gra
- Dojrzeć
- Google'a
- podkład
- Rozwój
- Wzrost
- port
- mający
- wskazówki
- Jednak
- HTTPS
- człowiek
- identyfikatory
- in
- przypadkowo
- Informacja
- bezpieczeństwo informacji
- inicjatywy
- Innowacyjny
- splecione
- najnowszych
- zawiłości
- badać
- problem
- IT
- JEGO
- znany
- język
- duży
- większe
- firmy
- przeciec
- nauka
- Pozostawiać
- lekki
- lubić
- LLM
- Dokonywanie
- środków
- mechanizm
- sam
- metody
- Microsoft
- model
- modele
- monumentalny
- Nowości
- aktualności
- Północ
- Karolina Północna
- jądrowy
- Energia atomowa
- wychowanie
- of
- obraźliwy
- Oferty
- on
- pewnego razu
- or
- na zewnątrz
- wydajność
- Papier
- paradygmat
- parametry
- Chodnik
- Wieczny
- uporczywie
- osobisty
- faza
- Pionierskość
- plato
- Analiza danych Platona
- PlatoDane
- Grać
- stwarza
- potencjał
- potencjalnie
- power
- pilny
- Problem
- napędzany
- Ochronny
- poszukiwanie
- gotowy
- królestwo
- niedawny
- dokumentacja
- związane z
- pozostał
- Badacze
- Zasoby
- odpowiednio
- retencja
- Ujawnił
- objawienie
- krzepki
- Rola
- bezpieczniej
- scenariusz
- systemy
- Uczeni
- bezpieczeństwo
- wrażliwy
- ciężki
- budka
- Tarcza
- Short
- znaczący
- Rozwiązania
- Rozwiązywanie
- specyficzny
- sztywny
- state-of-the-art
- Ewolucja krok po kroku
- Nadal
- strategie
- kroczyć
- Badanie
- znaczny
- taki
- wsparcie
- taktyka
- zespół
- tech
- terminologia
- terytoria
- że
- Połączenia
- ich
- Te
- one
- to
- groźba
- Przez
- czas
- do
- narzędzie
- w kierunku
- przeszkolony
- Trening
- wykracza poza
- transformator
- prawdziwy
- włącza
- niezbadany
- podkreślenia
- zrozumienie
- uniwersytet
- na
- zastosowania
- wykorzystany
- Naprawiono
- przedsięwzięcie
- weryfikacja
- istotny
- Droga..
- jeśli chodzi o komunikację i motywację
- Podczas
- w
- w ciągu
- by
- zefirnet