ChatGPT:n kaltaiset LLM:t vuotavat jatkuvasti arkaluonteisia tietoja

Julkaissut Platon

seuraajia: 0

ChatGPT:n kaltaiset LLM:t vuotavat jatkuvasti arkaluontoista tietoa PlatoBlockchain Data Intelligencesta. Pystysuuntainen haku. Ai.

Pohjois-Carolinan yliopiston Chapel Hillin tiimi on uraauurtavassa tutkimuksessa valaisenut kiireellistä tiedon säilyttämistä suurissa kielimalleissa (LLM), kuten OpenAI:n ChatGPT:ssä ja Googlen Bardissa.

Poistamisyrityksistä huolimatta näiden tekoälymallien monimutkaisuus lisääntyy edelleen arkaluonteisia tietoja, herättää ankaran keskustelun tietoturvasta ja tekoälyn etiikasta.

"Ei poistettava" dataongelma

Tutkijat ryhtyivät tutkimaan arkaluonteisten tietojen hävittämistä LLM:iltä. He törmäsivät kuitenkin paljastukseen. Tällaisten tietojen poistaminen on työlästä, mutta poistamisen varmistaminen on yhtä suuri haaste. Kun nämä AI-behemotit on koulutettu laajoihin tietokokonaisuuksiin, ne säilyttävät tiedot monimutkaisessa parametrien ja painojen sokkelossa.

Tämä ahdinko muuttuu pahaenteiseksi, kun AI-mallit levittää vahingossa arkaluonteisia tietoja, kuten henkilökohtaisia tunnisteita tai taloudellisia tietoja, mikä saattaa luoda pohjan ilkeälle käytölle.

Tutkijat havaitsevat ChatGPT:n kaltaiset LLM:t tuottavat arkaluontoisia tietoja, vaikka ne on "poistettu" - https://t.co/P5QG8eGxwE

— ⚡️John The Collector⚡️ (@JohnTheCollectr) Lokakuu 2, 2023

Lisäksi ongelman ydin piilee näiden mallien suunnittelussa. Alustava vaihe sisältää koulutusta laajoista tietokannoista ja hienosäätöä johdonmukaisten tulosten varmistamiseksi. Terminologia "Generative Pretraed Transformer", joka on koteloitu GPT:hen, tarjoaa vilauksen tähän mekanismiin.

UNC:n tutkijat selvittivät hypoteettisen skenaarion, jossa LLM:stä, joka on nauttinut arkaluontoisten pankkitietojen joukosta, tulee mahdollinen uhka. Tekoälykehittäjien käyttämät nykyaikaiset suojakaiteet eivät pysty poistamaan tätä huolta.

Nämä suojatoimenpiteet, kuten kovakoodatut kehotteet tai RLHF (Reforcement Learning from Human Feedback) -niminen paradigma, ovat tärkeässä roolissa ei-toivottujen tulosten hillitsemisessä. He kuitenkin jättävät datan piiloon mallin kuiluun, valmiina kutsuttavaksi pelkällä kehotteen uudelleenmuotoilulla.

Turvakuilun kurominen umpeen

Huolimatta uusimpien mallien muokkausmenetelmien, kuten Rank-One Model Editingin, käyttöönotosta UNC-tiimi havaitsi, että merkittävää faktatietoa oli edelleen saatavilla. Heidän havainnot paljastivat, että tosiasiat voitiin herättää henkiin noin 38 % ja 29 % ajasta whitebox- ja blackbox-hyökkäysten avulla.

Etsinnässään tutkijat käyttivät mallia, joka tunnetaan nimellä GPT-J. 6 miljardilla parametrillaan se on kääpiö verrattuna valtavaan GPT-3.5:een. ChatGPT:n perusmalli 170 miljardilla parametrilla. Tämä jyrkkä kontrasti vihjaa valtavaan haasteeseen puhdistaa suuremmat mallit, kuten GPT-3.5, perusteettomista tiedoista.

Lisäksi UNC:n tutkijat kehittivät uusia puolustusmenetelmiä suojellakseen LLM:itä tietyiltä "poistohyökkäyksiltä". Nämä ilkeät suunnitelmat hyödyntävät mallin suojakaiteita arkaluontoisten tietojen kalastamiseksi. Siitä huolimatta lehti vihjasi pahaenteisesti ikuiseen kissa ja hiiri -leikkiin, jossa puolustusstrategiat jahtaavat ikuisesti kehittyvää hyökkäystaktiikkaa.

Microsoft delegoi ydinvoimatiimin Bolster AI:lle

Tähän liittyen, kasvava tekoäly on ajanut Microsoftin kaltaiset tekniikan huijarit lähtemään kartoittamattomille alueille. Microsoftin äskettäin perustama ydinvoimatiimi, joka tukee tekoälyaloitteita, korostaa tekoälyn ja energiaresurssien lisääntyviä vaatimuksia ja kietoutuvaa tulevaisuutta. Tekoälymallien kehittyessä heidän energianhalunsa kasvaa, mikä tasoittaa tietä innovatiivisille ratkaisuille tämän kasvavan kysynnän tyydyttämiseksi.

Microsoft perustaa ydinvoimatiimin tukemaan tekoälyä: Raporttihttps://t.co/OvAGclfMnt #Uutiset #crypto #Bitcoin # koneoppiminen #Microsoft #uutiset #technology https://t.co/OvAGclfMnt

- Crypto Breaking News: Viimeisimmät krypto- ja Bitcoin-uutiset (@CryptoBreakNews) Lokakuu 1, 2023

Tietojen säilyttämistä ja poistamista koskeva keskustelu LLM:issä ylittää akateemiset käytävät. Se kutsuu perusteelliseen tarkasteluun ja alan laajuiseen vuoropuheluun sellaisen vankan kehyksen edistämiseksi, joka varmistaa tietoturvan samalla kun vaalii tekoälyn kasvua ja potentiaalia.

Tämä UNC:n tutkijoiden hanke on merkittävä askel kohti "poistamattoman" dataongelman ymmärtämistä ja lopulta ratkaisemista, askeleen lähempänä tekoälyn tekemistä turvallisemmaksi työkaluksi digitaaliaikakaudella.

SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
Lähde: https://metanews.com/llms-like-chatgpt-persistently-leak-sensitive-data-despite-deletion-efforts/

Aikaleima: Lokakuu 3, 2023

Aikaleima: Joulukuu 26, 2023

Julkaissut Platon

Johtajat kokoontuvat puolustamaan tekoälyn kyberhyökkäystä

AstroSapiens häiritsee NFT-avaruutta

XDefiant on tuleva ilmainen peli, joka on tulossa vuonna 2023

Kiina pehmentää ulkomaisten videopelien lisensointia

Meta valtava AI-kulutus varjostaa kiinteät Q1-tulot

Gen AI Music hits 20 % menestysprosentti kaupallisissa alushousuissa

Tietoa meistä

Pystysuuntainen haku ja Ai

foorumi

Pysy yhteydessä

Tili