Meta AI -mallit avattiin paljastuneilla API-tunnuksilla

Meta AI -mallit avattiin paljastuneilla API-tunnuksilla

Meta AI -mallit avautuivat paljastuneilla API-tokeneilla PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Tutkijat saivat äskettäin täyden luku- ja kirjoitusoikeuden Metan Bloom-, Meta-Llama- ja Pythia Large Language Model (LLM) -tietovarastoon, mikä on huolestuttava osoitus toimitusketjun riskeistä organisaatioille, jotka käyttävät näitä tietovarastoja integroidakseen LLM-ominaisuudet sovelluksiinsa. ja operaatiot.

Pääsy olisi antanut vastustajalle mahdollisuuden myrkyttää opetusdataa näissä laajalti käytetyissä LLM:issä, varastaa malleja ja tietojoukkoja ja mahdollisesti suorittaa muita haitallisia toimintoja, jotka lisäisivät miljoonien jatkokäyttäjien turvallisuusriskejä.

Paljastuneita rahakkeita halaavilla kasvoilla

Näin kertovat AI-tietoturvakäynnistyksen Lasso Securityn tutkijat, jotka pääsivät Metan omistamiin mallitietovarastoihin käyttämällä suojaamattomat API-käyttötunnukset, jotka he löysivät GitHubista ja Hugging Facesta alusta LLM-kehittäjille.

Heidän Meta-alustoille löytämänsä tunnukset olivat yli 1,500 722 samankaltaisen tunnuksen joukossa, jotka he löysivät Hugging Facesta ja GitHubista ja jotka tarjosivat heille vaihtelevan pääsyn arkistoihin, jotka kuuluvat yhteensä XNUMX muulle organisaatiolle. Heidän joukossaan olivat Google, Microsoft ja VMware.

"Organisaatioiden ja kehittäjien tulisi ymmärtää, että Hugging Face ja muut vastaavat alustat eivät toimi [suojatakseen] käyttäjilleen näkyviä tunnuksia", sanoo Lasson tietoturvatutkija Bar Lanyado. Hän sanoo, että näiden alustojen kehittäjien ja muiden käyttäjien on toteutettava tarvittavat toimenpiteet pääsynsä suojaamiseksi.

"Työskentelyssä ja generatiivisten tekoäly- ja LLM-pohjaisten työkalujen integroinnissa yleensä tarvitaan koulutusta", hän huomauttaa. "Tämä tutkimus on osa lähestymistapaamme valaista tämäntyyppisiä heikkouksia ja haavoittuvuuksia ja vahvistaa tämäntyyppisten ongelmien turvallisuutta."

Hugging Face on alusta, jota monet LLM-ammattilaiset käyttävät työkalujen ja muiden resurssien lähteenä LLM-projekteihin. Yrityksen päätarjontaan kuuluu Transformers, avoimen lähdekoodin kirjasto, joka tarjoaa Sovellusliittymät ja työkalut lataamista ja viritystä varten valmiiksi koulutetut mallit. Yritys isännöi - GitHub-kaltaisella tavalla - enemmän yli 500,000 250,000 tekoälymallia ja XNUMX XNUMX tietojoukot, mukaan lukien Metan, Googlen, Microsoftin ja VMwaren tiedot. Sen avulla käyttäjät voivat lähettää omia mallejaan ja tietokokonaisuuksiaan alustalle ja käyttää niitä ilmaiseksi Hugging Face API:n kautta. Yhtiö on kerännyt tähän mennessä noin 235 miljoonaa dollaria sijoittajilta, joihin kuuluvat Google ja Nvidia.

Alustan laajan käytön ja kasvavan suosion vuoksi Lasson tutkijat päättivät perehtyä tarkemmin rekisteriin ja sen suojausmekanismeihin. Osana harjoitusta tutkijat yrittivät marraskuussa 2023 selvittää, voisivatko he löytää paljaita API-tunnuksia, joiden avulla he voisivat käyttää Hugging Facen tietojoukkoja ja malleja. He etsivät paljaita API-tunnuksia GitHubista ja Hugging Facesta. Aluksi skannaukset palauttivat vain hyvin rajoitetun määrän tuloksia, erityisesti Hugging Face -sovelluksessa. Mutta skannausprosessin pienellä säädöllä tutkijat onnistuivat löytämään suhteellisen suuren määrän paljastuneita tunnuksia, Lanyado sanoo.

Paljastuneita rahakkeita on yllättävän helppo löytää

"Tämän tutkimuksen aikana uskoin, että pystyisimme löytämään suuren määrän paljastettuja tokeneja", Lanyado sanoo. "Mutta olin silti erittäin yllättynyt löydöistä sekä yksinkertaisuudesta, jolla pääsimme käsiksi näihin rahakkeisiin."

Lasso-tutkijat pääsivät käsiksi useiden huipputeknologiayritysten – myös korkeatasoisten – tokeneihin ja saivat täyden hallinnan joihinkin niistä, Lanyado sanoo.

Lasso-tietoturvatutkijat löysivät GitHubista ja Hugging Facesta yhteensä 1,976 1,681 tokenia, joista 1,326 370 osoittautui kelvollisiksi ja käyttökelpoisiksi. Näistä 655 77 oli GitHubissa ja XNUMX Hugging Facessa. Jopa XNUMX Lasson löytämistä tunnuksista oli kirjoitusoikeudet Hugging Faceen. Tutkijat löysivät myös tunnuksia, jotka antoivat heille täyden pääsyn XNUMX organisaatioon, jotka käyttävät Meta-Lamaa, Pythiaa ja Bloomia. "Jos hyökkääjä olisi saanut pääsyn näihin API-tunnuksiin, hän voisi varastaa yritysten malleja, jotka joissakin tapauksissa ovat heidän pääliiketoimintaansa", Lanyado sanoo. Hyökkääjä, jolla on kirjoitusoikeudet, voi korvata olemassa olevat mallit haitallisilla tai luoda täysin uuden haitallisen mallin nimeensä. Tällaiset toimet olisivat antaneet hyökkääjälle mahdollisuuden saada jalansijaa kaikissa vaarantuneita malleja käyttävissä järjestelmissä tai varastaa käyttäjätietoja ja/tai levittää manipuloitua tietoa, hän huomauttaa.

Lanyadon mukaan Lasso-tutkijat löysivät useita Metaan liittyviä tokeneita, joista yhdellä oli kirjoitusoikeudet Meta Llamaan ja kahdella kummallakin kirjoitusoikeudet Pythiaan ja Bloomiin. Microsoftiin ja VMwareen liittyvillä API-tunnuksella oli vain lukuoikeudet, mutta ne antoivat Lasson tutkijoille mahdollisuuden tarkastella kaikkia yksityisiä tietojoukkojaan ja mallejaan, hän sanoo.

Lasso paljasti havainnot kaikille käyttäjille ja organisaatioille, joita asia koskee, ja suositteli niiden paljastamien tokenien peruuttamista ja niiden poistamista vastaavista arkistoistaan. Tietoturvatoimittaja ilmoitti myös Hugging Facelle ongelmasta.

"Monet organisaatiot (Meta, Google, Microsoft, VMware ja muut) ja käyttäjät tekivät erittäin nopeita ja vastuullisia toimia", Lasson raportin mukaan. "He peruuttivat tunnukset ja poistivat julkisen käyttöoikeuskoodin samana päivänä kuin ilmoitus."

Aikaleima:

Lisää aiheesta Pimeää luettavaa