Onderzoekers Jimmy OpenAI en Google's gesloten modellen

Heruitgegeven door Plato

volgers: 0

Onderzoekers gebruiken de gesloten modellen PlatoBlockchain Data Intelligence van OpenAI en Google. Verticaal zoeken. Ai.

Boffins zijn erin geslaagd gesloten AI-services van OpenAI en Google open te wrikken met een aanval die een anders verborgen deel van de transformatormodellen herstelt.

De aanval belicht gedeeltelijk een bepaald type zogenaamd ‘black box’-model, waarbij de ingebedde projectielaag van een transformatormodel via API-query’s wordt onthuld. De kosten om dit te doen variëren van een paar dollar tot enkele duizenden, afhankelijk van de grootte van het model dat wordt aangevallen en het aantal zoekopdrachten.

Niet minder dan 13 computerwetenschappers van Google DeepMind, ETH Zurich, University of Washington, OpenAI en McGill University hebben dit geschreven een krant het beschrijven van de aanval, die voortbouwt op een aanvalstechniek voor modelextractie voorgestelde in 2016.

“Voor minder dan $ 20 extraheert onze aanval de volledige projectiematrix van de ada- en babbage-taalmodellen van OpenAI”, stellen de onderzoekers in hun artikel. “We bevestigen daarmee voor het eerst dat deze black-box-modellen een verborgen dimensie van respectievelijk 1024 en 2048 hebben. We achterhalen ook de exacte verborgen dimensiegrootte van het gpt-3.5-turbomodel en schatten dat het minder dan $ 2,000 aan zoekopdrachten zou kosten om de volledige projectiematrix te achterhalen.”

De onderzoekers hebben hun bevindingen bekendgemaakt aan OpenAI en Google, die beide verdedigingsmaatregelen zouden hebben geïmplementeerd om de aanval te verzachten. Ze kozen ervoor om de grootte van twee OpenAI gpt-3.5-turbomodellen, die nog steeds in gebruik zijn, niet te publiceren. De ada- en babbage-modellen zijn beide verouderd, dus het bekendmaken van hun respectieve maten werd als onschadelijk beschouwd.

Hoewel de aanval een model niet volledig blootlegt, zeggen de onderzoekers dat het wel de definitieve versie van het model kan onthullen gewicht matrix – of de breedte ervan, die vaak gerelateerd is aan het aantal parameters – en geeft informatie over de mogelijkheden van het model die verder onderzoek kunnen stimuleren. Ze leggen uit dat het verrassend en onwenselijk is om parameters uit een productiemodel te kunnen halen, omdat de aanvalstechniek mogelijk uitbreidbaar is om nog meer informatie te herstellen.

“Als je de gewichten hebt, dan heb je gewoon het volledige model”, legt Edouard Harris, CTO bij Gladstone AI, uit in een e-mail aan Het register. “Wat Google [et al.] deed, was enkele parameters van het volledige model reconstrueren door er vragen over te stellen, zoals een gebruiker dat zou doen. Ze lieten zien dat je belangrijke aspecten van het model kunt reconstrueren zonder dat je toegang hebt tot de gewichten.”

Toegang tot voldoende informatie over een eigen model zou iemand in staat kunnen stellen het te repliceren – een scenario waar Gladstone AI rekening mee hield een rapport in opdracht van het Amerikaanse ministerie van Buitenlandse Zaken met de titel “Defense in Depth: An Action Plan to Verhoog the Safety and Security of Advanced AI”.

Het rapport, gisteren vrijgelaten, biedt analyses en aanbevelingen voor de manier waarop de overheid AI moet benutten en zich moet beschermen tegen de manieren waarop het een potentiële bedreiging voor de nationale veiligheid vormt.

Een van de aanbevelingen van het rapport is “dat de Amerikaanse regering dringend benaderingen onderzoekt om de vrijgave of verkoop van geavanceerde AI-modellen te beperken tot boven de belangrijke drempels van capaciteit of totale trainingscomputers.” Dat omvat “het treffen van adequate beveiligingsmaatregelen om kritieke intellectuele eigendom te beschermen, inclusief modelgewichten.”

Gevraagd naar de aanbevelingen van het Gladstone-rapport in het licht van de bevindingen van Google, antwoordde Harris: “Om aanvallen als deze uit te voeren, moet je – althans voorlopig – zoekopdrachten uitvoeren in patronen die mogelijk detecteerbaar zijn door het bedrijf dat het model bedient. , wat OpenAI is in het geval van GPT-4. We raden aan om gebruikspatronen op hoog niveau te volgen, wat op een privacybeschermende manier moet gebeuren, om pogingen te identificeren om modelparameters te reconstrueren met behulp van deze benaderingen.”

“Natuurlijk kan dit soort first-pass-verdediging ook onpraktisch worden, en moeten we misschien meer geavanceerde tegenmaatregelen ontwikkelen (bijvoorbeeld een beetje willekeurig maken welke modellen welke reacties op een bepaald moment dienen, of andere benaderingen). In het plan zelf gaan we echter niet op dat detailniveau in.” ®

Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
Bron: https://go.theregister.com/feed/www.theregister.com/2024/03/13/researchers_pry_open_closed_models/

Tijdstempel: 13 maart 2024

Tijdstempel: 14 november 2023

Heruitgegeven door Plato

Waarom een zelfrijdende Waymo-taxi aan de verkeerde kant van de SF-weg reed

Amerikaanse senatoren proberen de AI-regelgeving op Wall Street te omzeilen

Hoe AI de industriële lichten kan laten schijnen

GenAI optimaliseren voor uw bedrijf

AstraZeneca wedt dat AI van 247 miljoen dollar kankerantilichamen kan creëren

Dat kan ik niet doen, Dave: AI verdrinkt top sci-fi tijdschrift met ingezonden verhalen

Microsoft-experts overwegen om Excel uit te rusten met AI

YouTubers vroegen om door AI gegenereerde inhoud openbaar te maken – of anders

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account