ChatGPT jailbreaking foorumid levivad tumedates veebikogukondades

ChatGPT jailbreaking foorumid levivad tumedates veebikogukondades

Generatiivsete AI-tööriistade, nagu ChatGPT, relvastamine kõik on oodanud on aeglaselt, aeglaselt hakkab vormi võtma. Veebikogukondades teevad uudishimulikud kassid koostööd uute võimaluste väljatöötamiseks ChatGPT eetikareeglite murdmiseks, mida tavaliselt tuntakse kui "jailbreaking", ja häkkerid arendavad uute tööriistade võrgustikku, et kasutada või luua suuri keelemudeleid (LLM) pahatahtlike eesmärkide saavutamiseks.

Nii nagu maapealne, näib ka ChatGPT olevat maa-alustes foorumites meeletusi inspireerinud. Alates detsembrist on häkkerid jahtinud uut ja leidlikkust palub ChatGPT-ga manipuleeridaja avatud lähtekoodiga LLM-id, mida nad saavad pahatahtlikeks eesmärkideks ümber kasutada

SlashNexti uue ajaveebi kohaselt on tulemuseks alles tekkiv, kuid õitsev LLM-i häkkimiskogukond, millel on palju nutikaid vihjeid, kuid vähesed AI-toega pahavarad, mida tasub mõelda.

Mida häkkerid AI LLM-idega teevad

Kiire inseneritöö See hõlmab nutikalt vestlusrobotite (nt ChatGPT) küsimuste esitamist, mille eesmärk on nendega manipuleerida, pannes nad rikkuma oma programmeeritud reegleid näiteks pahavara loomise vastu, ilma et mudelid seda teaksid. See on toore jõu kasutamine, selgitab SlashNexti tegevjuht Patrick Harr: „Häkkerid üritavad lihtsalt kaitsepiiretel ringi vaadata. Mis on servad? Ma lihtsalt muudan pidevalt viipasid, palun tal erinevatel viisidel teha seda, mida tahan.

Kuna see on nii tüütu ülesanne ja kõik ründavad sama sihtmärki, on loomulik, et näpunäidete ja nippide jagamise tava ümber on moodustunud terve suurusega veebikogukonnad. Nende jailbreak-kogukondade liikmed kratsivad üksteise selga, aidates üksteisel ChatGPT-d murda ja teha asju, mille arendajad kavatsesid seda takistada.

ekraanipilt veebivestlusgrupist, mis on tehtud viipade saamiseks
Allikas: SlashNext

Kiired insenerid saavad väljamõeldud sõnamänguga nii palju saavutada, kui kõnealune vestlusbot on üles ehitatud sama vastupidavalt kui ChatGPT. Seega on murettekitavam suundumus see, et pahavaraarendajad hakkavad LLM-e programmeerima oma alatutel eesmärkidel.

WormGPT ja pahatahtlike LLM-ide ähvardav oht

Pakkumine helistas WormGPT ilmus juulis, et käivitada pahatahtliku LLM-i nähtus. See on musta mütsi alternatiiv GPT mudelitele, mis on loodud spetsiaalselt pahatahtlike tegevuste jaoks, nagu BEC, pahavara ja andmepüügirünnakud, mida turustatakse maa-alustes foorumites, „nagu ChatGPT, kuid ilma eetiliste piiride või piiranguteta”. WormGPT looja väitis, et ehitas selle kohandatud keelemudelile, mis on koolitatud erinevatel andmeallikatel, rõhuasetusega küberrünnakutega seotud andmetel.

"Mida see häkkerite jaoks tähendab," selgitab Harr, "kas ma saan nüüd vastu võtta näiteks ärimeili kompromissi (BEC), andmepüügi või pahavara rünnaku ja teha seda suures mahus väga minimaalsete kuludega. Ja ma võiksin olla palju sihipärasem kui varem.

Alates WormGPT-st on varjulistes veebikogukondades kasutatud mitmeid sarnaseid tooteid, sealhulgas FraudGPT, mida reklaamib „piirangute, reeglite ja piirideta robotina” ohus osaleja, kes väidab end olevat erinevatel maa-alustel Dark Webi turgudel, sealhulgas Empire, WHM, Torrez, World, AlphaBay ja Versus, kinnitatud müüja. Ja august tõi selle ilmumise DarkBART ja DarkBERT küberkurjategijate vestlusrobotid, mis põhineb Google Bardil, mis tolleaegsete teadlaste sõnul kujutab endast suurt edasiminekut võistleva tehisintellekti, sealhulgas Google Lensi piltide integreerimise ja kohese juurdepääsu kogu küber-maa-aluste teadmistebaasile.

SlashNexti andmetel on need praegu vohavad, kuna enamik neist põhineb avatud lähtekoodiga mudelitel, nagu OpenAI OpenGPT. Hulk madalama kvalifikatsiooniga häkkereid lihtsalt kohandab seda, maskeerib selle ümbrisesse ja seejärel lööb sellele ebamääraselt kurjakuulutava nime „___GPT” (nt „BadGPT”, „DarkGPT”). Isegi nendel ersatzi pakkumistel on kogukonnas oma koht, pakkudes kasutajatele vähe piiranguid ja täielikku anonüümsust.

Kaitse järgmise põlvkonna tehisintellekti küberrelvade vastu

SlashNexti andmetel ei kujuta ei WormGPT ega selle järglased ega kiired insenerid ettevõtetele veel nii olulist ohtu. Sellegipoolest tähendab maa-aluste vangimurdmise turgude tõus seda, et küberkurjategijad saavad kättesaadavaks rohkem tööriistu, mis omakorda tähendab ulatuslikku nihet sotsiaalses manipuleerimises ja selles, kuidas me selle vastu kaitseme. 

Harr soovitab: "Ärge lootke koolitusele, sest need rünnakud on väga-väga spetsiifilised ja väga sihitud, palju rohkem kui varem."

Selle asemel nõustub ta üldiselt kokkulepitud seisukohaga, et tehisintellekti ohud nõuavad tehisintellekti kaitset. "Kui teil pole tehisintellekti tööriistu nende ohtude tuvastamiseks, ennustamiseks ja blokeerimiseks, vaatate väljastpoolt, " ütleb ta.

Ajatempel:

Veel alates Tume lugemine