ChatGPT jailbreaking foorumid levivad tumedates veebikogukondades

Taasavaldanud Platon

järgijaid: 0

Generatiivsete AI-tööriistade, nagu ChatGPT, relvastamine kõik on oodanud on aeglaselt, aeglaselt hakkab vormi võtma. Veebikogukondades teevad uudishimulikud kassid koostööd uute võimaluste väljatöötamiseks ChatGPT eetikareeglite murdmiseks, mida tavaliselt tuntakse kui "jailbreaking", ja häkkerid arendavad uute tööriistade võrgustikku, et kasutada või luua suuri keelemudeleid (LLM) pahatahtlike eesmärkide saavutamiseks.

Nii nagu maapealne, näib ka ChatGPT olevat maa-alustes foorumites meeletusi inspireerinud. Alates detsembrist on häkkerid jahtinud uut ja leidlikkust palub ChatGPT-ga manipuleeridaja avatud lähtekoodiga LLM-id, mida nad saavad pahatahtlikeks eesmärkideks ümber kasutada.

SlashNexti uue ajaveebi kohaselt on tulemuseks alles tekkiv, kuid õitsev LLM-i häkkimiskogukond, millel on palju nutikaid vihjeid, kuid vähesed AI-toega pahavarad, mida tasub mõelda.

Mida häkkerid AI LLM-idega teevad

Kiire inseneritöö See hõlmab nutikalt vestlusrobotite (nt ChatGPT) küsimuste esitamist, mille eesmärk on nendega manipuleerida, pannes nad rikkuma oma programmeeritud reegleid näiteks pahavara loomise vastu, ilma et mudelid seda teaksid. See on toore jõu kasutamine, selgitab SlashNexti tegevjuht Patrick Harr: „Häkkerid üritavad lihtsalt kaitsepiiretel ringi vaadata. Mis on servad? Ma lihtsalt muudan pidevalt viipasid, palun tal erinevatel viisidel teha seda, mida tahan.

Kuna see on nii tüütu ülesanne ja kõik ründavad sama sihtmärki, on loomulik, et näpunäidete ja nippide jagamise tava ümber on moodustunud terve suurusega veebikogukonnad. Nende jailbreak-kogukondade liikmed kratsivad üksteise selga, aidates üksteisel ChatGPT-d murda ja teha asju, mille arendajad kavatsesid seda takistada.

ekraanipilt veebivestlusgrupist, mis on tehtud viipade saamiseks — Allikas: SlashNext

Kiired insenerid saavad väljamõeldud sõnamänguga nii palju saavutada, kui kõnealune vestlusbot on üles ehitatud sama vastupidavalt kui ChatGPT. Seega on murettekitavam suundumus see, et pahavaraarendajad hakkavad LLM-e programmeerima oma alatutel eesmärkidel.

WormGPT ja pahatahtlike LLM-ide ähvardav oht

Pakkumine helistas WormGPT ilmus juulis, et käivitada pahatahtliku LLM-i nähtus. See on musta mütsi alternatiiv GPT mudelitele, mis on loodud spetsiaalselt pahatahtlike tegevuste jaoks, nagu BEC, pahavara ja andmepüügirünnakud, mida turustatakse maa-alustes foorumites, „nagu ChatGPT, kuid ilma eetiliste piiride või piiranguteta”. WormGPT looja väitis, et ehitas selle kohandatud keelemudelile, mis on koolitatud erinevatel andmeallikatel, rõhuasetusega küberrünnakutega seotud andmetel.

"Mida see häkkerite jaoks tähendab," selgitab Harr, "kas ma saan nüüd vastu võtta näiteks ärimeili kompromissi (BEC), andmepüügi või pahavara rünnaku ja teha seda suures mahus väga minimaalsete kuludega. Ja ma võiksin olla palju sihipärasem kui varem.

Alates WormGPT-st on varjulistes veebikogukondades kasutatud mitmeid sarnaseid tooteid, sealhulgas FraudGPT, mida reklaamib „piirangute, reeglite ja piirideta robotina” ohus osaleja, kes väidab end olevat erinevatel maa-alustel Dark Webi turgudel, sealhulgas Empire, WHM, Torrez, World, AlphaBay ja Versus, kinnitatud müüja. Ja august tõi selle ilmumise DarkBART ja DarkBERT küberkurjategijate vestlusrobotid, mis põhineb Google Bardil, mis tolleaegsete teadlaste sõnul kujutab endast suurt edasiminekut võistleva tehisintellekti, sealhulgas Google Lensi piltide integreerimise ja kohese juurdepääsu kogu küber-maa-aluste teadmistebaasile.

SlashNexti andmetel on need praegu vohavad, kuna enamik neist põhineb avatud lähtekoodiga mudelitel, nagu OpenAI OpenGPT. Hulk madalama kvalifikatsiooniga häkkereid lihtsalt kohandab seda, maskeerib selle ümbrisesse ja seejärel lööb sellele ebamääraselt kurjakuulutava nime „___GPT” (nt „BadGPT”, „DarkGPT”). Isegi nendel ersatzi pakkumistel on kogukonnas oma koht, pakkudes kasutajatele vähe piiranguid ja täielikku anonüümsust.

Kaitse järgmise põlvkonna tehisintellekti küberrelvade vastu

SlashNexti andmetel ei kujuta ei WormGPT ega selle järglased ega kiired insenerid ettevõtetele veel nii olulist ohtu. Sellegipoolest tähendab maa-aluste vangimurdmise turgude tõus seda, et küberkurjategijad saavad kättesaadavaks rohkem tööriistu, mis omakorda tähendab ulatuslikku nihet sotsiaalses manipuleerimises ja selles, kuidas me selle vastu kaitseme.

Harr soovitab: "Ärge lootke koolitusele, sest need rünnakud on väga-väga spetsiifilised ja väga sihitud, palju rohkem kui varem."

Selle asemel nõustub ta üldiselt kokkulepitud seisukohaga, et tehisintellekti ohud nõuavad tehisintellekti kaitset. "Kui teil pole tehisintellekti tööriistu nende ohtude tuvastamiseks, ennustamiseks ja blokeerimiseks, vaatate väljastpoolt, " ütleb ta.

SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
PlatoESG. Autod/elektrisõidukid, Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
ChartPrime. Tõsta oma kauplemismängu ChartPrime'iga kõrgemale. Juurdepääs siia.
BlockOffsets. Keskkonnakompensatsiooni omandi ajakohastamine. Juurdepääs siia.
Allikas: https://www.darkreading.com/application-security/chatgpt-jailbreaking-forums-dark-web-communities

Ajatempel: September 12, 2023

Ajatempel: Aprill 25, 2024

Taasavaldanud Platon

ThreatQuotient täiustab andmepõhise automatiseerimise võimalusi ThreatQ TDR orkestraatori uute funktsioonidega

Kübervastupidavus ei seisne ainult tehnoloogias, vaid inimestes

Zoomi vigade hindamise süsteem seab kübermeeskondade jaoks esikohale kõige riskantsemad haavad

RomComi pahavara meelitab ohvreid "mähitud" SolarWindsi ja KeePassi tarkvaraga

Miks on identiteedihaldus APT küberrünnakute peatamise võti?

Rakenduste arendajad on üha enam suunatud Slacki, DevOpsi tööriistade kaudu

FCC kiidab heaks vabatahtlikud küberusaldusmärgised tarbekaupade Interneti-toodete jaoks

Aafrika, Lähis-Ida on küberjulgeoleku alal juhtivad kolleegid, kuid globaalselt mahajäämus

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto