Miks peate teadma oma tehisintellekti esivanemaid?

Miks peate teadma oma tehisintellekti esivanemaid?

Miks peate teadma oma tehisintellekti esivanemaid PlatoBlockchaini andmeluure? Vertikaalne otsing. Ai.

MÄRKUSED

Tehisintellekt (AI) muudab kiiresti peaaegu kõiki meie igapäevaelu aspekte, alates sellest, kuidas me töötame, kuidas me teavet omastame ja kuidas me oma juhte määrame. Nagu iga tehnoloogia puhul, on AI amoraalne, kuid seda saab kasutada ühiskonna edendamiseks või kahju tekitama.

Andmed on geenid, mis toidavad tehisintellekti rakendusi. See on DNA ja RNA, mis on kõik ühte pakitud. Nagu tarkvarasüsteemide ehitamisel sageli öeldakse: "prügi sisse / prügi välja". AI-tehnoloogia on täpselt nii täpne, turvaline ja funktsionaalne kui andmeallikad, millele see tugineb. Tehisintellekti lubaduse täitmise ja õudusunenägude vältimise tagamise võti peitub võimes hoida prügi eemal ning takistada selle levikut ja paljunemist miljonites AI-rakendustes.

Seda nimetatakse andmete lähtekohaks ja me ei saa enam päevagi oodata, et rakendada kontrolle, mis takistavad meie tehisintellekti tulevikus muutumast tohutuks prügihunnikuks.

Halvad andmed viivad tehisintellekti mudeliteni, mis võivad sekunditega levitada küberturvalisuse haavatavusi, desinformatsiooni ja muid ründeid kogu maailmas. Tänane generatiivne AI (GenAI) mudelid on uskumatult keerulised, kuid põhiolemuselt ennustavad GenAI mudelid olemasolevate varasemate andmete komplekti arvestades lihtsalt parimat järgmist andmehulka.

Täpsuse mõõtmine

ChatGPT-tüüpi mudel hindab sõnade komplekti, mis moodustavad algse küsitud küsimuse, ja kõiki seni mudeli vastuses olnud sõnu, et arvutada välja parim sõna. Ta teeb seda korduvalt, kuni ta otsustab, et on andnud piisavalt vastust. Oletame, et hindate mudeli võimet siduda kokku sõnu, mis moodustavad hästi moodustatud, grammatiliselt õigeid lauseid, mis on teemakohased ja üldiselt vestlusega seotud. Sel juhul on tänapäeva mudelid hämmastavalt head — täpsuse mõõt.

Sukeldu sügavamale kas tehisintellekti loodud tekst edastab alati “õiget” informatsiooni ja näitab asjakohaselt edastatava teabe usaldustaset. See toob esile probleemid, mis tulenevad mudelitest, mis ennustavad keskmiselt väga hästi, kuid mitte nii hästi äärmuslike juhtumite puhul – mis kujutab endast robustsuse probleemi. Seda võib veelgi suurendada, kui AI mudelite kehvad andmed salvestatakse võrgus ja neid kasutatakse tulevaste treeningandmetena nende ja muude mudelite jaoks.

Kehvad väljundid võivad paljuneda sellises mahus, mida me pole kunagi näinud, põhjustades tehisintellekti allapoole langeva hukutsükli.

Kui halb näitleja sooviks sellele protsessile kaasa aidata, võiks ta sihilikult julgustada eriti halbade andmete tootmist, salvestamist ja levitamist – see toob kaasa veelgi rohkem valeinformatsiooni vestlusrobotidest või midagi nii alatut ja hirmutavat kui autode autopiloodi mudelid, kes otsustavad, et nad peavad seda tegema. pöörake auto kiiresti paremale, hoolimata takistustest, kui nad "näevad" enda ees spetsiaalselt loodud pilti (loomulikult hüpoteetiliselt).

Pärast aastakümneid on tarkvaraarenduse tööstus – mida juhib küberturvalisuse infrastruktuuri turvaagentuur – lõpuks juurutamas konstruktsiooni järgi turvaline raamistik. Disaini järgi turvaline nõuab, et küberjulgeolek on tarkvara arendusprotsessi aluseks ja üks selle põhiprintsiipe on nõuda iga tarkvaraarenduse komponendi kataloogimist. tarkvara materjalide arve (SBOM) — tugevdada turvalisust ja vastupidavust. Lõpuks asendab turvalisus kiiruse kui kõige kriitilisema turuletuleku teguri.

AI disainilahenduste turvamine

AI vajab midagi sarnast. Tehisintellekti tagasisidesilmus takistab levinud varasemaid küberturvalisuse kaitsetehnikaid, nagu pahavarasignatuuride jälgimine, võrguressursside ümber perimeetrite ehitamine või inimeste kirjutatud koodi haavatavuste otsimine. Peame muutma turvalise tehisintellekti disaini nõudeks tehnoloogia lapsekingades, et tehisintellekt oleks turvaliseks tehtud juba ammu enne Pandora laeka avamist.

Niisiis, kuidas me selle probleemi lahendame? Peaksime lehekülje akadeemilisest maailmast välja võtma. Koolitame õpilasi kõrgelt kureeritud koolitusandmetega, mida tõlgendatakse ja edastatakse neile õpetajatööstuse kaudu. Jätkame seda lähenemisviisi täiskasvanute õpetamisel, kuid täiskasvanud peavad ise rohkem andmeid kureerima.

AI mudeli koolitusel tuleb kasutada kaheastmelist kureeritud andmete lähenemisviisi. Alustuseks koolitaks AI baasmudeleid praeguste metoodikate abil, kasutades tohutul hulgal vähem kureeritud andmekogumeid. Need põhilised suured keelemudelid (LLM-id) oleksid ligikaudu analoogsed vastsündinud lapsega. Seejärel koolitatakse baastaseme mudeleid kõrgelt kureeritud andmekogumitega, mis on sarnased sellega, kuidas lapsi täiskasvanuks õpetatakse ja kasvatatakse.

Pingutused suurte, kureeritud treeningandmete kogumite loomiseks igat tüüpi eesmärkide jaoks ei ole väikesed. See on analoogne kogu pingutusega, mida lapsevanemad, koolid ja ühiskond teevad, et pakkuda lastele kvaliteetset keskkonda ja kvaliteetset teavet, kui nad kasvavad (loodetavasti) toimivaks, ühiskonda lisandväärtust loovaks panustajaks. See on jõupingutuste tase, mis on vajalik kvaliteetsete andmekogumite loomiseks, et koolitada kvaliteetseid, hästitoimivaid, minimaalselt rikutud tehisintellekti mudeleid, ning see võib viia selleni, et terve tööstusharu tehisintellektist ja inimestest töötavad koos, et õpetada tehisintellekti mudeleid oma eesmärki täitma. .

Tänapäeva tehisintellekti koolitusprotsessi seis näitab selle kaheetapilise protsessi märke. Kuid GenAI tehnoloogia ja tööstuse lapsekingade tõttu kasutatakse liiga palju koolitust vähem kureeritud, esimese etapi lähenemisviisi.

Tehisintellekti turvalisuse osas ei saa me endale lubada tundigi ootamist, rääkimata kümnendist. AI vajab 23andMe rakendust, mis võimaldab "algoritmi genealoogia" täielikku ülevaatamist, et arendajad saaksid täielikult aru AI "perekonnaajaloost", et vältida krooniliste probleemide paljunemist, nakatada kriitilisi süsteeme, millele me iga päev tugineme, ning tekitada majanduslikku ja ühiskondlikku kahju. mis võib olla pöördumatu.

Sellest sõltub meie riiklik julgeolek.

Ajatempel:

Veel alates Tume lugemine