Zakaj morate poznati svoje prednike AI

Zakaj morate poznati svoje prednike AI

Why You Need to Know Your AI's Ancestry PlatoBlockchain Data Intelligence. Vertical Search. Ai.

KOMENTAR

Umetna inteligenca (AI) hitro spreminja skoraj vse vidike našega vsakdanjega življenja, od tega, kako delamo, do tega, kako zaužijemo informacije, do tega, kako določamo svoje voditelje. Kot pri vsaki tehnologiji je tudi AI amoralna, vendar se lahko uporablja za napredek družbe oz povzročati škodo.

Podatki so geni, ki poganjajo aplikacije AI. To sta DNK in RNK, zavita v eno. Kot se pogosto reče pri gradnji programskih sistemov: "smeti noter/garbage out." Tehnologija umetne inteligence je tako natančna, varna in funkcionalna kot viri podatkov, na katere se opira. Ključ do zagotavljanja, da umetna inteligenca izpolni svojo obljubo in se izogne ​​svojim nočnim moram, je v zmožnosti preprečiti smeti zunaj in preprečiti njihovo širjenje in razmnoževanje v milijonih aplikacij umetne inteligence.

To se imenuje izvor podatkov in ne moremo čakati še en dan, da uvedemo nadzor, ki preprečuje, da bi naša prihodnost AI postala ogromno smetišče.

Slabi podatki vodijo do modelov umetne inteligence, ki lahko v nekaj sekundah širijo ranljivosti kibernetske varnosti, dezinformacije in druge napade po vsem svetu. Današnji generativni AI Modeli (GenAI) so neverjetno zapleteni, vendar v bistvu modeli GenAI preprosto napovedujejo najboljši naslednji del podatkov za izpis glede na niz obstoječih prejšnjih podatkov.

Meritev natančnosti

Model tipa ChatGPT ovrednoti nabor besed, ki sestavljajo prvotno postavljeno vprašanje, in vse besede v dosedanjem odgovoru modela, da izračuna naslednjo najboljšo besedo za izpis. To počne večkrat, dokler se ne odloči, da je dal dovolj odgovora. Denimo, da ocenjujete sposobnost modela, da niza besede, ki sestavljajo dobro oblikovane, slovnično pravilne stavke, ki so na temo in so na splošno pomembni za pogovor. V tem primeru so današnji modeli osupljivo dobri — merilo natančnosti.

Potopite se globlje v ali besedilo, ki ga ustvari umetna inteligenca, vedno posreduje »pravilne« informacije in ustrezno označuje stopnjo zaupanja posredovanih informacij. To razkriva težave, ki izvirajo iz modelov, ki v povprečju zelo dobro napovedujejo, vendar ne tako dobro na robovih – kar predstavlja težavo robustnosti. Lahko se poveča, ko se slabi podatki iz modelov AI shranijo na spletu in uporabijo kot prihodnji podatki za usposabljanje za te in druge modele.

Slabi rezultati se lahko ponovijo v obsegu, ki ga še nismo videli, kar povzroči padajočo zanko umetne inteligence.

Če bi slabi akter želel pomagati pri tem procesu, bi lahko namenoma spodbudil ustvarjanje, shranjevanje in širjenje dodatnih slabih podatkov, kar bi povzročilo še več napačnih informacij, ki prihajajo iz klepetalnih robotov, ali nekaj tako nečednega in strašljivega, kot so modeli avtomobilskega avtopilota, ki se odločijo, da morajo hitro zavijejo avto v desno kljub predmetom, ki so v napoto, če "vidijo" posebej oblikovano sliko pred seboj (seveda hipotetično).

Po desetletjih industrija razvoja programske opreme, ki jo vodi Agencija za varnost infrastrukture kibernetske varnosti, končno uvaja varno po zasnovi okvir. Varno po zasnovi določa, da je kibernetska varnost temelj procesa razvoja programske opreme, eno od njenih temeljnih načel pa je zahteva po katalogiziranju vsake komponente razvoja programske opreme – seznam materiala programske opreme (SBOM) — za krepitev varnosti in odpornosti. Nazadnje, varnost nadomešča hitrost kot najpomembnejši dejavnik vstopa na trg.

Varovanje modelov AI

AI potrebuje nekaj podobnega. Povratna zanka umetne inteligence preprečuje običajne obrambne tehnike kibernetske varnosti iz preteklosti, kot je sledenje podpisom zlonamerne programske opreme, gradnja perimetrov okoli omrežnih virov ali skeniranje kode, ki jo je napisal človek, za ranljivosti. Varne zasnove umetne inteligence moramo postaviti kot zahtevo v povojih tehnologije, da bo lahko umetna inteligenca varna veliko preden se odpre Pandorina skrinjica.

Torej, kako rešimo to težavo? Morali bi vzeti stran iz sveta akademije. Študente usposabljamo z visoko kuriranimi podatki o usposabljanju, ki jih interpretiramo in posredujemo skozi industrijo učiteljev. S tem pristopom nadaljujemo poučevanje odraslih, vendar se od odraslih pričakuje, da bodo sami skrbeli za več podatkov.

Usposabljanje modelov AI mora uporabiti dvostopenjski pristop kuriranih podatkov. Za začetek bi se osnovni modeli umetne inteligence usposobili z uporabo trenutnih metodologij z uporabo ogromnih količin manj kuriranih nizov podatkov. Ti osnovni veliki jezikovni modeli (LLM) bi bili približno podobni novorojenčku. Modele na osnovni ravni bi nato usposobili z visoko kuriranimi nabori podatkov, podobno kot otroke učijo in vzgajajo, da postanejo odrasli.

Prizadevanje za izdelavo velikih, kuriranih naborov podatkov o usposabljanju za vse vrste ciljev ne bo majhno. To je analogno vsem prizadevanjem, ki jih starši, šole in družba vlagajo v zagotavljanje kakovostnega okolja in kakovostnih informacij za otroke, ko odraščajo v (upajmo) delujoče osebe, ki prispevajo družbi z dodano vrednostjo. To je stopnja truda, ki je potrebna za izgradnjo kakovostnih nizov podatkov za usposabljanje kakovostnih, dobro delujočih, minimalno poškodovanih modelov umetne inteligence, in to bi lahko vodilo do celotne industrije umetne inteligence in ljudi, ki sodelujejo pri učenju modelov umetne inteligence, da so dobri pri svojem ciljnem delu. .

Stanje današnjega procesa usposabljanja AI kaže nekaj znakov tega dvostopenjskega procesa. Toda zaradi povoja tehnologije GenAI in industrije preveč usposabljanja zahteva manj kuriran pristop prve stopnje.

Ko gre za varnost umetne inteligence, si ne moremo privoščiti čakanja ene ure, kaj šele desetletja. Umetna inteligenca potrebuje aplikacijo 23andMe, ki omogoča popoln pregled "genealogije algoritmov", tako da lahko razvijalci v celoti razumejo "družinsko" zgodovino umetne inteligence, da preprečijo ponavljanje kroničnih težav, okužbo kritičnih sistemov, na katere se vsak dan zanašamo, ter ustvarjanje gospodarske in družbene škode. ki je lahko nepopravljivo.

Naša nacionalna varnost je odvisna od tega.

Časovni žig:

Več od Temno branje