AI-kujutiste genereerimine areneb astronoomilise kiirusega. Kas me saame ikka öelda, kas pilt on võlts?

Taasavaldanud Platon

järgijaid: 0

Võltsfotograafia pole midagi uut. 1910. aastatel pettusid Briti kirjanik Arthur Conan Doyle kuulsalt kahe kooliealise õe poolt, kes olid teinud fotosid elegantsetest haldjatest, kes nende aias ukerdasid.

Esimene viiest "Cottingley Fairies" fotost, mille tegi Elsie Wright 1917. aastal. Pildi krediit: Wikipedia

Tänapäeval on raske uskuda, et need fotod võisid kedagi petta, kuid alles 1980. aastatel oli eksperdil nimega Geoffrey Crawley närv oma teadmisi filmifotograafiast vahetult rakendada ja ilmselgeid järeldusi teha.

Fotod olid võltsitud, nagu hiljem tunnistas üks õdedest ise.

Veidi kummaline pilt naeratavast mehest, kes hoiab käes vanakooli fotokaamerat — Aastal 1982 järeldas Geoffrey Crawley, et haldjafotod olid võltsitud. Nii ka see. Pildi krediit: Brendan Murphy / autor

Artefaktide ja terve mõistuse jaht

Digitaalne fotograafia on avanud hulgaliselt tehnikaid nii võltsijatele kui ka detektiividele.

Kahtlustatavate piltide kohtuekspertiis hõlmab tänapäeval digitaalfotograafiale omaste omaduste otsimist, näiteks uurimist. fotodele manustatud metaandmed, kasutades kujutiste moonutuste parandamiseks tarkvara, nagu Adobe Photoshop, ja manipuleerimisest märku andvate märkide otsimine, näiteks piirkondade dubleerimine, et varjata algseid funktsioone.

Mõnikord on digitaalsed muudatused tuvastamiseks liiga peened, kuid need hüppavad nähtavale, kui kohandame heledate ja tumedate pikslite jaotumist. Näiteks 2010. aastal avaldas NASA a foto Saturni kuudest Dione ja Titan. See ei olnud mingil juhul võlts, vaid see oli puhastatud, et eemaldada hulkuvad esemed – mis said vandenõuteoreetikute tähelepanu.

Uudishimulikuna panin pildi Photoshopi. Allolev illustratsioon taastab umbkaudu, kuidas see välja nägi.

Ekraanipilt pilditöötlusekraanist koos diagrammidega pimeduse ja valguse reguleerimiseks — Simulatsioon, mis näitab, kuidas valguse ja pimeduse taseme reguleerimisel saab redigeerimist tuvastada. Pildi krediit: Brendan Murphy / autor

Enamik digifotosid on tihendatud vormingus (nt JPEG), mida on vähendatud, eemaldades suure osa kaameraga jäädvustatud teabest. Standardiseeritud algoritmid tagavad, et eemaldatud teabel on minimaalne nähtav mõju, kuid see jätab jäljed.

Pildi mis tahes piirkonna tihendamine sõltub pildil toimuvast ja kaamera praegustest sätetest; kui võltspilt ühendab mitut allikat, on sageli võimalik seda tuvastada tihendusartefaktide hoolikas analüüs.

Mõnel kohtuekspertiisi metoodikal on pildi vorminguga vähe pistmist, kuid see on sisuliselt visuaalne detektiivitöö. Kas kõik fotol on ühtemoodi valgustatud? Kas varjudel ja peegeldustel on mõtet? Kas kõrvad ja käed näitavad valgust ja varju õigetes kohtades? Mis peegeldub inimeste silmades? Kas kõik ruumi jooned ja nurgad sobiksid kokku, kui modelleeriksime stseeni 3D-vormingus?

Arthur Conan Doyle’i võisid haldjafotod petta, kuid ma arvan, et tema looming Sherlock Holmes sobiks kohtuekspertiisi fotoanalüüsi maailmas päris hästi.

Tehisintellekti uus ajastu

. praegune piltide plahvatus loodud tekstist pildiks tehisintellekti tööriistad on paljuski radikaalsem kui üleminek filmilt digifotograafiale.

Nüüd saame lihtsalt tippides luua mis tahes pildi, mida tahame. Need pildid ei ole fotod, mis on tehtud olemasolevate pikslikogumite ühendamisel. Need on täiesti uued pildid, mille sisu, kvaliteet ja stiil on määratud.

Kuni viimase ajani on nende piltide genereerimiseks kasutatud keerukad närvivõrgud olnud üldsusele piiratud kättesaadavusega. See muutus 23. augustil 2022, kui see avaldati avalikkusele avatud lähtekoodiga stabiilne difusioon. Nüüd saavad kõik, kelle arvutis on mängutasemel Nvidia graafikakaart, luua tehisintellekti pildisisu ilma uurimislabori või äritegevuseta.

See on ajendanud paljusid küsima:kas me suudame enam kunagi uskuda seda, mida veebis näeme?”. See oleneb.

Tekst-pildiks tehisintellekt saab oma nutikuse koolitusest – suure hulga kujutiste/tiitrite paaride analüüsist. Iga süsteemi tugevad ja nõrgad küljed tulenevad osaliselt sellest, millistele piltidele see on koolitatud. Siin on näide: nii näeb Stable Diffusion George Clooneyt triikimas.

Veidi kummaline pilt moonutatud näojoontega mehest, kes hoiab käes valget rätikut — See on George Clooney, kes triikib… või on? Pildi krediit: Brendan Murphy / autor

See pole kaugeltki realistlik. Kõik, mida Stable Diffusion peab edasi tegema, on saadud teave ja kuigi on selge, et ta on George Clooneyt näinud ja suudab selle tähejada näitleja näojoontega siduda, pole see Clooney ekspert.

Siiski oleks see näinud ja seedinud palju rohkem fotosid keskealistest meestest üldiselt, nii et vaatame, mis juhtub, kui küsime sama stsenaariumi järgi üldist keskealist meest.

Veidi kummaline pilt ümarate näojoontega keskealisest mehest, kes vaatab kaamerasse ja hoiab käes särki — Mitte-George-Clooney triikib. Pildi krediit: Brendan Murphy / autor

See on selge edasiminek, kuid siiski mitte päris realistlik. Nagu ikka, on käte ja kõrvade keeruline geomeetria hea koht võltsimise märkide otsimiseks – kuigi selles meediumis vaatleme pigem ruumilist geomeetriat kui jutustusi võimatust valgustusest.

Võib olla muid vihjeid. Kui me ruumi hoolikalt rekonstrueeriksime, kas nurgad oleksid kandilised? Kas riiulitel oleks mõtet? Digifotode uurimisega harjunud kohtuekspert võiks tõenäoliselt sellele helistada.

Me ei suuda enam oma silmi uskuda

Kui laiendame teksti-pildiks süsteemi teadmisi, saab see veelgi paremini toimida. Olemasoleva koolituse täiendamiseks saate lisada enda kirjeldatud fotosid. Seda protsessi tuntakse kui teksti inversioon.

Hiljuti avaldas Google Unistuste kabiin, alternatiivne, keerukam meetod konkreetsete inimeste, objektide või isegi kunstistiilide sisestamiseks teksti-pildiks tehisintellektisüsteemidesse.

See protsess nõuab rasket riistvara, kuid tulemused on vapustavad. Redditis on hakatud jagama mõnda suurepärast tööd. Vaata fotosid allolevas postituses mis näitavad DreamBoothi pandud pilte ja Stable Diffusioni realistlikke võltspilte.

Me ei usu enam oma silmi, kuid võime vähemalt praegu usaldada kohtuekspertide omi. On täiesti võimalik, et tulevasi süsteeme saab teadlikult koolitada ka neid lollitama.

Liigume kiiresti ajastusse, kus täiuslik fotograafia ja isegi video on levinud. Aeg näitab, kui märkimisväärne see on, kuid seni tasub meenutada õppetundi Cottingley Fairy fotodest – mõnikord tahavad inimesed lihtsalt uskuda, isegi ilmseid võltsinguid.

See artikkel avaldatakse uuesti Vestlus Creative Commonsi litsentsi all. Loe algse artikli.

Image Credit: Brendan Murphy / aautor ette

Ajatempel: Oktoober 13, 2022Oktoober 13, 2022

Ajatempel: Veebruar 1, 2023

Tehisintellekti kujutise genereerimine areneb astronoomilistel kiirustel. Kas me saame ikkagi öelda, kas pilt on võlts?

Taasavaldanud Platon

Artefaktide ja terve mõistuse jaht

Tehisintellekti uus ajastu

Me ei suuda enam oma silmi uskuda

Veel alates Singulaarsuse keskus

CRISPR-i geenide redigeerimisel oli läbimurre aasta – ja see on alles algus

Atom Computing ütleb, et selle uuel kvantarvutil on üle 1,000 kubiti

NASA ehitab tuumaraketi, mis viiks meid Marsile vaid 6 nädalaga

Amazoni robotid võtavad laod üle, et tellitud asi veelgi kiiremini kätte saada

Vaadates tagasi kosmilise koidiku poole – astronoomid kinnitavad nõrgima galaktika, mida eales nähtud

Tänu DALL-E-le on võidujooks kunstlike valguravimite valmistamisel käimas

Uus fotooniline arvutikiip kasutab valgust, et vähendada tehisintellekti energiakulusid

Selle nädala vinged tehnikalood kogu veebist (kuni 27. aprillini)

Vaadake, kuidas see kuju muutev robot sulab, et puurist põgeneda ja seejärel reformida

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto