Tehisintellekti kujutise genereerimine areneb astronoomilistel kiirustel. Kas me saame ikkagi öelda, kas pilt on võlts? PlatoBlockchaini andmete luure. Vertikaalne otsing. Ai.

Tehisintellekti kujutise genereerimine areneb astronoomilistel kiirustel. Kas me saame ikkagi öelda, kas pilt on võlts?

Võltsfotograafia pole midagi uut. 1910. aastatel pettusid Briti kirjanik Arthur Conan Doyle kuulsalt kahe kooliealise õe poolt, kes olid teinud fotosid elegantsetest haldjatest, kes nende aias ukerdasid.

Esimene viiest "Cottingley Fairies" fotost, mille tegi Elsie Wright 1917. aastal. Pildi krediit: Wikipedia

Tänapäeval on raske uskuda, et need fotod võisid kedagi petta, kuid alles 1980. aastatel oli eksperdil nimega Geoffrey Crawley närv oma teadmisi filmifotograafiast vahetult rakendada ja ilmselgeid järeldusi teha.

Fotod olid võltsitud, nagu hiljem tunnistas üks õdedest ise.

Veidi kummaline pilt naeratavast mehest, kes hoiab käes vanakooli fotokaamerat
Aastal 1982 järeldas Geoffrey Crawley, et haldjafotod olid võltsitud. Nii ka see. Pildi krediit: Brendan Murphy / autor

Artefaktide ja terve mõistuse jaht

Digitaalne fotograafia on avanud hulgaliselt tehnikaid nii võltsijatele kui ka detektiividele.

Kahtlustatavate piltide kohtuekspertiis hõlmab tänapäeval digitaalfotograafiale omaste omaduste otsimist, näiteks uurimist. fotodele manustatud metaandmed, kasutades kujutiste moonutuste parandamiseks tarkvara, nagu Adobe Photoshop, ja manipuleerimisest märku andvate märkide otsimine, näiteks piirkondade dubleerimine, et varjata algseid funktsioone.

Mõnikord on digitaalsed muudatused tuvastamiseks liiga peened, kuid need hüppavad nähtavale, kui kohandame heledate ja tumedate pikslite jaotumist. Näiteks 2010. aastal avaldas NASA a foto Saturni kuudest Dione ja Titan. See ei olnud mingil juhul võlts, vaid see oli puhastatud, et eemaldada hulkuvad esemed – mis said vandenõuteoreetikute tähelepanu.

Uudishimulikuna panin pildi Photoshopi. Allolev illustratsioon taastab umbkaudu, kuidas see välja nägi.

Ekraanipilt pilditöötlusekraanist koos diagrammidega pimeduse ja valguse reguleerimiseks
Simulatsioon, mis näitab, kuidas valguse ja pimeduse taseme reguleerimisel saab redigeerimist tuvastada. Pildi krediit: Brendan Murphy / autor

Enamik digifotosid on tihendatud vormingus (nt JPEG), mida on vähendatud, eemaldades suure osa kaameraga jäädvustatud teabest. Standardiseeritud algoritmid tagavad, et eemaldatud teabel on minimaalne nähtav mõju, kuid see jätab jäljed.

Pildi mis tahes piirkonna tihendamine sõltub pildil toimuvast ja kaamera praegustest sätetest; kui võltspilt ühendab mitut allikat, on sageli võimalik seda tuvastada tihendusartefaktide hoolikas analüüs.

Mõnel kohtuekspertiisi metoodikal on pildi vorminguga vähe pistmist, kuid see on sisuliselt visuaalne detektiivitöö. Kas kõik fotol on ühtemoodi valgustatud? Kas varjudel ja peegeldustel on mõtet? Kas kõrvad ja käed näitavad valgust ja varju õigetes kohtades? Mis peegeldub inimeste silmades? Kas kõik ruumi jooned ja nurgad sobiksid kokku, kui modelleeriksime stseeni 3D-vormingus?

Arthur Conan Doyle’i võisid haldjafotod petta, kuid ma arvan, et tema looming Sherlock Holmes sobiks kohtuekspertiisi fotoanalüüsi maailmas päris hästi.

Tehisintellekti uus ajastu

. praegune piltide plahvatus loodud tekstist pildiks tehisintellekti tööriistad on paljuski radikaalsem kui üleminek filmilt digifotograafiale.

Nüüd saame lihtsalt tippides luua mis tahes pildi, mida tahame. Need pildid ei ole fotod, mis on tehtud olemasolevate pikslikogumite ühendamisel. Need on täiesti uued pildid, mille sisu, kvaliteet ja stiil on määratud.

Kuni viimase ajani on nende piltide genereerimiseks kasutatud keerukad närvivõrgud olnud üldsusele piiratud kättesaadavusega. See muutus 23. augustil 2022, kui see avaldati avalikkusele avatud lähtekoodiga stabiilne difusioon. Nüüd saavad kõik, kelle arvutis on mängutasemel Nvidia graafikakaart, luua tehisintellekti pildisisu ilma uurimislabori või äritegevuseta.

See on ajendanud paljusid küsima:kas me suudame enam kunagi uskuda seda, mida veebis näeme?”. See oleneb.

Tekst-pildiks tehisintellekt saab oma nutikuse koolitusest – suure hulga kujutiste/tiitrite paaride analüüsist. Iga süsteemi tugevad ja nõrgad küljed tulenevad osaliselt sellest, millistele piltidele see on koolitatud. Siin on näide: nii näeb Stable Diffusion George Clooneyt triikimas.

Veidi kummaline pilt moonutatud näojoontega mehest, kes hoiab käes valget rätikut
See on George Clooney, kes triikib… või on? Pildi krediit: Brendan Murphy / autor

See pole kaugeltki realistlik. Kõik, mida Stable Diffusion peab edasi tegema, on saadud teave ja kuigi on selge, et ta on George Clooneyt näinud ja suudab selle tähejada näitleja näojoontega siduda, pole see Clooney ekspert.

Siiski oleks see näinud ja seedinud palju rohkem fotosid keskealistest meestest üldiselt, nii et vaatame, mis juhtub, kui küsime sama stsenaariumi järgi üldist keskealist meest.

Veidi kummaline pilt ümarate näojoontega keskealisest mehest, kes vaatab kaamerasse ja hoiab käes särki
Mitte-George-Clooney triikib. Pildi krediit: Brendan Murphy / autor

See on selge edasiminek, kuid siiski mitte päris realistlik. Nagu ikka, on käte ja kõrvade keeruline geomeetria hea koht võltsimise märkide otsimiseks – kuigi selles meediumis vaatleme pigem ruumilist geomeetriat kui jutustusi võimatust valgustusest.

Võib olla muid vihjeid. Kui me ruumi hoolikalt rekonstrueeriksime, kas nurgad oleksid kandilised? Kas riiulitel oleks mõtet? Digifotode uurimisega harjunud kohtuekspert võiks tõenäoliselt sellele helistada.

Me ei suuda enam oma silmi uskuda

Kui laiendame teksti-pildiks süsteemi teadmisi, saab see veelgi paremini toimida. Olemasoleva koolituse täiendamiseks saate lisada enda kirjeldatud fotosid. Seda protsessi tuntakse kui teksti inversioon.

Hiljuti avaldas Google Unistuste kabiin, alternatiivne, keerukam meetod konkreetsete inimeste, objektide või isegi kunstistiilide sisestamiseks teksti-pildiks tehisintellektisüsteemidesse.

See protsess nõuab rasket riistvara, kuid tulemused on vapustavad. Redditis on hakatud jagama mõnda suurepärast tööd. Vaata fotosid allolevas postituses mis näitavad DreamBoothi ​​pandud pilte ja Stable Diffusioni realistlikke võltspilte.



Me ei usu enam oma silmi, kuid võime vähemalt praegu usaldada kohtuekspertide omi. On täiesti võimalik, et tulevasi süsteeme saab teadlikult koolitada ka neid lollitama.

Liigume kiiresti ajastusse, kus täiuslik fotograafia ja isegi video on levinud. Aeg näitab, kui märkimisväärne see on, kuid seni tasub meenutada õppetundi Cottingley Fairy fotodest – mõnikord tahavad inimesed lihtsalt uskuda, isegi ilmseid võltsinguid.Vestlus

See artikkel avaldatakse uuesti Vestlus Creative Commonsi litsentsi all. Loe algse artikli.

Image Credit: Brendan Murphy / aautor ette

Ajatempel:

Veel alates Singulaarsuse keskus