AI-kuvien luominen etenee tähtitieteellisellä nopeudella. Voimmeko silti sanoa, onko kuva väärennös? PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

AI-kuvien luominen etenee tähtitieteellisellä nopeudella. Voimmeko silti sanoa, onko kuva väärennös?

Väärennetty valokuvaus ei ole mitään uutta. 1910-luvulla brittiläinen kirjailija Arthur Conan Doyle joutui tunnetusti kahden koulu-ikäisen sisaren pettämiseen, jotka olivat tuottaneet valokuvia puutarhassaan kiemurtelevista tyylikkäistä keijuista.

Ensimmäinen viidestä "Cottingley Fairies" -valokuvasta, jonka otti Elsie Wright vuonna 1917. Kuvan luotto: Wikipedia

Nykyään on vaikea uskoa, että nämä valokuvat olisivat voineet huijata ketään, mutta vasta 1980-luvulla Geoffrey Crawley-niminen asiantuntija uskalsi soveltaa suoraan tietojaan filmikuvauksesta ja päätellä itsestään selvät asiat.

Valokuvat olivat väärennettyjä, kuten yksi sisarista itse myönsi myöhemmin.

Hieman outo kuva hymyilevästä miehestä pitelemässä oldschool-valokuvauskameraa
Vuonna 1982 Geoffrey Crawley päätteli, että keijukuvat olivat väärennettyjä. Niin myös tämä. Kuvan luotto: Brendan Murphy / kirjoittaja tarjotaan

Metsästää esineitä ja maalaisjärkeä

Digitaalinen valokuvaus on avannut runsaasti tekniikoita väärentäjille ja etsiville.

Epäiltyjen kuvien oikeuslääketieteelliseen tutkimukseen kuuluu nykyään digitaalisen valokuvauksen ominaisuuksien, kuten tutkimisen, etsimistä. kuviin upotetut metatiedot, käyttämällä ohjelmistoja, kuten Adobe Photoshopia, korjaamaan kuvien vääristymiä ja etsii manipuloinnin merkkejä, kuten alueiden kopioiminen alkuperäisten ominaisuuksien peittämiseksi.

Joskus digitaaliset muokkaukset ovat liian hienovaraisia ​​havaittavaksi, mutta ne tulevat näkyviin, kun säädämme tapaa, jolla valot ja tummat pikselit jakautuvat. Esimerkiksi vuonna 2010 NASA julkaisi a kuva Saturnuksen kuista Dione ja Titan. Se ei ollut millään muotoa väärennös, vaan se oli puhdistettu eksyksissä olevien esineiden poistamiseksi. salaliittoteoreetikkojen huomion.

Utelias, laitoin kuvan Photoshopiin. Alla oleva kuva toistaa suunnilleen miltä tämä näytti.

Kuvakaappaus kuvanmuokkausnäytöstä, jossa on kaavioita tummuuden ja valon säätämiseksi
Simulaatio, joka näyttää kuinka muokkaus voidaan havaita, kun valon ja pimeyden tasoja säädetään. Kuvan luotto: Brendan Murphy / kirjoittaja tarjotaan

Useimmat digitaaliset valokuvat ovat pakatuissa muodoissa, kuten JPEG, joita on pienennetty poistamalla suuri osa kameran tallentamasta tiedosta. Standardoidut algoritmit varmistavat, että poistetuilla tiedoilla on mahdollisimman vähän näkyvää vaikutusta, mutta se jättää jälkiä.

Minkä tahansa kuvan alueen pakkaus riippuu siitä, mitä kuvassa tapahtuu ja kameran nykyisiä asetuksia. kun väärennetty kuva yhdistää useita lähteitä, se on usein mahdollista havaita pakkausartefaktien huolellinen analyysi.

Joillakin oikeuslääketieteellisillä menetelmillä ei ole juurikaan tekemistä kuvan muodon kanssa, mutta se on oleellisesti visuaalinen etsivätyö. Onko kaikki valokuvassa valaistu samalla tavalla? Onko varjoissa ja heijastuksissa järkeä? Näyttävätkö korvat ja kädet valoa ja varjoa oikeissa paikoissa? Mitä heijastuu ihmisten silmissä? Summautuisivatko kaikki huoneen linjat ja kulmat yhteen, jos mallintaisimme kohtauksen 3D:ssä?

Arthur Conan Doyle saattoi hämätä keijukuvista, mutta uskon, että hänen luomuksensa Sherlock Holmes olisi aivan kotonaan rikosteknisen valokuva-analyysin maailmassa.

Tekoälyn uusi aikakausi

- nykyinen kuvien räjähdys luotu tekstistä kuvaksi tekoäly työkalut on monella tapaa radikaalimpi kuin siirtyminen elokuvasta digitaaliseen valokuvaukseen.

Voimme nyt loihtia minkä tahansa kuvan vain kirjoittamalla. Nämä kuvat eivät ole franken-valokuvia, jotka on tehty mukulaamalla yhteen olemassa olevia pikseliryppyjä. Ne ovat täysin uusia kuvia, joiden sisältö, laatu ja tyyli on määritelty.

Viime aikoihin asti näiden kuvien luomiseen käytetyt monimutkaiset neuroverkot ovat olleet rajoitetusti saatavilla yleisölle. Tämä muuttui 23. elokuuta 2022, kun julkaisu julkaistiin yleisölle avoimen lähdekoodin Stable Diffusion. Nyt kuka tahansa, jolla on pelitason Nvidia-näytönohjain tietokoneessaan, voi luoda tekoälykuvasisältöä ilman tutkimuslaboratoriota tai yritystoimintaa.

Tämä on saanut monet kysymään:voimmeko enää koskaan uskoa sitä, mitä näemme verkossa?”. Se riippuu.

Tekstistä kuvaksi tekoäly saa älykkyytensä harjoittelusta – useiden kuva/tekstitys-parien analysoinnista. Kunkin järjestelmän vahvuudet ja heikkoudet johtuvat osittain siitä, minkälaisten mielikuvien perusteella se on koulutettu. Tässä on esimerkki: näin Stable Diffusion näkee George Clooneyn silittävän.

Hieman outo kuva miehestä, jolla on vääristyneet piirteet pitelemässä valkoista pyyhettä
Tässä on George Clooney silittämässä… vai onko? Kuvan luotto: Brendan Murphy / kirjoittaja tarjotaan

Tämä on kaukana realistisuudesta. Kaikki Stable Diffusionin on jatkettava sen oppimia tietoja, ja vaikka on selvää, että se on nähnyt George Clooneyn ja voi yhdistää tuon kirjainsarjan näyttelijän piirteisiin, se ei ole Clooney-asiantuntija.

Se olisi kuitenkin nähnyt ja sulattanut paljon enemmän kuvia keski-ikäisistä miehistä yleensä, joten katsotaan mitä tapahtuu, kun pyydämme samaan skenaarioon yleistä keski-ikäistä miestä.

Hieman outo kuva keski-ikäisestä miehestä, jolla on pyöreät piirteet katsomassa kameraa ja pitelemässä paitaa
Ei-George-Clooney silittää. Kuvan luotto: Brendan Murphy / kirjoittaja tarjotaan

Tämä on selvä parannus, mutta ei silti aivan realistinen. Kuten aina, käsien ja korvien hankala geometria on hyvä paikka etsiä väärennöksiä – vaikka tässä välineessä katsotaankin tilageometriaa mahdottomasta valaistuksesta kertomisen sijaan.

Voi olla muitakin vihjeitä. Jos rekonstruoisimme huoneen huolellisesti, olisivatko kulmat neliömäisiä? Olisiko hyllyissä järkeä? Oikeuslääketieteellinen asiantuntija, joka on tottunut tutkimaan digitaalisia valokuvia, voisi luultavasti soittaa siihen.

Emme voi enää uskoa silmiämme

Jos laajennamme tekstistä kuvaksi -järjestelmän tietämystä, se voi toimia vielä paremmin. Voit lisätä omia kuvattuja valokuvia täydentämään olemassa olevaa koulutusta. Tämä prosessi tunnetaan nimellä tekstin käännös.

Äskettäin Google on julkaissut Dream Booth, vaihtoehtoinen, kehittyneempi menetelmä tiettyjen ihmisten, esineiden tai jopa taidetyylien lisäämiseksi tekstistä kuvaksi tekoälyjärjestelmiin.

Tämä prosessi vaatii raskaan laitteiston, mutta tulokset ovat hämmästyttäviä. Hienoja töitä on alettu jakaa Redditissä. Katso valokuvia alla olevassa viestissä jotka näyttävät DreamBoothiin lisättyjä kuvia ja Stable Diffusionin realistisia väärennettyjä kuvia.



Emme voi enää uskoa silmiämme, mutta voimme silti luottaa oikeuslääketieteen asiantuntijoihin, ainakin toistaiseksi. On täysin mahdollista, että myös tulevia järjestelmiä voidaan tietoisesti kouluttaa huijaamaan niitä.

Olemme siirtymässä nopeasti aikakauteen, jossa täydellinen valokuvaus ja jopa video ovat yleisiä. Aika näyttää kuinka merkittävää tämä on, mutta sillä välin kannattaa muistaa Cottingley Fairy -valokuvien opetus – joskus ihmiset haluavat vain uskoa, jopa ilmeisiin väärennöksiin.Conversation

Tämä artikkeli julkaistaan ​​uudelleen Conversation Creative Commons -lisenssin alla. Lue alkuperäinen artikkeli.

Kuva pistetilanne: Brendan Murphy / atoimitettu

Aikaleima:

Lisää aiheesta Singulaarisuus Hub