La generazione di immagini tramite intelligenza artificiale sta avanzando a velocità astronomiche. Possiamo ancora dire se un'immagine è falsa? Intelligenza dei dati PlatoBlockchain. Ricerca verticale. Ai.

La generazione di immagini AI sta avanzando a velocità astronomiche. Possiamo ancora dire se un'immagine è falsa?

La fotografia falsa non è una novità. Negli anni '1910, l'autore britannico Arthur Conan Doyle fu notoriamente ingannato da due sorelle in età scolare che avevano prodotto fotografie di eleganti fate che saltellavano nel loro giardino.

La prima delle cinque fotografie "Cottingley Fairies", scattata da Elsie Wright nel 1917. Credito immagine: Wikipedia

Oggi è difficile credere che queste foto possano aver ingannato qualcuno, ma è stato solo negli anni '1980 che un esperto di nome Geoffrey Crawley ha avuto il coraggio di applicare direttamente la sua conoscenza della fotografia cinematografica e dedurre l'ovvio.

Le fotografie erano false, come ha poi ammesso una delle stesse sorelle.

Un'immagine leggermente inquietante di un uomo sorridente che tiene in mano una macchina fotografica della vecchia scuola
Nel 1982 Geoffrey Crawley dedusse che le fotografie delle fate erano false. Così è questo. Credito immagine: Brendan Murphy / autore fornito

A caccia di manufatti e buon senso

La fotografia digitale ha aperto una vasta gamma di tecniche sia per i falsari che per i detective.

L'esame forense di immagini sospette al giorno d'oggi implica la ricerca di qualità inerenti alla fotografia digitale, come l'esame metadati incorporati nelle foto, utilizzando software come Adobe Photoshop per correggere le distorsioni nelle immagini e alla ricerca di segni rivelatori di manipolazione, come le regioni che vengono duplicate per oscurare le caratteristiche originali.

A volte le modifiche digitali sono troppo sottili per essere rilevate, ma saltano alla vista quando regoliamo il modo in cui vengono distribuiti i pixel chiari e scuri. Ad esempio, nel 2010 la NASA ha rilasciato a foto delle lune di Saturno Dione e Titano. Non era in alcun modo falso, ma era stato ripulito per rimuovere gli artefatti vaganti, il che è arrivato l'attenzione dei complottisti.

Curioso, ho messo l'immagine in Photoshop. L'illustrazione seguente ricrea all'incirca come appariva.

Screenshot di una schermata di modifica delle immagini con grafici per la regolazione di luce e oscurità
Una simulazione che mostra come è possibile rilevare la modifica quando vengono regolati i livelli di luce e oscurità. Credito immagine: Brendan Murphy / autore fornito

La maggior parte delle fotografie digitali sono in formati compressi come JPEG, ridotti rimuovendo gran parte delle informazioni acquisite dalla fotocamera. Gli algoritmi standardizzati assicurano che le informazioni rimosse abbiano un impatto visibile minimo, ma lasciano tracce.

La compressione di qualsiasi regione di un'immagine dipenderà da cosa sta succedendo nell'immagine e dalle impostazioni correnti della fotocamera; quando un'immagine falsa combina più fonti, è spesso possibile rilevarla un'attenta analisi degli artefatti di compressione.

Alcune metodologie forensi hanno poco a che fare con il formato di un'immagine, ma essenzialmente lo sono lavoro di investigazione visiva. Tutti nella fotografia sono illuminati allo stesso modo? Le ombre e i riflessi hanno senso? Le orecchie e le mani mostrano luci e ombre nei posti giusti? Cosa si riflette negli occhi delle persone? Tutte le linee e gli angoli della stanza si sommano se modellassimo la scena in 3D?

Arthur Conan Doyle potrebbe essere stato ingannato dalle foto delle fate, ma penso che la sua creazione Sherlock Holmes sarebbe proprio a suo agio nel mondo dell'analisi fotografica forense.

Una nuova era dell'intelligenza artificiale

I attuale esplosione di immagini creato da testo a immagine intelligenza artificiale strumenti è per molti versi più radicale del passaggio dalla pellicola alla fotografia digitale.

Ora possiamo evocare qualsiasi immagine desideriamo, semplicemente digitando. Queste immagini non sono franken-foto realizzate unendo insieme gruppi di pixel preesistenti. Sono immagini completamente nuove con il contenuto, la qualità e lo stile specificati.

Fino a poco tempo, le complesse reti neurali utilizzate per generare queste immagini avevano una disponibilità limitata al pubblico. La situazione è cambiata il 23 agosto 2022, con il rilascio al pubblico del Diffusione stabile open source. Ora chiunque disponga di una scheda grafica Nvidia a livello di gioco nel proprio computer può creare contenuti di immagini AI senza alcun laboratorio di ricerca o controllo aziendale che mantenga le proprie attività.

Questo ha spinto molti a chiedersi: “possiamo mai credere di nuovo a ciò che vediamo online?”. Dipende.

L'intelligenza artificiale da testo a immagine trae la sua intelligenza dalla formazione: l'analisi di un gran numero di coppie immagine/didascalia. I punti di forza e di debolezza di ciascun sistema derivano in parte dalle immagini su cui è stato addestrato. Ecco un esempio: è così che Stable Diffusion vede George Clooney fare la sua stiratura.

Un'immagine un po' inquietante di un uomo dai lineamenti distorti che tiene un asciugamano bianco
Questo è George Clooney che fa la sua stiratura... o no? Credito immagine: Brendan Murphy / autore fornito

Questo è tutt'altro che realistico. Tutto ciò che Stable Diffusion deve continuare sono le informazioni che ha appreso e, sebbene sia chiaro che ha visto George Clooney e può collegare quella stringa di lettere ai lineamenti dell'attore, non è un esperto di Clooney.

Tuttavia, avrebbe visto e digerito molte più foto di uomini di mezza età in generale, quindi vediamo cosa succede quando chiediamo un generico uomo di mezza età nello stesso scenario.

Un'immagine leggermente inquietante di un uomo di mezza età con lineamenti arrotondati che guarda la telecamera e tiene una maglietta
Non-George-Clooney che fa la sua stiratura. Credito immagine: Brendan Murphy / autore fornito

Si tratta di un netto miglioramento, ma non ancora del tutto realistico. Come è sempre stato il caso, la delicata geometria di mani e orecchie è un buon posto per cercare segni di falsi, anche se in questo mezzo stiamo guardando la geometria spaziale piuttosto che i racconti di un'illuminazione impossibile.

Potrebbero esserci altri indizi. Se ricostruissimo accuratamente la stanza, gli angoli sarebbero quadrati? Avrebbero senso gli scaffali? Un esperto forense abituato a esaminare le fotografie digitali potrebbe probabilmente fare una chiamata in merito.

Non possiamo più credere ai nostri occhi

Se estendiamo la conoscenza di un sistema da testo a immagine, può fare anche meglio. Puoi aggiungere le tue fotografie descritte per integrare la formazione esistente. Questo processo è noto come inversione testuale.

Di recente, Google ha rilasciato Cabina dei sogni, un metodo alternativo e più sofisticato per iniettare persone, oggetti o persino stili artistici specifici nei sistemi di intelligenza artificiale da testo a immagine.

Questo processo richiede hardware per impieghi gravosi, ma i risultati sono sbalorditivi. Alcuni grandi lavori hanno iniziato a essere condivisi su Reddit. Guarda le foto nel post qui sotto che mostrano immagini inserite in DreamBooth e immagini false realistiche da Stable Diffusion.



Non possiamo più credere ai nostri occhi, ma potremmo ancora essere in grado di fidarci di quelli degli esperti forensi, almeno per ora. È del tutto possibile che i sistemi futuri possano essere deliberatamente addestrati per ingannare anche loro.

Stiamo rapidamente entrando in un'era in cui foto e persino video perfetti saranno comuni. Il tempo dirà quanto sarà significativo, ma nel frattempo vale la pena ricordare la lezione delle foto di Cottingley Fairy: a volte le persone vogliono solo credere, anche in falsi evidenti.The Conversation

Questo articolo è ripubblicato da The Conversation sotto una licenza Creative Commons. Leggi il articolo originale.

Immagine di credito: Brendan Murphy/author fornito

Timestamp:

Di più da Hub di singolarità