Generowanie obrazów AI postępuje z astronomiczną szybkością. Czy nadal możemy stwierdzić, czy zdjęcie jest fałszywe? Inteligencja danych PlatoBlockchain. Wyszukiwanie pionowe. AI.

Generowanie obrazów AI postępuje z astronomiczną prędkością. Czy nadal możemy stwierdzić, czy zdjęcie jest fałszywe?

Fałszywa fotografia nie jest niczym nowym. W latach 1910. brytyjski pisarz Arthur Conan Doyle został oszukany przez dwie siostry w wieku szkolnym, które wykonały zdjęcia eleganckich wróżek bawiących się w swoim ogrodzie.

Pierwsza z pięciu fotografii „Cottingley Fairies”, zrobiona przez Elsie Wright w 1917 roku. Źródło zdjęcia: Wikipedia

Dziś trudno uwierzyć, że te zdjęcia mogły kogoś oszukać, ale dopiero w latach 1980. ekspert Geoffrey Crawley miał czelność bezpośrednio zastosować swoją wiedzę o fotografii filmowej i wydedukować oczywiste.

Zdjęcia były fałszywe, co później przyznała jedna z sióstr.

Nieco niesamowity obraz uśmiechniętego mężczyzny trzymającego oldschoolowy aparat fotograficzny
W 1982 roku Geoffrey Crawley wywnioskował, że zdjęcia wróżek były fałszywe. Podobnie jak ten. Źródło zdjęcia: Brendan Murphy / autor pod warunkiem

Polowanie na artefakty i zdrowy rozsądek

Fotografia cyfrowa otworzyła bogactwo technik zarówno dla oszustów, jak i detektywów.

Badanie kryminalistyczne podejrzanych obrazów polega obecnie na polowaniu na cechy właściwe fotografii cyfrowej, takie jak badanie metadane osadzone na zdjęciach, używając oprogramowania takiego jak Adobe Photoshop do korygowania zniekształceń obrazów oraz poszukiwanie charakterystycznych oznak manipulacji, na przykład regiony duplikowane w celu przysłaniania oryginalnych elementów.

Czasami edycje cyfrowe są zbyt subtelne, by je wykryć, ale wyskakują, gdy dostosujemy sposób rozmieszczenia jasnych i ciemnych pikseli. Na przykład w 2010 r. NASA wydała zdjęcie księżyców Saturna Dione i Titan. W żaden sposób nie był fałszywy, ale został oczyszczony, aby usunąć zabłąkane artefakty, które… uwagę teoretyków spiskowych.

Zaciekawiony wrzuciłem obraz do Photoshopa. Poniższa ilustracja przedstawia z grubsza, jak to wyglądało.

Zrzut ekranu ekranu edycji obrazu z wykresami do regulacji ciemności i światła
Symulacja pokazująca, jak można wykryć edycję po dostosowaniu poziomów jasności i ciemności. Źródło zdjęcia: Brendan Murphy / autor pod warunkiem

Większość fotografii cyfrowych jest w skompresowanych formatach, takich jak JPEG, odchudzonych przez usunięcie większości informacji przechwyconych przez aparat. Znormalizowane algorytmy zapewniają, że usunięte informacje mają minimalny widoczny wpływ, ale pozostawiają ślady.

Kompresja dowolnego obszaru obrazu będzie zależeć od tego, co się dzieje na obrazie i bieżących ustawień aparatu; gdy fałszywy obraz łączy wiele źródeł, często można to wykryć przez: dokładna analiza artefaktów kompresji.

Niektóre metody kryminalistyczne mają niewiele wspólnego z formatem obrazu, ale zasadniczo: praca detektywa wizualnego. Czy wszyscy na zdjęciu są oświetleni w ten sam sposób? Czy cienie i odbicia mają sens? Czy uszy i dłonie pokazują światło i cień we właściwych miejscach? Co odbija się w oczach ludzi? Czy wszystkie linie i kąty pomieszczenia sumują się, gdybyśmy modelowali scenę w 3D?

Arthur Conan Doyle mógł dać się zwieść bajkowym zdjęciom, ale myślę, że jego dzieło Sherlock Holmes doskonale sprawdzi się w świecie kryminalistycznej analizy zdjęć.

Nowa era sztucznej inteligencji

Połączenia obecna eksplozja obrazów stworzony przez tekst na obraz sztuczna inteligencja narzędzia są pod wieloma względami bardziej radykalne niż przejście od fotografii filmowej do cyfrowej.

Możemy teraz wyczarować dowolny obraz, po prostu pisząc. Te obrazy nie są zdjęciami franken powstałymi przez sklejenie istniejących wcześniej kępek pikseli. Są to całkowicie nowe obrazy o określonej treści, jakości i stylu.

Do niedawna złożone sieci neuronowe wykorzystywane do generowania tych obrazów miały ograniczoną dostępność dla społeczeństwa. Zmieniło się to 23 sierpnia 2022 r., wraz z upublicznieniem stabilna dyfuzja o otwartym kodzie źródłowym. Teraz każdy, kto ma w swoim komputerze kartę graficzną Nvidia do gier, może tworzyć treści obrazów AI bez konieczności prowadzenia przez laboratorium badawcze lub bramkę biznesową ich działań.

To skłoniło wielu do pytania: „czy możemy kiedykolwiek ponownie uwierzyć w to, co widzimy w Internecie?”. To zależy.

Sztuczna sztuczna inteligencja tekstu na obraz czerpie swój spryt dzięki szkoleniu — analizie dużej liczby par obraz/podpis. Mocne i słabe strony każdego systemu wynikają po części z tego, na jakich obrazach został on przeszkolony. Oto przykład: tak Stable Diffusion widzi George'a Clooneya podczas prasowania.

Nieco niesamowity obraz mężczyzny o zniekształconych rysach, trzymającego biały ręcznik
To George Clooney prasujący… a może tak? Źródło zdjęcia: Brendan Murphy / autor pod warunkiem

To jest dalekie od realistycznego. Wszystko, co musi trwać stabilna dyfuzja, to informacje, których się nauczył, i chociaż jest jasne, że widział George'a Clooneya i może powiązać ten ciąg liter z cechami aktora, nie jest ekspertem od Clooneya.

Jednak ogólnie zobaczyłby i przetrawił znacznie więcej zdjęć mężczyzn w średnim wieku, więc zobaczmy, co się stanie, gdy poprosimy o ogólnego mężczyznę w średnim wieku w tym samym scenariuszu.

Nieco dziwny obraz mężczyzny w średnim wieku o zaokrąglonych rysach, patrzącego w obiektyw i trzymającego koszulę
Nie-George-Clooney prasujący. Źródło zdjęcia: Brendan Murphy / autor pod warunkiem

To wyraźna poprawa, ale wciąż nie do końca realistyczna. Jak zawsze, trudna geometria dłoni i uszu to dobre miejsce do szukania oznak fałszerstwa – choć w tym medium patrzymy raczej na geometrię przestrzenną niż na podpowiedzi o niemożliwym oświetleniu.

Mogą być inne wskazówki. Gdybyśmy dokładnie zrekonstruowali pokój, czy rogi byłyby kwadratowe? Czy półki miałyby sens? Ekspert medycyny sądowej przyzwyczajony do badania zdjęć cyfrowych prawdopodobnie mógłby się do tego zgłosić.

Nie możemy dłużej wierzyć własnym oczom

Jeśli poszerzymy wiedzę o systemie tekstu na obraz, może on działać jeszcze lepiej. Możesz dodać własne opisane zdjęcia jako uzupełnienie istniejącego szkolenia. Ten proces jest znany jako odwrócenie tekstu.

Niedawno firma Google wydała Wymarzona budka, alternatywną, bardziej wyrafinowaną metodę wstrzykiwania określonych osób, obiektów, a nawet stylów artystycznych do systemów sztucznej inteligencji tekstu na obraz.

Ten proces wymaga wytrzymałego sprzętu, ale wyniki są oszałamiające. Na Reddicie zaczęto udostępniać świetne prace. Spójrz na zdjęcia w poście poniżej które pokazują obrazy umieszczone w DreamBooth i realistyczne fałszywe obrazy ze Stable Diffusion.



Nie możemy już wierzyć własnym oczom, ale przynajmniej na razie możemy nadal ufać ekspertom medycyny sądowej. Jest całkiem możliwe, że przyszłe systemy mogą być celowo wytrenowane, aby je oszukać.

Szybko wkraczamy w erę, w której doskonałe zdjęcia, a nawet wideo będą powszechne. Czas pokaże, jakie to będzie znaczące, ale tymczasem warto przypomnieć sobie lekcję ze zdjęć Cottingley Fairy – czasami ludzie chcą po prostu wierzyć, nawet w oczywiste podróbki.Konwersacje

Artykuł został opublikowany ponownie Konwersacje na licencji Creative Commons. Przeczytać oryginalny artykuł.

Kredytowych Image: Brendan Murphy / Author pod warunkiem

Znak czasu:

Więcej z Centrum osobliwości