Генерация изображений с помощью искусственного интеллекта развивается с астрономической скоростью. Можем ли мы еще определить, является ли фотография подделкой? PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Генерация изображений с помощью ИИ развивается с астрономической скоростью. Можем ли мы все еще определить, является ли изображение подделкой?

В фейковых фотографиях нет ничего нового. В 1910-х годах британский писатель Артур Конан Дойл был обманут двумя сестрами школьного возраста, которые сделали фотографии элегантных фей, резвящихся в их саду.

Первая из пяти фотографий «Феи Коттингли», сделанная Элси Райт в 1917 году. Изображение предоставлено: Википедия.

Сегодня трудно поверить, что эти фотографии могли кого-то одурачить, но только в 1980-х годах у эксперта по имени Джеффри Кроули хватило наглости напрямую применить свои знания в области пленочной фотографии и сделать выводы из очевидного.

Фотографии были фальшивыми, как позже призналась сама одна из сестер.

Немного странное изображение улыбающегося мужчины, держащего фотокамеру старой школы.
В 1982 году Джеффри Кроули пришел к выводу, что фотографии фей были подделкой. Так и этот. Изображение предоставлено: Брендан Мерфи / автор предоставлен

Охота за артефактами и здравым смыслом

Цифровая фотография открыла множество техник как для мошенников, так и для детективов.

Судебно-медицинская экспертиза подозрительных изображений в настоящее время включает в себя поиск качеств, присущих цифровой фотографии, таких как изучение метаданные, встроенные в фотографии, использование программного обеспечения, такого как Adobe Photoshop, для исправления искажений изображений и поиск явных признаков манипуляции, например, области дублируются, чтобы скрыть исходные функции.

Иногда цифровые правки слишком незаметны, чтобы их можно было обнаружить, но они бросаются в глаза, когда мы настраиваем способ распределения светлых и темных пикселей. Например, в 2010 году НАСА выпустило фото спутников Сатурна Дионы и Титана. Это никоим образом не было подделкой, а было очищено от случайных артефактов, которые внимание конспирологов.

Любопытно, я поместил изображение в Photoshop. Иллюстрация ниже примерно воссоздает, как это выглядело.

Скриншот экрана редактирования изображения с диаграммами для регулировки темного и светлого
Моделирование, показывающее, как можно обнаружить редактирование при настройке уровней света и темноты. Изображение предоставлено: Брендан Мерфи / автор предоставлен

Большинство цифровых фотографий имеют сжатые форматы, такие как JPEG, уменьшенные за счет удаления большей части информации, захваченной камерой. Стандартизированные алгоритмы гарантируют, что удаленная информация оказывает минимальное видимое влияние, но оставляет следы.

Сжатие любой области изображения будет зависеть от того, что происходит на изображении и текущих настройках камеры; когда поддельное изображение сочетает в себе несколько источников, это часто можно обнаружить по тщательный анализ артефактов сжатия.

Некоторые криминалистические методологии имеют мало общего с форматом изображения, но по существу визуально-детективная работа. Все ли на фотографии освещены одинаково? Имеют ли смысл тени и отражения? Уши и руки показывают свет и тень в правильных местах? Что отражается в глазах людей? Сложатся ли все линии и углы комнаты, если мы смоделируем сцену в 3D?

Артура Конан Дойля, возможно, и обманули фотографии фей, но я думаю, что его творение Шерлок Холмс было бы как дома в мире криминалистического анализа фотографий.

Новая эра искусственного интеллекта

Ассоциация текущий взрыв изображений созданный методом преобразования текста в изображение искусственный интеллект инструменты во многих отношениях более радикальны, чем переход от пленочной к цифровой фотографии.

Теперь мы можем создать любое изображение, которое захотим, просто набрав. Эти изображения не являются откровенными фотографиями, сделанными путем объединения ранее существовавших комков пикселей. Это совершенно новые изображения с заданным содержанием, качеством и стилем.

До недавнего времени сложные нейронные сети, используемые для создания этих изображений, были малодоступны публике. Это изменилось 23 августа 2022 г., когда была опубликована версия стабильная диффузия с открытым исходным кодом. Теперь любой, у кого на компьютере установлена ​​графическая карта Nvidia игрового уровня, может создавать изображения с искусственным интеллектом без участия какой-либо исследовательской лаборатории или бизнеса.

Это побудило многих задаться вопросом: «Можем ли мы когда-нибудь снова поверить в то, что видим в Интернете?». Это зависит от.

Искусственный интеллект, преобразующий текст в изображение, становится умнее благодаря обучению — анализу большого количества пар изображение/подпись. Сильные и слабые стороны каждой системы частично вытекают из того, на каких изображениях она обучалась. Вот пример: так Stable Diffusion видит Джорджа Клуни, занимающегося глажкой одежды.

Немного странное изображение мужчины с искаженными чертами лица, держащего белое полотенце.
Это Джордж Клуни гладит… или нет? Изображение предоставлено: Брендан Мерфи / предоставлен автором

Это далеко от реальности. Все, что нужно Stable Diffusion, — это информация, которую он узнал, и, хотя ясно, что он видел Джорджа Клуни и может связать эту строку букв с чертами лица актера, он не является экспертом по Клуни.

Тем не менее, он увидел бы и переварил гораздо больше фотографий мужчин среднего возраста в целом, поэтому давайте посмотрим, что происходит, когда мы запрашиваем типичного мужчину средних лет в том же сценарии.

Немного странное изображение мужчины средних лет с округлыми чертами лица, смотрящего в камеру и держащего рубашку.
Не-Джордж-Клуни гладит. Изображение предоставлено: Брендан Мерфи / автор предоставлен

Это явное улучшение, но все же не совсем реалистичное. Как всегда, хитрая геометрия рук и ушей — хорошие места для поиска признаков подделки, хотя в этом случае мы смотрим на пространственную геометрию, а не на теллсы невозможного освещения.

Могут быть и другие улики. Если бы мы тщательно реконструировали комнату, были бы углы прямыми? Есть ли смысл в полках? Судебно-медицинский эксперт, привыкший к изучению цифровых фотографий, вероятно, мог бы это сделать.

Мы больше не можем верить своим глазам

Если мы расширим знания системы преобразования текста в изображение, она может работать еще лучше. Вы можете добавить свои описанные фотографии, чтобы дополнить существующую тренировку. Этот процесс известен как текстовая инверсия.

Недавно Google выпустил Будка мечты, альтернативный, более сложный метод внедрения определенных людей, объектов или даже художественных стилей в системы искусственного интеллекта, преобразующие текст в изображение.

Этот процесс требует сверхмощного оборудования, но результаты ошеломляют. На Reddit начали делиться отличной работой. Посмотрите на фотографии в посте ниже которые показывают изображения, загруженные в DreamBooth, и реалистичные поддельные изображения из Stable Diffusion.



Мы больше не можем верить своим глазам, но мы все еще можем доверять экспертам-криминалистам, по крайней мере, на данный момент. Вполне возможно, что будущие системы могут быть специально обучены обманывать и их.

Мы стремительно движемся в эпоху, когда совершенная фотография и даже видео станут обычным явлением. Время покажет, насколько это будет значимо, а пока стоит вспомнить урок фотографий Феи Коттингли — иногда людям просто хочется верить, даже в явные фейки.Беседа

Эта статья переиздана из Беседа под лицензией Creative Commons. Прочтите оригинал статьи.

Изображение Фото: Брендан Мерфи / аУтор предоставил

Отметка времени:

Больше от Singularity Hub