AI 이미지 생성은 천문학적인 속도로 발전하고 있습니다. 사진이 가짜인지 여전히 알 수 있나요? PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.

AI 이미지 생성은 천문학적인 속도로 발전하고 있습니다. 사진이 가짜인지 여전히 알 수 있습니까?

가짜 사진은 새로운 것이 아닙니다. 1910년대에 영국 작가 Arthur Conan Doyle는 정원에서 배회하는 우아한 요정의 사진을 제작한 두 명의 학령기 자매에게 속은 것으로 유명합니다.

1917년 Elsie Wright가 찍은 XNUMX개의 'Cottingley Fairies' 사진 중 첫 번째 사진. 이미지 제공: Wikipedia

오늘날 이 사진들이 누군가를 속일 수 있다는 것이 믿기지 않지만, 1980년대에 Geoffrey Crawley라는 전문가가 자신의 필름 사진 지식을 직접 적용하여 명백한 사실을 추론할 수 있는 용기를 갖게 되었습니다.

나중에 자매 중 한 명이 인정한 것처럼 사진은 가짜였습니다.

구식 사진 카메라를 들고 웃는 남자의 약간 이상한 이미지
1982년 Geoffrey Crawley는 요정 사진이 가짜라고 추론했습니다. 이것도 마찬가지입니다. 이미지 크레디트: Brendan Murphy / 저자 제공

유물과 상식에 대한 사냥

디지털 사진은 사기꾼과 형사 모두에게 풍부한 기술을 제공했습니다.

오늘날 의심되는 이미지에 대한 법의학적 조사는 사진에 포함된 메타데이터, Adobe Photoshop과 같은 소프트웨어를 사용하여 이미지의 왜곡을 수정하고 조작의 흔적을 찾아, 원래 기능을 가리기 위해 복제되는 영역과 같은.

때로는 디지털 편집이 너무 미묘하여 감지할 수 없지만 밝은 픽셀과 어두운 픽셀이 분산되는 방식을 조정하면 눈에 띄게 됩니다. 예를 들어, 2010년 NASA는 토성의 위성 디오네와 타이탄의 사진. 그것은 결코 가짜가 아니었지만 길 잃은 유물을 제거하기 위해 정리되었습니다. 음모론자들의 관심.

궁금해서 Photoshop에 이미지를 넣었습니다. 아래 그림은 대략적인 모양을 재현한 것입니다.

어둡고 밝은 조정을 위한 차트가 있는 이미지 편집 화면의 스크린샷
명암 레벨이 조정될 때 편집이 감지되는 방법을 보여주는 시뮬레이션. 이미지 크레디트: Brendan Murphy / 저자 제공

대부분의 디지털 사진은 JPEG와 같은 압축 형식으로 되어 있으며 카메라에서 캡처한 정보의 대부분을 제거하여 크기를 줄였습니다. 표준화된 알고리즘은 제거된 정보가 가시적인 영향을 최소화하도록 보장하지만 흔적을 남깁니다.

이미지 영역의 압축은 이미지 및 현재 카메라 설정에서 진행 중인 작업에 따라 달라집니다. 가짜 이미지가 여러 소스를 결합할 때 종종 다음을 통해 이를 감지할 수 있습니다. 압축 아티팩트의 신중한 분석.

일부 포렌식 방법론은 이미지 형식과 거의 관련이 없지만 본질적으로 시각 탐정 작업. 사진의 모든 사람이 같은 방식으로 조명을 받고 있습니까? 그림자와 반사가 의미가 있습니까? 귀와 손이 올바른 위치에 빛과 그림자를 보여주고 있습니까? 사람들의 눈에 비치는 것은 무엇입니까? 장면을 3D로 모델링하면 방의 모든 선과 각도가 더해질까요?

Arthur Conan Doyle은 요정 사진에 속았을지 모르지만 그의 창작물인 Sherlock Holmes는 법의학 사진 분석의 세계에서 바로 집에 있을 것이라고 생각합니다.

인공 지능의 새로운 시대

XNUMXD덴탈의 현재의 이미지 폭발 텍스트에서 이미지로 생성 인공 지능 도구는 여러 면에서 필름에서 디지털 사진으로의 전환보다 더 급진적입니다.

이제 입력만 하면 원하는 이미지를 만들 수 있습니다. 이 이미지는 기존의 픽셀 덩어리를 함께 엮어서 만든 프랑켄 사진이 아닙니다. 콘텐츠, 품질 및 스타일이 지정된 완전히 새로운 이미지입니다.

최근까지 이러한 이미지를 생성하는 데 사용되는 복잡한 신경망은 대중에게 제한된 가용성을 제공했습니다. 이는 23년 2022월 XNUMX일에 변경되었으며, 오픈 소스 안정적인 확산. 이제 컴퓨터에 게임 수준의 Nvidia 그래픽 카드가 있으면 누구나 연구실이나 비즈니스 게이트키핑 활동 없이 AI 이미지 콘텐츠를 만들 수 있습니다.

이것은 많은 사람들이 "온라인에서 본 것을 다시 믿을 수 있습니까?". 조건에 따라서.

Text-to-image AI는 많은 수의 이미지/캡션 쌍을 분석하는 훈련을 통해 지능을 얻습니다. 각 시스템의 강점과 약점은 부분적으로 그것이 훈련된 이미지에서 파생됩니다. 다음은 예입니다. 이것이 Stable Diffusion에서 George Clooney가 다림질을 하는 것을 보는 방법입니다.

하얀 수건을 들고 일그러진 이목구비를 가진 남자의 약간 이상한 이미지
이것은 조지 클루니가 다림질을 하고 있는 것입니다...아니면? 이미지 크레디트: Brendan Murphy / 저자 제공

이것은 현실성과는 거리가 멀다. Stable Diffusion이 진행해야 하는 모든 것은 학습한 정보이며, George Clooney를 보았고 그 문자열을 배우의 특징과 연결할 수 있다는 것이 분명하지만 Clooney 전문가는 아닙니다.

하지만 일반적으로 중년 남성의 사진을 더 많이 보고 소화했을 것이므로 같은 시나리오에서 일반 중년 남성을 요청하면 어떻게 되는지 알아보겠습니다.

카메라를 바라보고 셔츠를 들고 있는 둥근 특징을 가진 중년 남성의 약간 이상한 이미지
다림질을 하고 있는 조지 클루니가 아닙니다. 이미지 크레디트: Brendan Murphy / 저자 제공

이것은 명백한 개선이지만 여전히 현실적이지 않습니다. 항상 그래왔듯이, 손과 귀의 까다로운 기하학은 가짜의 흔적을 찾기에 좋은 장소입니다. 비록 이 매체에서 우리는 불가능한 조명에 대한 이야기보다는 공간 기하학을 보고 있습니다.

다른 단서가 있을 수 있습니다. 방을 조심스럽게 재구성하면 모서리가 정사각형이 될까요? 선반이 의미가 있을까요? 디지털 사진을 조사하는 데 익숙한 법의학 전문가는 아마도 그것에 대해 전화를 걸 수 있습니다.

우리는 더 이상 우리의 눈을 믿을 수 없습니다

텍스트-이미지 시스템의 지식을 확장하면 훨씬 더 잘할 수 있습니다. 기존 교육을 보완하기 위해 자신의 설명된 사진을 추가할 수 있습니다. 이 과정은 텍스트 반전.

최근 구글이 출시한 드림 부스, 특정 사람, 사물 또는 예술 스타일을 텍스트-이미지 AI 시스템에 주입하기 위한 대안적이고 보다 정교한 방법입니다.

이 프로세스에는 강력한 하드웨어가 필요하지만 결과는 엄청납니다. 몇 가지 훌륭한 작업이 Reddit에서 공유되기 시작했습니다. 사진을보다 아래 포스트에서 DreamBooth에 넣은 이미지와 Stable Diffusion의 사실적인 가짜 이미지를 보여줍니다.



우리는 더 이상 우리의 눈을 믿을 수 없지만 적어도 현재로서는 여전히 법의학 전문가의 눈을 믿을 수 있습니다. 미래의 시스템도 의도적으로 그들을 속이도록 훈련될 수 있다는 것은 전적으로 가능합니다.

우리는 완벽한 사진은 물론 동영상까지도 보편화되는 시대로 빠르게 이동하고 있습니다. 이것이 얼마나 중요한지는 시간이 말해줄 것이지만 그 동안 Cottingley Fairy 사진의 교훈을 기억할 가치가 있습니다. 때때로 사람들은 명백한 가짜라도 믿고 싶어합니다.대화

이 기사는에서 다시 게시됩니다. 대화 크리에이티브 커먼즈 라이센스하에 읽기 원래 기사.

이미지 신용 : 브렌든 머피 /uthor 제공

타임 스탬프 :

더보기 특이점 허브