Công nghệ tạo ảnh AI đang tiến triển với tốc độ chóng mặt. Chúng ta vẫn có thể biết được một bức ảnh có phải là giả không? Thông tin dữ liệu PlatoBlockchain. Tìm kiếm dọc. Ái.

Thế hệ hình ảnh AI đang tiến bộ với tốc độ thiên văn. Chúng ta vẫn có thể biết nếu một bức ảnh là giả?

Chụp ảnh giả không có gì mới. Vào những năm 1910, tác giả người Anh Arthur Conan Doyle đã bị lừa dối bởi hai chị em gái đang tuổi đi học, những người đã tạo ra những bức ảnh về các nàng tiên thanh lịch đang vận động trong khu vườn của họ.

Bức ảnh đầu tiên trong số năm bức ảnh 'Những nàng tiên Cottingley', do Elsie Wright chụp năm 1917. Nguồn ảnh: Wikipedia

Ngày nay, thật khó tin những bức ảnh này có thể đánh lừa được bất kỳ ai, nhưng phải đến những năm 1980, một chuyên gia tên là Geoffrey Crawley mới có gan áp dụng trực tiếp kiến ​​thức của mình về nhiếp ảnh phim và suy luận ra điều hiển nhiên.

Các bức ảnh là giả mạo, sau đó được chính một trong hai chị em thừa nhận.

Một hình ảnh hơi kỳ lạ của một người đàn ông đang mỉm cười cầm một chiếc máy ảnh chụp ảnh thời học sinh cũ
Năm 1982, Geoffrey Crawley cho rằng những bức ảnh cổ tích là giả. Cái này cũng vậy. Tín dụng hình ảnh: Brendan Murphy / tác giả cung cấp

Săn lùng đồ tạo tác và nhận thức chung

Nhiếp ảnh kỹ thuật số đã mở ra vô số kỹ thuật cho người làm phim cũng như thám tử.

Việc kiểm tra pháp y đối với các hình ảnh nghi ngờ ngày nay liên quan đến việc tìm kiếm các phẩm chất vốn có của nhiếp ảnh kỹ thuật số, chẳng hạn như kiểm tra siêu dữ liệu được nhúng trong ảnh, sử dụng phần mềm như Adobe Photoshop để sửa các biến dạng trong hình ảnh và tìm kiếm các dấu hiệu của sự thao túng, chẳng hạn như các vùng bị sao chép để che khuất các đối tượng địa lý gốc.

Đôi khi các chỉnh sửa kỹ thuật số quá tinh vi để có thể phát hiện ra, nhưng chúng ta có thể thấy rõ khi chúng tôi điều chỉnh cách phân phối pixel sáng và tối. Ví dụ, vào năm 2010, NASA đã phát hành một ảnh chụp mặt trăng của sao Thổ Dione và Titan. Nó hoàn toàn không phải là giả, nhưng đã được làm sạch để loại bỏ các đồ tạo tác bị thất lạc — thứ có sự chú ý của những người theo thuyết âm mưu.

Tò mò, tôi đưa hình ảnh vào Photoshop. Hình minh họa dưới đây tái tạo lại gần như thế nào về cái này.

Ảnh chụp màn hình chỉnh sửa hình ảnh với các biểu đồ để điều chỉnh sáng tối
Mô phỏng cho thấy cách chỉnh sửa có thể được phát hiện khi điều chỉnh mức độ sáng và tối. Tín dụng hình ảnh: Brendan Murphy / tác giả cung cấp

Hầu hết các bức ảnh kỹ thuật số ở định dạng nén như JPEG, được thu gọn lại bằng cách loại bỏ nhiều thông tin được máy ảnh chụp lại. Các thuật toán chuẩn hóa đảm bảo thông tin bị xóa có tác động tối thiểu có thể nhìn thấy được — nhưng nó vẫn để lại dấu vết.

Việc nén bất kỳ vùng nào của hình ảnh sẽ phụ thuộc vào những gì đang diễn ra trong hình ảnh và cài đặt máy ảnh hiện tại; khi một hình ảnh giả kết hợp nhiều nguồn, thường có thể phát hiện ra điều này bằng cách phân tích cẩn thận các hiện vật nén.

Một số phương pháp pháp y ít liên quan đến định dạng của hình ảnh, nhưng về cơ bản là công việc thám tử trực quan. Mọi người trong bức ảnh có được chiếu sáng theo cùng một cách không? Bóng và phản xạ có hợp lý không? Đôi tai và bàn tay có hiển thị ánh sáng và bóng tối ở đúng nơi không? Điều gì được phản chiếu trong mắt mọi người? Tất cả các đường nét và góc độ của căn phòng sẽ cộng lại nếu chúng ta lập mô hình cảnh đó ở dạng 3D?

Arthur Conan Doyle có thể đã bị đánh lừa bởi những bức ảnh cổ tích, nhưng tôi nghĩ tác phẩm Sherlock Holmes của ông sẽ phù hợp với thế giới phân tích ảnh pháp y.

Kỷ nguyên mới của trí tuệ nhân tạo

Sản phẩm bùng nổ hình ảnh hiện tại được tạo bởi văn bản thành hình ảnh trí tuệ nhân tạo các công cụ theo nhiều cách triệt để hơn sự chuyển dịch từ phim sang nhiếp ảnh kỹ thuật số.

Bây giờ chúng ta có thể gợi ra bất kỳ hình ảnh nào chúng ta muốn, chỉ bằng cách gõ. Những hình ảnh này không phải là những bức ảnh trắng được tạo ra bằng cách ghép các cụm pixel đã có từ trước với nhau. Chúng là những hình ảnh hoàn toàn mới với nội dung, chất lượng và phong cách được chỉ định.

Cho đến gần đây, các mạng nơ-ron phức tạp được sử dụng để tạo ra những hình ảnh này đã có giới hạn đối với công chúng. Điều này đã thay đổi vào ngày 23 tháng 2022 năm XNUMX, với việc phát hành cho công chúng sự khuếch tán ổn định mã nguồn mở. Giờ đây, bất kỳ ai có cạc đồ họa Nvidia cấp độ chơi game trong máy tính của họ đều có thể tạo nội dung hình ảnh AI mà không cần bất kỳ phòng nghiên cứu hoặc doanh nghiệp nào giám sát hoạt động của họ.

Điều này đã khiến nhiều người đặt câu hỏi, “chúng ta có thể tin những gì chúng ta thấy trực tuyến một lần nữa không?”. Mà phụ thuộc.

AI chuyển văn bản thành hình ảnh được đào tạo thông minh — việc phân tích một số lượng lớn các cặp hình ảnh / chú thích. Điểm mạnh và điểm yếu của mỗi hệ thống một phần bắt nguồn từ những hình ảnh mà nó đã được đào tạo. Đây là một ví dụ: đây là cách Stable Diffusion nhìn thấy George Clooney đang ủi đồ.

Một hình ảnh hơi kỳ lạ về một người đàn ông với những nét mặt méo mó đang cầm một chiếc khăn trắng
Đây là George Clooney đang ủi đồ… hay là? Tín dụng hình ảnh: Brendan Murphy / tác giả cung cấp

Điều này là xa thực tế. Tất cả những gì Stable Diffusion phải tiếp tục là thông tin nó đã học được, và rõ ràng là nó đã nhìn thấy George Clooney và có thể liên kết chuỗi chữ cái đó với các đặc điểm của nam diễn viên, nó không phải là một chuyên gia về Clooney.

Tuy nhiên, nó sẽ nhìn thấy và tìm hiểu thêm nhiều bức ảnh về đàn ông trung niên nói chung, vì vậy hãy xem điều gì sẽ xảy ra khi chúng tôi yêu cầu một người đàn ông trung niên nói chung trong cùng một kịch bản.

Một hình ảnh hơi kỳ lạ của một người đàn ông trung niên với những đường nét tròn trịa đang nhìn vào máy ảnh và cầm một chiếc áo sơ mi
Không phải George-Clooney đang ủi đồ. Tín dụng hình ảnh: Brendan Murphy / tác giả cung cấp

Đây là một cải tiến rõ ràng, nhưng vẫn chưa hoàn toàn thực tế. Như mọi khi, hình dạng phức tạp của bàn tay và đôi tai là những nơi thích hợp để tìm kiếm các dấu hiệu giả mạo — mặc dù trong phương tiện này, chúng ta đang xem xét hình học không gian hơn là nói về sự bất khả thi của ánh sáng.

Có thể có những manh mối khác. Nếu chúng ta tái tạo lại căn phòng một cách cẩn thận, các góc có vuông không? Các kệ sẽ có ý nghĩa? Một chuyên gia pháp y được sử dụng để kiểm tra các bức ảnh kỹ thuật số có lẽ có thể thực hiện điều đó.

Chúng ta không thể tin vào mắt mình nữa

Nếu chúng ta mở rộng kiến ​​thức của hệ thống văn bản thành hình ảnh, hệ thống đó có thể làm tốt hơn nữa. Bạn có thể thêm hình ảnh mô tả của riêng bạn để bổ sung cho đào tạo hiện có. Quá trình này được gọi là đảo ngược văn bản.

Gần đây, Google đã phát hành Gian hàng trong mơ, một phương pháp thay thế, phức tạp hơn để đưa những người, đồ vật hoặc thậm chí phong cách nghệ thuật cụ thể vào các hệ thống AI chuyển văn bản thành hình ảnh.

Quá trình này yêu cầu phần cứng nặng, nhưng kết quả thật đáng kinh ngạc. Một số tác phẩm tuyệt vời đã bắt đầu được chia sẻ trên Reddit. Nhìn vào những bức ảnh trong bài viết dưới đây hiển thị hình ảnh được đưa vào DreamBooth và hình ảnh giả thực tế từ Khuếch tán ổn định.



Chúng ta không còn có thể tin vào mắt mình nữa, nhưng chúng ta có thể vẫn có thể tin tưởng vào những chuyên gia pháp y, ít nhất là vào lúc này. Hoàn toàn có khả năng là các hệ thống trong tương lai cũng có thể được đào tạo một cách có chủ ý để đánh lừa chúng.

Chúng ta đang nhanh chóng chuyển sang một kỷ nguyên mà hình ảnh hoàn hảo và thậm chí cả video sẽ trở nên phổ biến. Thời gian sẽ cho biết điều này sẽ quan trọng như thế nào, nhưng trong thời gian chờ đợi, chúng ta nên nhớ bài học về những bức ảnh Cổ tích Cottingley — đôi khi mọi người chỉ muốn tin, ngay cả những điều rõ ràng là giả mạo.Conversation

Bài viết này được tái bản từ Conversation theo giấy phép Creative Commons. Đọc ban đầu bài viết.

Ảnh: Brendan Murphy / mộtuthor cung cấp

Dấu thời gian:

Thêm từ Trung tâm cá biệt