نسل تصویر هوش مصنوعی با سرعت های نجومی در حال پیشرفت است. آیا هنوز می توانیم تشخیص دهیم که یک عکس جعلی است؟ هوش داده PlatoBlockchain. جستجوی عمودی Ai.

نسل تصویر هوش مصنوعی با سرعت های نجومی در حال پیشرفت است. آیا هنوز می توانیم تشخیص دهیم که یک عکس جعلی است؟

عکاسی تقلبی چیز جدیدی نیست. در دهه 1910، آرتور کانن دویل، نویسنده بریتانیایی، توسط دو خواهر مدرسه‌ای که عکس‌هایی از پری‌های زیبا که در باغشان می‌نوشیدند، فریب خورد.

اولین عکس از پنج عکس «پری کاتینگلی»، گرفته شده توسط السی رایت در سال 1917. اعتبار تصویر: ویکی پدیا

امروزه سخت است باور کنیم که این عکس‌ها می‌توانستند کسی را فریب دهند، اما تا دهه 1980 بود که متخصصی به نام جفری کرالی اعصاب این را نداشت که مستقیماً دانش خود را در مورد عکاسی فیلم به کار گیرد و چیزهای بدیهی را استنتاج کند.

این عکس ها جعلی بودند، همانطور که بعداً توسط خود یکی از خواهران اعتراف کرد.

تصویر کمی عجیب و غریب از مردی خندان که یک دوربین عکاسی قدیمی در دست دارد
در سال 1982 جفری کرولی استنباط کرد که عکس های پری جعلی هستند. این یکی هم همینطور. اعتبار تصویر: برندان مورفی / نویسنده ارائه شده است

شکار مصنوعات و عقل سلیم

عکاسی دیجیتال تعداد زیادی از تکنیک ها را برای جعلیان و کارآگاهان به طور یکسان باز کرده است.

بررسی پزشکی قانونی تصاویر مشکوک امروزه شامل شکار کیفیت های ذاتی عکاسی دیجیتال مانند بررسی است. ابرداده های تعبیه شده در عکس ها، با استفاده از نرم افزارهایی مانند Adobe Photoshop برای اصلاح اعوجاج در تصاویر و جست‌وجوی نشانه‌های آشکار دستکاری، مانند مناطقی که برای مبهم کردن ویژگی های اصلی تکرار می شوند.

گاهی اوقات ویرایش‌های دیجیتالی آنقدر ظریف هستند که نمی‌توان آنها را تشخیص داد، اما وقتی نحوه توزیع پیکسل‌های روشن و تیره را تنظیم می‌کنیم، به چشم می‌خورند. به عنوان مثال، در سال 2010 ناسا یک را منتشر کرد عکس قمرهای دیون و تیتان زحل. این به هیچ وجه جعلی نبود، اما برای حذف مصنوعات سرگردان تمیز شده بود. توجه نظریه پردازان توطئه.

کنجکاو، من تصویر را در فتوشاپ قرار دادم. تصویر زیر به طور تقریبی نشان می دهد که چگونه به نظر می رسید.

اسکرین شات از صفحه ویرایش تصویر با نمودارهایی برای تنظیم تاریکی و روشنایی
شبیه سازی که نشان می دهد چگونه می توان ویرایش را با تنظیم سطوح روشنایی و تاریکی تشخیص داد. اعتبار تصویر: برندان مورفی / نویسنده ارائه شده است

اکثر عکس‌های دیجیتال در فرمت‌های فشرده‌شده مانند JPEG هستند که با حذف بسیاری از اطلاعات ثبت‌شده توسط دوربین، کاهش می‌یابند. الگوریتم‌های استاندارد تضمین می‌کنند که اطلاعات حذف‌شده کمترین تأثیر قابل مشاهده را دارند، اما آثاری از خود بر جای می‌گذارند.

فشرده سازی هر ناحیه از تصویر به آنچه در تصویر و تنظیمات فعلی دوربین می گذرد بستگی دارد. هنگامی که یک تصویر جعلی چندین منبع را با هم ترکیب می کند، اغلب می توان آن را با استفاده از آن تشخیص داد تجزیه و تحلیل دقیق از مصنوعات فشرده سازی.

برخی از روش‌های پزشکی قانونی ارتباط چندانی با قالب یک تصویر ندارند، اما اساساً اینطور هستند کارآگاهی بصری. آیا همه افراد در عکس به یک شکل روشن می شوند؟ آیا سایه ها و بازتاب ها منطقی هستند؟ آیا گوش ها و دست ها نور و سایه را در مکان های مناسب نشان می دهند؟ چه چیزی در چشم مردم منعکس می شود؟ اگر صحنه را به صورت سه بعدی مدل سازی کنیم، آیا تمام خطوط و زوایای اتاق با هم جمع می شوند؟

آرتور کانن دویل ممکن است فریب عکس‌های پری را خورده باشد، اما من فکر می‌کنم که خلقت او شرلوک هلمز در دنیای تجزیه و تحلیل عکس‌های پزشکی قانونی در خانه است.

عصر جدید هوش مصنوعی

La انفجار فعلی تصاویر ایجاد شده توسط متن به تصویر هوش مصنوعی ابزار از بسیاری جهات رادیکال تر از تغییر از فیلم به عکاسی دیجیتال است.

اکنون می‌توانیم تنها با تایپ کردن، هر تصویری را که می‌خواهیم ایجاد کنیم. این عکس‌ها عکس‌هایی نیستند که از کنار هم قرار دادن توده‌های پیکسل‌های از قبل موجود ساخته شده‌اند. آنها تصاویر کاملاً جدیدی با محتوا، کیفیت و سبک مشخص شده هستند.

تا همین اواخر، شبکه های عصبی پیچیده ای که برای تولید این تصاویر استفاده می شد، در دسترس عموم محدود بود. این در 23 آگوست 2022 با انتشار عمومی آن تغییر کرد منبع باز انتشار پایدار. اکنون هرکسی که کارت گرافیک انویدیا در سطح بازی را در رایانه خود دارد، می‌تواند محتوای تصویر هوش مصنوعی را بدون هیچ آزمایشگاه تحقیقاتی یا دروازه‌بانی فعالیت‌های خود ایجاد کند.

این امر بسیاری را بر آن داشته تا بپرسند:آیا می توانیم چیزی را که در اینترنت می بینیم دوباره باور کنیم؟". که بستگی دارد.

هوش مصنوعی متن به تصویر هوش خود را از آموزش به دست می‌آورد - تجزیه و تحلیل تعداد زیادی جفت تصویر/کپشن. نقاط قوت و ضعف هر سیستم تا حدی برگرفته از تصاویری است که روی آن آموزش دیده است. این یک مثال است: اینگونه است که Stable Diffusion جورج کلونی را در حال اتو کردن خود می بیند.

تصویری کمی عجیب از مردی با ویژگی های مخدوش که حوله ای سفید در دست دارد
این جورج کلونی داره اتو کردنش رو انجام میده یا نه؟ اعتبار تصویر: برندان مورفی / نویسنده ارائه شده است

این دور از واقعیت است. تمام چیزی که Stable Diffusion باید ادامه دهد، اطلاعاتی است که آموخته است، و اگرچه واضح است که جورج کلونی را دیده است و می تواند آن رشته حروف را به ویژگی های بازیگر مرتبط کند، اما متخصص کلونی نیست.

با این حال، به طور کلی عکس‌های بیشتری از مردان میانسال دیده و هضم می‌شد، بنابراین بیایید ببینیم وقتی در همان سناریو یک مرد میانسال عمومی را درخواست می‌کنیم چه اتفاقی می‌افتد.

تصویری کمی عجیب از مردی میانسال با ظاهری گرد که به دوربین نگاه می کند و پیراهنی در دست دارد
جرج کلونی در حال اتو کردن نیست. اعتبار تصویر: برندان مورفی / نویسنده ارائه شده است

این یک پیشرفت واضح است، اما هنوز کاملاً واقعی نیست. همانطور که همیشه وجود داشته است، هندسه پیچیده دست ها و گوش ها مکان های خوبی برای جستجوی نشانه های جعلی هستند - اگرچه در این رسانه ما بیشتر به هندسه فضایی نگاه می کنیم تا از نور غیرممکن.

ممکن است سرنخ های دیگری نیز وجود داشته باشد. اگر اتاق را با دقت بازسازی کنیم، آیا گوشه ها مربع می شوند؟ آیا قفسه ها منطقی هستند؟ یک متخصص پزشکی قانونی که به بررسی عکس های دیجیتال عادت دارد احتمالاً می تواند در این مورد تماس بگیرد.

ما دیگر نمی توانیم چشمانمان را باور کنیم

اگر دانش یک سیستم متن به تصویر را گسترش دهیم، می تواند حتی بهتر عمل کند. می توانید عکس های توصیف شده خود را برای تکمیل آموزش موجود اضافه کنید. این فرآیند به عنوان شناخته شده است وارونگی متنی.

به تازگی گوگل منتشر کرده است غرفه رویایییک روش جایگزین و پیچیده تر برای تزریق افراد، اشیا یا حتی سبک های هنری خاص به سیستم های هوش مصنوعی متن به تصویر.

این فرآیند به سخت افزار سنگین نیاز دارد، اما نتایج خیره کننده است. چند کار عالی در Reddit به اشتراک گذاشته شده است. به عکس ها نگاه کن در پست زیر که تصاویر قرار داده شده در DreamBooth و تصاویر جعلی واقع گرایانه از Stable Diffusion را نشان می دهد.



ما دیگر نمی توانیم چشمان خود را باور کنیم، اما شاید بتوانیم حداقل در حال حاضر به چشمان متخصصان پزشکی قانونی اعتماد کنیم. کاملاً ممکن است که سیستم‌های آینده نیز عمداً برای فریب دادن آنها آموزش داده شوند.

ما به سرعت در حال حرکت به عصری هستیم که در آن عکاسی کامل و حتی ویدئو رایج خواهد بود. زمان نشان خواهد داد که چقدر این مهم خواهد بود، اما در عین حال ارزش آن را دارد که درس عکس‌های Cottingley Fairy را به خاطر بسپاریم - گاهی اوقات مردم فقط می‌خواهند باور کنند، حتی جعلی‌های آشکار.گفتگو

این مقاله از مجله منتشر شده است گفتگو تحت مجوز Creative Commons دفعات بازدید: مقاله.

تصویر های اعتباری: برندان مورفی / الفنویسنده ارائه شده است

تمبر زمان:

بیشتر از تکینگی هاب