يتقدم إنشاء الصور بالذكاء الاصطناعي بسرعات فلكية. هل ما زلنا نستطيع معرفة ما إذا كانت الصورة مزيفة؟ ذكاء بيانات PlatoBlockchain. البحث العمودي. عاي.

يتقدم إنشاء الصور بالذكاء الاصطناعي بسرعات فلكية. هل ما زلنا نستطيع معرفة ما إذا كانت الصورة مزيفة؟

التصوير الفوتوغرافي المزيف ليس بالأمر الجديد. في عام 1910 ، اشتهر الكاتب البريطاني آرثر كونان دويل بخداعه من قبل شقيقتين في سن المدرسة كانتا قد أنتجا صوراً لجنيات أنيقة ترفرف في حديقتهما.

الصورة الأولى من صور الجنيات Cottingley التي التقطتها Elsie Wright في عام 1917. حقوق الصورة: ويكيبيديا

من الصعب اليوم تصديق أن هذه الصور كان من الممكن أن تخدع أي شخص ، ولكن لم يكن خبيرًا يُدعى جيفري كراولي حتى الثمانينيات يمتلك الجرأة لتطبيق معرفته بالتصوير الفوتوغرافي للأفلام بشكل مباشر واستنتاج ما هو واضح.

كانت الصور مزورة ، كما اعترفت لاحقًا إحدى الأخوات أنفسهن.

صورة غريبة بعض الشيء لرجل مبتسم يحمل كاميرا تصوير المدرسة القديمة
في عام 1982 ، استنتج جيفري كراولي أن الصور الخيالية كانت مزيفة. هذا هو. حقوق الصورة: بريندان ميرفي / المؤلف مقدم

البحث عن القطع الأثرية والحس السليم

لقد فتح التصوير الرقمي ثروة من التقنيات للمزيفين والمحققين على حد سواء.

يتضمن فحص الطب الشرعي للصور المشبوهة في الوقت الحاضر البحث عن الصفات المتأصلة في التصوير الفوتوغرافي الرقمي ، مثل الفحص البيانات الوصفية المضمنة في الصور، باستخدام برنامج مثل Adobe Photoshop لتصحيح التشوهات في الصور ، و البحث عن علامات منبهة للتلاعب، مثل المناطق التي يتم تكرارها لإخفاء المواضع الأصلية.

في بعض الأحيان ، تكون عمليات التحرير الرقمية دقيقة للغاية بحيث يتعذر اكتشافها ، ولكنها تقفز إلى العرض عندما نضبط طريقة توزيع وحدات البكسل الفاتحة والداكنة. على سبيل المثال ، أصدرت وكالة ناسا في عام 2010 ملف صورة أقمار زحل ديون وتيتان. لم يكن مزيفًا بأي حال من الأحوال ، ولكن تم تنظيفه لإزالة القطع الأثرية الضالة - التي حصلت عليها انتباه منظري المؤامرة.

فضولي ، أضع الصورة في برنامج فوتوشوب. الرسم التوضيحي أدناه يعيد تكوين كيف بدا هذا تقريبًا.

لقطة شاشة لشاشة تحرير الصور مع مخططات لضبط الظلام والضوء
محاكاة توضح كيف يمكن اكتشاف التحرير عند تعديل مستويات الضوء والظلام. ائتمان الصورة: بريندان ميرفي / المؤلف مقدم

تكون معظم الصور الرقمية بتنسيقات مضغوطة مثل JPEG ، ويتم تقليص حجمها عن طريق إزالة الكثير من المعلومات التي تلتقطها الكاميرا. تضمن الخوارزميات المعيارية أن المعلومات التي تمت إزالتها لها تأثير مرئي ضئيل - لكنها تترك آثارًا.

يعتمد ضغط أي منطقة في الصورة على ما يجري في الصورة وإعدادات الكاميرا الحالية ؛ عندما تجمع صورة مزيفة بين مصادر متعددة ، فمن الممكن غالبًا اكتشاف ذلك عن طريق تحليل دقيق للقطع الأثرية للضغط.

بعض منهجيات الطب الشرعي لا علاقة لها بشكل الصورة ، لكنها في الأساس لها علاقة عمل المباحث المرئية. هل كل من في الصورة مضاء بنفس الطريقة؟ هل الظلال والانعكاسات منطقية؟ هل الآذان واليدان تظهران الضوء والظل في الأماكن الصحيحة؟ ماذا ينعكس في عيون الناس؟ هل ستجمع كل خطوط وزوايا الغرفة إذا قمنا بنمذجة المشهد ثلاثي الأبعاد؟

قد يكون آرثر كونان دويل قد خدع بالصور الخيالية ، لكنني أعتقد أن ابتكاره شيرلوك هولمز سيكون في المنزل تمامًا في عالم تحليل صور الطب الشرعي.

عصر جديد من الذكاء الاصطناعي

الانفجار الحالي للصور تم إنشاؤها بواسطة نص إلى صورة الذكاء الاصطناعي من نواحٍ كثيرة ، تعتبر أدوات أكثر جذرية من التحول من التصوير السينمائي إلى التصوير الرقمي.

يمكننا الآن استحضار أي صورة نريدها ، فقط عن طريق الكتابة. هذه الصور ليست صورًا صريحة تم إنشاؤها عن طريق تجميع مجموعات البكسل الموجودة مسبقًا معًا. إنها صور جديدة تمامًا مع تحديد المحتوى والجودة والأسلوب.

حتى وقت قريب ، كانت الشبكات العصبية المعقدة المستخدمة لإنشاء هذه الصور محدودة الإتاحة للجمهور. تغير هذا في 23 أغسطس 2022 ، مع إطلاق سراح الجمهور من انتشار مستقر مفتوح المصدر. الآن يمكن لأي شخص لديه بطاقة رسومات Nvidia على مستوى الألعاب في جهاز الكمبيوتر الخاص به إنشاء محتوى صور AI بدون أي مختبر بحث أو بوابة أعمال تحافظ على أنشطته.

وقد دفع هذا الكثيرين إلى التساؤل ، "هل يمكننا أن نصدق ما نراه على الإنترنت مرة أخرى؟". هذا يعتمد على.

النص إلى الصورة الذكاء الاصطناعي يحصل على ذكاءه من التدريب - تحليل عدد كبير من أزواج الصور / الشرح. تُستمد نقاط القوة والضعف في كل نظام جزئيًا من الصور التي تم التدريب عليها. إليك مثال: هكذا يرى Stable Diffusion أن جورج كلوني يقوم بكيّه.

صورة غريبة بعض الشيء لرجل بملامح مشوهة يحمل منشفة بيضاء
هذا جورج كلوني يقوم بكي الملابس ... أم هو كذلك؟ حقوق الصورة: بريندان ميرفي / المؤلف مقدم

هذا أبعد ما يكون عن الواقعية. كل ما يجب أن يستمر "Stable Diffusion" هو المعلومات التي تعلمها ، وعلى الرغم من أنه من الواضح أنه شاهد جورج كلوني ويمكنه ربط سلسلة الرسائل هذه بخصائص الممثل ، إلا أنه ليس خبيرًا في كلوني.

ومع ذلك ، فقد شاهدت واستوعبت العديد من صور الرجال في منتصف العمر بشكل عام ، لذلك دعونا نرى ما يحدث عندما نطلب رجلًا في منتصف العمر في نفس السيناريو.

صورة غريبة بعض الشيء لرجل في منتصف العمر بملامح مستديرة ينظر إلى الكاميرا ويحمل قميصًا
لا يقوم جورج كلوني بكي الملابس. ائتمان الصورة: بريندان ميرفي / المؤلف مقدم

هذا تحسن واضح ، لكنه لا يزال غير واقعي تمامًا. كما كان الحال دائمًا ، تعد الهندسة المعقدة للأيدي والأذنين أماكن جيدة للبحث عن علامات التزييف - على الرغم من أننا في هذا الوسط ننظر إلى الهندسة المكانية بدلاً من روايات الإضاءة المستحيلة.

قد تكون هناك أدلة أخرى. إذا أعدنا بناء الغرفة بعناية ، فهل ستكون الزوايا مربعة؟ هل سيكون للرفوف معنى؟ ربما يمكن لخبير الطب الشرعي الذي اعتاد فحص الصور الرقمية إجراء مكالمة على ذلك.

لم يعد بإمكاننا تصديق عيوننا

إذا قمنا بتوسيع معرفة نظام تحويل النص إلى صورة ، فيمكنه القيام بعمل أفضل. يمكنك إضافة الصور الموصوفة الخاصة بك لاستكمال التدريب الحالي. تُعرف هذه العملية باسم انعكاس نصي.

في الآونة الأخيرة ، أصدرت جوجل دريم بوث، طريقة بديلة وأكثر تعقيدًا لحقن أشخاص معينين أو أشياء أو حتى أنماط فنية في أنظمة الذكاء الاصطناعي لتحويل النص إلى صورة.

تتطلب هذه العملية أجهزة شديدة التحمل ، لكن النتائج مذهلة. بدأت مشاركة بعض الأعمال الرائعة على Reddit. انظر الى الصور في المنشور أدناه التي تعرض الصور الموضوعة في DreamBooth والصور المزيفة الواقعية من Stable Diffusion.



لم نعد قادرين على تصديق أعيننا ، لكن ربما لا نزال قادرين على الوثوق بأعين خبراء الطب الشرعي ، على الأقل في الوقت الحالي. من الممكن تمامًا أن يتم تدريب الأنظمة المستقبلية عن عمد لخداعها أيضًا.

نحن نتحرك بسرعة إلى عصر يكون فيه التصوير الفوتوغرافي المثالي وحتى الفيديو أمرًا شائعًا. سيوضح الوقت مدى أهمية هذا الأمر ، ولكن في هذه الأثناء ، يجدر بنا أن نتذكر الدرس المستفاد من صور Cottingley Fairy - أحيانًا يريد الناس فقط تصديق ذلك ، حتى في الصور المزيفة الواضحة.المحادثة

يتم إعادة نشر هذه المقالة من المحادثة تحت رخصة المشاع الإبداعي. إقرأ ال المقال الأصلي.

الصورة الائتمان: بريندان ميرفي / أقدمت أوثور

الطابع الزمني:

اكثر من التفرد المحور