AI امیج جنریشن فلکیاتی رفتار سے آگے بڑھ رہی ہے۔ کیا ہم اب بھی بتا سکتے ہیں کہ کیا تصویر جعلی ہے؟ پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

AI امیج جنریشن فلکیاتی رفتار سے آگے بڑھ رہی ہے۔ کیا ہم اب بھی بتا سکتے ہیں کہ کیا تصویر جعلی ہے؟

جعلی فوٹو گرافی کوئی نئی بات نہیں ہے۔ 1910 کی دہائی میں، برطانوی مصنف آرتھر کونن ڈوئل کو اسکول کی عمر کی دو بہنوں نے دھوکہ دیا جنہوں نے اپنے باغ میں خوبصورت پریوں کی تصویریں بنائی تھیں۔

ایلسی رائٹ کی طرف سے 1917 میں لی گئی پانچ 'کوٹنگلے پریوں' میں سے پہلی تصاویر۔ تصویری کریڈٹ: ویکیپیڈیا

آج یہ یقین کرنا مشکل ہے کہ یہ تصاویر کسی کو بھی بے وقوف بنا سکتی تھیں، لیکن ایسا نہیں تھا کہ 1980 کی دہائی تک جیفری کرولی نامی ایک ماہر کو فلم فوٹوگرافی کے بارے میں اپنے علم کو براہ راست لاگو کرنے اور واضح نتائج اخذ کرنے کا حوصلہ نہیں تھا۔

تصاویر جعلی تھیں، جیسا کہ بعد میں ایک بہن نے خود اعتراف کیا۔

پرانے اسکول کے فوٹو گرافی کیمرہ پکڑے ہوئے ایک مسکراتے ہوئے آدمی کی قدرے غیر معمولی تصویر
1982 میں جیفری کرولی نے اندازہ لگایا کہ پریوں کی تصاویر جعلی تھیں۔ تو یہ ایک ہے. تصویری کریڈٹ: برینڈن مرفی / مصنف فراہم کردہ

فن پارے اور کامن سینس کا شکار

ڈیجیٹل فوٹو گرافی نے جعل سازوں اور جاسوسوں کے لئے یکساں تکنیکوں کا خزانہ کھول دیا ہے۔

مشتبہ تصاویر کے فرانزک امتحان میں آج کل ڈیجیٹل فوٹو گرافی میں شامل خصوصیات کی تلاش شامل ہے، جیسے کہ جانچ تصاویر میں سرایت شدہ میٹا ڈیٹا، تصاویر میں بگاڑ کو درست کرنے کے لیے ایڈوب فوٹوشاپ جیسے سافٹ ویئر کا استعمال کرتے ہوئے، اور ہیرا پھیری کے بتانے والے علامات کی تلاش, جیسے کہ اصلی خصوصیات کو غیر واضح کرنے کے لیے خطوں کو نقل کیا جا رہا ہے۔

بعض اوقات ڈیجیٹل ترامیم کا پتہ لگانے کے لیے بہت لطیف ہوتے ہیں، لیکن جب ہم روشنی اور گہرے پکسلز کی تقسیم کے طریقے کو ایڈجسٹ کرتے ہیں تو منظر میں چھلانگ لگاتے ہیں۔ مثال کے طور پر، 2010 میں ناسا نے ایک جاری کیا۔ زحل کے چاند ڈیون اور ٹائٹن کی تصویر. یہ کسی بھی طرح سے جعلی نہیں تھا، لیکن آوارہ نمونوں کو ہٹانے کے لیے اسے صاف کیا گیا تھا۔ سازشی تھیوریسٹوں کی توجہ.

متجسس، میں نے تصویر کو فوٹوشاپ میں ڈال دیا۔ ذیل کی مثال تقریباً دوبارہ تخلیق کرتی ہے کہ یہ کیسا لگتا ہے۔

تاریک اور ہلکی ایڈجسٹمنٹ کے لیے چارٹس کے ساتھ تصویر میں ترمیم کرنے والی اسکرین کا اسکرین شاٹ
ایک تخروپن یہ دکھاتا ہے کہ جب روشنی اور اندھیرے کی سطح کو ایڈجسٹ کیا جاتا ہے تو ترمیم کا پتہ کیسے لگایا جاسکتا ہے۔ تصویری کریڈٹ: برینڈن مرفی / مصنف فراہم کردہ

زیادہ تر ڈیجیٹل تصویریں کمپریسڈ فارمیٹس میں ہوتی ہیں جیسے JPEG، کیمرہ کے ذریعے حاصل کی گئی زیادہ تر معلومات کو ہٹا کر اسے کم کر دیا جاتا ہے۔ معیاری الگورتھم اس بات کو یقینی بناتے ہیں کہ ہٹائی گئی معلومات کا کم سے کم نظر آنے والا اثر ہوتا ہے — لیکن یہ نشانات چھوڑ دیتا ہے۔

تصویر کے کسی بھی علاقے کا کمپریشن اس بات پر منحصر ہوگا کہ تصویر اور موجودہ کیمرے کی ترتیبات میں کیا ہو رہا ہے۔ جب ایک جعلی تصویر متعدد ذرائع کو یکجا کرتی ہے، تو اکثر اس کا پتہ لگانا ممکن ہوتا ہے۔ کمپریشن نمونے کا محتاط تجزیہ.

کچھ فرانزک طریقہ کار کا تصویر کے فارمیٹ سے بہت کم تعلق ہے، لیکن بنیادی طور پر ہے۔ بصری جاسوسی کا کام. کیا تصویر میں ہر کوئی اسی طرح روشن ہے؟ کیا سائے اور عکاسی معنی خیز ہیں؟ کیا کان اور ہاتھ صحیح جگہوں پر روشنی اور سایہ دکھا رہے ہیں؟ لوگوں کی آنکھوں میں کیا جھلکتا ہے؟ اگر ہم منظر کو 3D میں ماڈل بناتے ہیں تو کیا کمرے کی تمام لائنیں اور زاویے ایک دوسرے میں شامل ہو جائیں گے؟

ہو سکتا ہے کہ آرتھر کونن ڈوئل کو پریوں کی تصاویر نے بے وقوف بنایا ہو، لیکن مجھے لگتا ہے کہ اس کی تخلیق شرلاک ہومز فرانزک تصویری تجزیہ کی دنیا میں گھر پر ہی ہوگی۔

مصنوعی ذہانت کا نیا دور

۔ تصاویر کا حالیہ دھماکہ متن سے تصویر کے ذریعے تخلیق کیا گیا۔ مصنوعی ذہانت ٹولز فلم سے ڈیجیٹل فوٹو گرافی میں تبدیلی کے مقابلے میں بہت سے طریقوں سے زیادہ بنیاد پرست ہیں۔

اب ہم اپنی مرضی کی کوئی بھی تصویر بنا سکتے ہیں، بس ٹائپ کر کے۔ یہ تصاویر فرینکن فوٹوز نہیں ہیں جو پہلے سے موجود پکسلز کے کلپس کو ایک ساتھ جوڑ کر بنائی گئی ہیں۔ وہ مواد، معیار اور مخصوص انداز کے ساتھ مکمل طور پر نئی تصاویر ہیں۔

کچھ عرصہ پہلے تک، ان تصاویر کو بنانے کے لیے استعمال کیے جانے والے پیچیدہ عصبی نیٹ ورکس کی عوام کے لیے محدود دستیابی تھی۔ یہ 23 اگست 2022 کو عوام کے لیے ریلیز کے ساتھ تبدیل ہوا۔ اوپن سورس مستحکم بازی. اب کوئی بھی شخص جس کے کمپیوٹر میں گیمنگ لیول کا Nvidia گرافکس کارڈ ہے وہ بغیر کسی تحقیقی لیب یا کاروباری گیٹ کیپنگ کے اپنی سرگرمیوں کے AI امیج مواد بنا سکتا ہے۔

اس نے بہت سے لوگوں کو یہ پوچھنے پر اکسایا ہے، "کیا ہم کبھی یقین کر سکتے ہیں جو ہم آن لائن دیکھتے ہیں؟" اس پر منحصر ہے۔

ٹیکسٹ ٹو امیج AI کو تربیت سے اپنے سمارٹ حاصل ہوتے ہیں — تصویر/کیپشن کے جوڑوں کی ایک بڑی تعداد کا تجزیہ۔ ہر نظام کی خوبیاں اور کمزوریاں جزوی طور پر ان تصاویر سے حاصل ہوتی ہیں جن پر اسے تربیت دی گئی ہے۔ یہاں ایک مثال ہے: Stable Diffusion جارج کلونی کو استری کرتے ہوئے دیکھتا ہے۔

ایک سفید تولیہ پکڑے ہوئے مسخ شدہ خصوصیات والے آدمی کی قدرے غیر معمولی تصویر
یہ جارج کلونی اپنا استری کر رہا ہے… یا یہ ہے؟ تصویری کریڈٹ: برینڈن مرفی / مصنف فراہم کردہ

یہ حقیقت پسندی سے بہت دور ہے۔ تمام اسٹیبل ڈفیوژن کو جاری رکھنا ہے وہ معلومات ہے جو اس نے سیکھی ہے، اور جب یہ واضح ہے کہ اس نے جارج کلونی کو دیکھا ہے اور وہ حروف کی اس تار کو اداکار کی خصوصیات سے جوڑ سکتا ہے، یہ کلونی ماہر نہیں ہے۔

تاہم، اس نے عام طور پر درمیانی عمر کے مردوں کی اور بھی بہت سی تصاویر دیکھی اور ہضم کر لی ہوں گی، تو آئیے دیکھتے ہیں کہ جب ہم اسی منظر نامے میں ایک عام ادھیڑ عمر آدمی سے پوچھتے ہیں تو کیا ہوتا ہے۔

گول خصوصیات کے ساتھ ایک درمیانی عمر کے آدمی کی ایک قدرے غیر معمولی تصویر جو کیمرے کی طرف دیکھ رہا ہے اور قمیض پکڑے ہوئے ہے
جارج کلونی نہیں استری کر رہا ہے۔ تصویری کریڈٹ: برینڈن مرفی / مصنف فراہم کردہ

یہ ایک واضح بہتری ہے، لیکن پھر بھی بالکل حقیقت پسندانہ نہیں ہے۔ جیسا کہ ہمیشہ ہوتا رہا ہے، ہاتھوں اور کانوں کی مشکل جیومیٹری جعل سازی کے نشانات کو تلاش کرنے کے لیے اچھی جگہیں ہیں- حالانکہ اس میڈیم میں ہم ناممکن روشنی کے بارے میں بتانے کے بجائے مقامی جیومیٹری کو دیکھ رہے ہیں۔

اس کے علاوہ اور بھی اشارے ہوسکتے ہیں۔ اگر ہم احتیاط سے کمرے کی تعمیر نو کریں تو کیا کونے مربع ہوں گے؟ کیا شیلفیں معنی رکھتی ہیں؟ ایک فرانزک ماہر جو ڈیجیٹل تصویروں کی جانچ کرتا تھا شاید اس پر کال کر سکتا ہے۔

ہم اب اپنی آنکھوں پر یقین نہیں کر سکتے

اگر ہم ٹیکسٹ ٹو امیج سسٹم کے علم کو بڑھاتے ہیں تو یہ اور بھی بہتر کر سکتا ہے۔ آپ موجودہ تربیت کی تکمیل کے لیے اپنی بیان کردہ تصاویر شامل کر سکتے ہیں۔ یہ عمل کے طور پر جانا جاتا ہے متنی الٹا.

حال ہی میں، گوگل نے جاری کیا ہے ڈریم بوتھمخصوص لوگوں، اشیاء، یا یہاں تک کہ آرٹ اسٹائل کو ٹیکسٹ ٹو امیج AI سسٹمز میں انجیکشن کرنے کا ایک متبادل، زیادہ نفیس طریقہ۔

اس عمل کے لیے ہیوی ڈیوٹی ہارڈ ویئر کی ضرورت ہوتی ہے، لیکن نتائج حیران کن ہیں۔ Reddit پر کچھ زبردست کام شیئر ہونا شروع ہو گیا ہے۔ فوٹو دیکھو نیچے پوسٹ میں جو ڈریم بوتھ میں ڈالی گئی تصاویر اور اسٹیبل ڈفیوژن سے حقیقت پسندانہ جعلی تصاویر دکھاتا ہے۔



ہم اب اپنی آنکھوں پر یقین نہیں کر سکتے، لیکن ہم اب بھی فرانزک ماہرین پر بھروسہ کر سکتے ہیں، کم از کم ابھی کے لیے۔ یہ مکمل طور پر ممکن ہے کہ مستقبل کے نظاموں کو جان بوجھ کر انہیں بھی بیوقوف بنانے کے لیے تربیت دی جائے۔

ہم تیزی سے ایک ایسے دور میں جا رہے ہیں جہاں کامل فوٹو گرافی اور یہاں تک کہ ویڈیو بھی عام ہو جائے گی۔ وقت بتائے گا کہ یہ کتنا اہم ہوگا، لیکن اس دوران یہ Cottingley Fairy فوٹوز کے سبق کو یاد رکھنے کے قابل ہے—بعض اوقات لوگ صرف یقین کرنا چاہتے ہیں، یہاں تک کہ واضح جعلی ہونے پر بھی۔گفتگو

یہ مضمون شائع کی گئی ہے گفتگو تخلیقی العام لائسنس کے تحت. پڑھو اصل مضمون.

تصویری کریڈٹ: برینڈن مرفی/author فراہم کی

ٹائم اسٹیمپ:

سے زیادہ یکسانیت مرکز