יצירת תמונות בינה מלאכותית מתקדמת במהירויות אסטרונומיות. האם אנחנו עדיין יכולים לדעת אם תמונה מזויפת? PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

יצירת תמונות בינה מלאכותית מתקדמת במהירויות אסטרונומיות. האם אנחנו עדיין יכולים לדעת אם תמונה מזויפת?

צילום מזויף אינו דבר חדש. בשנות ה-1910, הסופר הבריטי ארתור קונאן דויל הוליך שולל על ידי שתי אחיות בגיל בית ספר שהפיקו תצלומים של פיות אלגנטיות מתהוללות בגינה שלהן.

הראשון מבין חמשת התצלומים 'פיות קוטלינג', שצולמו על ידי אלסי רייט ב-1917. קרדיט תמונה: ויקיפדיה

היום קשה להאמין שהתמונות האלה יכלו להטעות מישהו, אבל רק בשנות ה-1980 למומחה בשם ג'פרי קראולי היה האומץ ליישם ישירות את הידע שלו בצילום קולנוע ולהסיק את המובן מאליו.

התמונות היו מזויפות, כפי שהודתה מאוחר יותר על ידי אחת האחיות עצמן.

תמונה קצת מוזרה של גבר חייכן מחזיק מצלמת צילום אולדסקול
בשנת 1982 ג'פרי קראולי הסיק שתצלומי הפיות היו מזויפים. כך גם זה. קרדיט תמונה: ברנדן מרפי / המחבר סיפק

ציד אחר חפצים ושכל ישר

צילום דיגיטלי פתח שפע של טכניקות עבור מזויפים ובלשים כאחד.

בדיקה משפטית של תמונות חשודות בימינו כוללת ציד אחר תכונות הטמונות בצילום דיגיטלי, כמו בדיקה מטא נתונים מוטבעים בתמונות, באמצעות תוכנות כגון Adobe Photoshop לתיקון עיוותים בתמונות, וכן מחפש סימנים מובהקים של מניפולציה, כגון אזורים המוכפלים כדי לטשטש תכונות מקוריות.

לפעמים עריכות דיגיטליות עדינות מכדי לזהות, אך מזנקות לעין כאשר אנו מכוונים את אופן הפצת הפיקסלים הבהירים והכהים. לדוגמה, בשנת 2010 נאס"א פרסמה א תמונה של ירחי שבתאי דיונה וטיטאן. זה לא היה מזויף בשום אופן, אבל נוקה כדי להסיר חפצים תועים - שהצליחו תשומת לבם של חוקרי קונספירציה.

מעניין, הכנסתי את התמונה לפוטושופ. האיור שלהלן משחזר בערך איך זה נראה.

צילום מסך של מסך עריכת תמונה עם תרשימים להתאמה של כהה ואור
סימולציה המראה כיצד ניתן לזהות עריכה כאשר רמות האור והחושך מותאמות. קרדיט תמונה: ברנדן מרפי / המחבר סיפק

רוב התצלומים הדיגיטליים הם בפורמטים דחוסים כגון JPEG, מצומצמים על ידי הסרת חלק ניכר מהמידע שנלכד על ידי המצלמה. אלגוריתמים סטנדרטיים מבטיחים שלמידע שהוסר יש השפעה מינימלית גלויה - אך הוא משאיר עקבות.

הדחיסה של כל אזור בתמונה תהיה תלויה במתרחש בתמונה ובהגדרות המצלמה הנוכחיות; כאשר תמונה מזויפת משלבת מספר מקורות, לעתים קרובות ניתן לזהות זאת על ידי ניתוח קפדני של חפצי הדחיסה.

מתודולוגיה משפטית מסויימת קשורה מעט לפורמט של תמונה, אבל היא בעצם עבודת בילוש חזותי. האם כולם בתצלום מוארים באותה צורה? האם צללים והשתקפויות הגיוניים? האם אוזניים וידיים מראים אור וצל במקומות הנכונים? מה משתקף בעיני אנשים? האם כל הקווים והזוויות של החדר יסתכמו אם נעצב את הסצנה בתלת מימד?

ארתור קונאן דויל אולי התבדה בתמונות פיות, אבל אני חושב שהיצירה שלו שרלוק הולמס תהיה ממש בבית בעולם של ניתוח תמונות פורנזיות.

עידן חדש של בינה מלאכותית

אל האני הפיצוץ הנוכחי של תמונות נוצר על ידי טקסט לתמונה בינה מלאכותית הכלים הוא במובנים רבים יותר קיצוני מהמעבר מקולנוע לצילום דיגיטלי.

כעת אנו יכולים להעלות כל תמונה שנרצה, רק על ידי הקלדה. תמונות אלו אינן תמונות פרנקן שנוצרו על ידי שילוב של גושים קיימים של פיקסלים. אלו תמונות חדשות לגמרי עם התוכן, האיכות והסגנון שצוינו.

עד לאחרונה, לרשתות העצבים המורכבות המשמשות ליצירת תמונות אלו הייתה זמינות מוגבלת לציבור. זה השתנה ב-23 באוגוסט 2022, עם שחרורו לציבור של דיפוזיה יציבה בקוד פתוח. כעת כל מי שיש לו כרטיס גרפי Nvidia ברמת המשחקים במחשב שלו יכול ליצור תוכן תמונה של AI ללא כל מעבדת מחקר או שמירת סף עסקית של פעילותו.

זה גרם לרבים לשאול, "האם נוכל להאמין שוב למה שאנו רואים באינטרנט?". זה תלוי.

בינה מלאכותית של טקסט לתמונה מקבלת את החכמים שלו מאימון - ניתוח של מספר רב של זוגות תמונה/כיתוב. החוזקות והחולשות של כל מערכת נגזרות בחלקן מהתמונות שהיא אומנה עליהן. הנה דוגמה: כך רואה Stable Diffusion את ג'ורג' קלוני עושה את הגיהוץ שלו.

תמונה קצת מוזרה של גבר עם תווי פנים מעוותים אוחז במגבת לבנה
זה ג'ורג' קלוני שמגהץ... או שזה נכון? קרדיט תמונה: ברנדן מרפי / המחבר סיפק

זה רחוק מלהיות מציאותי. כל מה ש-Stable Diffusion צריך להמשיך הוא המידע שהיא למדה, ולמרות שברור שהיא ראתה את ג'ורג' קלוני ויכולה לקשר את מחרוזת האותיות הזו לתכונותיו של השחקן, זה לא מומחה לקלוני.

עם זאת, זה היה רואה ומעכל הרבה יותר תמונות של גברים בגיל העמידה באופן כללי, אז בואו נראה מה קורה כשאנחנו מבקשים גבר גנרי בגיל העמידה באותו תרחיש.

תמונה קצת מוזרה של גבר בגיל העמידה עם תווי פנים מעוגלים מביט במצלמה ומחזיק חולצה
לא-ג'ורג'-קלוני עושה את הגיהוץ שלו. קרדיט תמונה: ברנדן מרפי / המחבר סיפק

זהו שיפור ברור, אך עדיין לא ממש ריאלי. כפי שהיה תמיד המקרה, הגיאומטריה המסובכת של הידיים והאוזניים הן מקומות טובים לחפש סימנים של זיוף - אם כי במדיום הזה אנחנו מסתכלים על הגיאומטריה המרחבית ולא על תאורה בלתי אפשרית.

יכול להיות שיש עוד רמזים. אם נשקם בקפידה את החדר, האם הפינות יהיו מרובעות? האם המדפים יהיו הגיוניים? מומחה לזיהוי פלילי הרגיל לבחון תצלומים דיגיטליים יכול כנראה להתקשר על כך.

אנחנו כבר לא יכולים להאמין לעינינו

אם נרחיב את הידע של מערכת טקסט לתמונה, היא יכולה לעשות אפילו טוב יותר. אתה יכול להוסיף תמונות מתוארות משלך כדי להשלים את ההכשרה הקיימת. תהליך זה ידוע בשם היפוך טקסטואלי.

לאחרונה, גוגל פרסמה תא חלומות, שיטה חלופית ומתוחכמת יותר להזרקת אנשים, חפצים או אפילו סגנונות אמנות ספציפיים למערכות AI של טקסט לתמונה.

תהליך זה דורש חומרה כבדה, אך התוצאות מדהימות. כמה עבודות נהדרות החלו להיות משותף ב- Reddit. תסתכל על התמונות בפוסט למטה שמציגות תמונות שהוכנסו ל-DreamBooth ותמונות מזויפות ריאליסטיות מ-Stable Diffusion.



אנחנו כבר לא מאמינים למראה עינינו, אבל אולי עדיין נוכל לסמוך על אלה של מומחים לזיהוי פלילי, לפחות בינתיים. יתכן בהחלט שמערכות עתידיות יוכשרו בכוונה כדי לשטות גם בהן.

אנחנו עוברים במהירות לעידן שבו צילום מושלם ואפילו וידאו יהיו נפוצים. הזמן יגיד כמה זה יהיה משמעותי, אבל בינתיים כדאי לזכור את הלקח של תמונות פיות קוטלינג - לפעמים אנשים פשוט רוצים להאמין, אפילו בזיופים ברורים.שיחה

מאמר זה פורסם מחדש מתוך שיחה תחת רישיון Creative Commons. קרא את ה מאמר מקורי.

תמונת אשראי: ברנדן מרפי / אסיפק סיפוק

בול זמן:

עוד מ רכזת הסינגולריות