Το AI Image Generation προχωρά με αστρονομικές ταχύτητες. Μπορούμε ακόμα να πούμε αν μια εικόνα είναι ψεύτικη; Ευφυΐα Δεδομένων PlatoBlockchain. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Το AI Image Generation προχωρά με αστρονομικές ταχύτητες. Μπορούμε ακόμα να πούμε αν μια εικόνα είναι ψεύτικη;

Η ψεύτικη φωτογραφία δεν είναι κάτι καινούργιο. Στη δεκαετία του 1910, ο Βρετανός συγγραφέας Άρθουρ Κόναν Ντόιλ εξαπατήθηκε περίφημα από δύο αδερφές σχολικής ηλικίας που είχαν βγάλει φωτογραφίες με κομψές νεράιδες που έβγαζαν τον κήπο τους.

Η πρώτη από τις πέντε φωτογραφίες «Cottingley Fairies», τραβηγμένες από την Elsie Wright το 1917. Πίστωση εικόνας: Wikipedia

Σήμερα είναι δύσκολο να πιστέψουμε ότι αυτές οι φωτογραφίες θα μπορούσαν να ξεγελάσουν κανέναν, αλλά μόλις τη δεκαετία του 1980 ένας ειδικός ονόματι Geoffrey Crawley είχε το θράσος να εφαρμόσει άμεσα τις γνώσεις του στη φωτογραφία ταινιών και να συναγάγει το προφανές.

Οι φωτογραφίες ήταν ψεύτικες, όπως παραδέχτηκε αργότερα μια από τις ίδιες τις αδερφές.

Μια ελαφρώς παράξενη εικόνα ενός χαμογελαστού άνδρα που κρατά μια φωτογραφική μηχανή oldschool
Το 1982 ο Geoffrey Crawley συμπέρανε ότι οι φωτογραφίες της νεράιδας ήταν ψεύτικες. Έτσι είναι και αυτό. Πίστωση εικόνας: Brendan Murphy / παρέχεται συγγραφέας

Κυνήγι αντικειμένων και κοινή λογική

Η ψηφιακή φωτογραφία έχει ανοίξει μια πληθώρα τεχνικών τόσο για παραποιητές όσο και για ντετέκτιβ.

Η ιατροδικαστική εξέταση ύποπτων εικόνων στις μέρες μας περιλαμβάνει το κυνήγι για ιδιότητες εγγενείς στην ψηφιακή φωτογραφία, όπως η εξέταση μεταδεδομένα ενσωματωμένα στις φωτογραφίες, χρησιμοποιώντας λογισμικό όπως το Adobe Photoshop για τη διόρθωση παραμορφώσεων σε εικόνες και ψάχνοντας για ενδεικτικά σημάδια χειραγώγησης, όπως η αντιγραφή περιοχών για την απόκρυψη των αρχικών χαρακτηριστικών.

Μερικές φορές οι ψηφιακές επεξεργασίες είναι πολύ ανεπαίσθητες για να ανιχνευθούν, αλλά εμφανίζονται όταν προσαρμόζουμε τον τρόπο κατανομής των φωτεινών και σκούρων εικονοστοιχείων. Για παράδειγμα, το 2010 η NASA κυκλοφόρησε ένα φωτογραφία των φεγγαριών του Κρόνου Διόνη και Τιτάνα. Δεν ήταν σε καμία περίπτωση ψεύτικο, αλλά είχε καθαριστεί για να αφαιρεθούν αδέσποτα τεχνουργήματα—το οποίο έγινε την προσοχή των συνωμοσιολόγων.

Περίεργος, έβαλα την εικόνα στο Photoshop. Η παρακάτω εικόνα αναπαράγει κατά προσέγγιση πώς φαινόταν αυτό.

Στιγμιότυπο οθόνης επεξεργασίας εικόνας με γραφήματα για ρύθμιση σκούρου και φωτός
Μια προσομοίωση που δείχνει πώς μπορεί να εντοπιστεί η επεξεργασία όταν ρυθμίζονται τα επίπεδα φωτός και σκοταδιού. Πίστωση εικόνας: Brendan Murphy / παρέχεται συγγραφέας

Οι περισσότερες ψηφιακές φωτογραφίες είναι σε συμπιεσμένες μορφές, όπως το JPEG, μειώνονται αφαιρώντας πολλές από τις πληροφορίες που καταγράφονται από τη φωτογραφική μηχανή. Οι τυποποιημένοι αλγόριθμοι διασφαλίζουν ότι οι πληροφορίες που αφαιρούνται έχουν ελάχιστη ορατή επίδραση—αλλά αφήνουν ίχνη.

Η συμπίεση οποιασδήποτε περιοχής μιας εικόνας θα εξαρτηθεί από το τι συμβαίνει στην εικόνα και τις τρέχουσες ρυθμίσεις της κάμερας. όταν μια ψεύτικη εικόνα συνδυάζει πολλαπλές πηγές, είναι συχνά δυνατό να εντοπιστεί από προσεκτική ανάλυση των τεχνουργημάτων συμπίεσης.

Κάποια εγκληματολογική μεθοδολογία έχει ελάχιστη σχέση με τη μορφή μιας εικόνας, αλλά είναι ουσιαστικά οπτική αστυνομική εργασία. Φωτίζονται όλοι στη φωτογραφία με τον ίδιο τρόπο; Έχουν νόημα οι σκιές και οι αντανακλάσεις; Τα αυτιά και τα χέρια δείχνουν φως και σκιά στα σωστά σημεία; Τι αντικατοπτρίζεται στα μάτια των ανθρώπων; Θα αθροίζονταν όλες οι γραμμές και οι γωνίες του δωματίου εάν διαμορφώναμε τη σκηνή σε 3D;

Ο Άρθουρ Κόναν Ντόιλ μπορεί να ξεγελάστηκε από τις νεράιδες φωτογραφίες, αλλά νομίζω ότι το δημιούργημά του ο Σέρλοκ Χολμς θα ήταν στο σπίτι του στον κόσμο της ιατροδικαστικής ανάλυσης φωτογραφιών.

Μια νέα εποχή τεχνητής νοημοσύνης

Η τρέχουσα έκρηξη εικόνων δημιουργήθηκε από κείμενο σε εικόνα τεχνητή νοημοσύνη εργαλεία είναι από πολλές απόψεις πιο ριζοσπαστική από τη στροφή από την ταινία στην ψηφιακή φωτογραφία.

Μπορούμε τώρα να δημιουργήσουμε όποια εικόνα θέλουμε, απλά πληκτρολογώντας. Αυτές οι εικόνες δεν είναι φωτογραφίες-φωτογραφίες που έχουν δημιουργηθεί με τη συγχώνευση προϋπαρχόντων συστάδων pixel. Είναι εντελώς νέες εικόνες με καθορισμένο περιεχόμενο, ποιότητα και στυλ.

Μέχρι πρόσφατα, τα πολύπλοκα νευρωνικά δίκτυα που χρησιμοποιήθηκαν για τη δημιουργία αυτών των εικόνων είχαν περιορισμένη διαθεσιμότητα στο κοινό. Αυτό άλλαξε στις 23 Αυγούστου 2022, με την κυκλοφορία στο κοινό του Stable Diffusion ανοιχτού κώδικα. Τώρα οποιοσδήποτε διαθέτει κάρτα γραφικών Nvidia επιπέδου gaming στον υπολογιστή του μπορεί να δημιουργήσει περιεχόμενο εικόνας AI χωρίς κανένα ερευνητικό εργαστήριο ή επιχειρηματική πύλη να τηρεί τις δραστηριότητές του.

Αυτό ώθησε πολλούς να αναρωτηθούν, «μπορούμε ποτέ να πιστέψουμε ξανά αυτό που βλέπουμε στο διαδίκτυο;". Αυτο εξαρταται.

Η τεχνητή νοημοσύνη κειμένου σε εικόνα αντλεί τις έξυπνες ικανότητές της από την εκπαίδευση — την ανάλυση ενός μεγάλου αριθμού ζευγών εικόνων/ λεζάντων. Τα δυνατά και τα αδύνατα σημεία κάθε συστήματος προέρχονται εν μέρει από τις εικόνες στις οποίες έχει εκπαιδευτεί. Ιδού ένα παράδειγμα: έτσι βλέπει το Stable Diffusion τον George Clooney να κάνει το σιδέρωμα του.

Μια ελαφρώς παράξενη εικόνα ενός άνδρα με παραμορφωμένα χαρακτηριστικά που κρατά μια λευκή πετσέτα
Αυτός ο Τζορτζ Κλούνεϊ κάνει το σιδέρωμα του… ή μήπως; Πίστωση εικόνας: Brendan Murphy / παρέχεται συγγραφέας

Αυτό απέχει πολύ από το ρεαλιστικό. Το μόνο που χρειάζεται να συνεχίσει το Stable Diffusion είναι οι πληροφορίες που έχει μάθει, και ενώ είναι σαφές ότι έχει δει τον George Clooney και μπορεί να συνδέσει αυτή τη σειρά γραμμάτων με τα χαρακτηριστικά του ηθοποιού, δεν είναι ειδικός του Clooney.

Ωστόσο, θα είχε δει και χωνέψει πολλές περισσότερες φωτογραφίες μεσήλικων ανδρών γενικά, οπότε ας δούμε τι συμβαίνει όταν ζητάμε έναν γενικό μεσήλικα στο ίδιο σενάριο.

Μια ελαφρώς παράξενη εικόνα ενός μεσήλικα με στρογγυλεμένα χαρακτηριστικά που κοιτάζει την κάμερα και κρατά ένα πουκάμισο
Όχι-Ο Τζορτζ-Κλούνεϊ κάνει το σιδέρωμα του. Πίστωση εικόνας: Brendan Murphy / παρέχεται συγγραφέας

Αυτή είναι μια σαφής βελτίωση, αλλά ακόμα όχι αρκετά ρεαλιστική. Όπως συνέβαινε πάντα, η περίπλοκη γεωμετρία των χεριών και των αυτιών είναι καλοί χώροι για να αναζητήσετε σημάδια ψεύτικο - αν και σε αυτό το μέσο εξετάζουμε τη χωρική γεωμετρία και όχι τις αφηγήσεις του αδύνατου φωτισμού.

Μπορεί να υπάρχουν και άλλες ενδείξεις. Αν ανακατασκευάζαμε προσεκτικά το δωμάτιο, οι γωνίες θα ήταν τετράγωνες; Θα είχαν νόημα τα ράφια; Ένας ιατροδικαστής που συνηθίζει να εξετάζει ψηφιακές φωτογραφίες θα μπορούσε πιθανώς να το κάνει.

Δεν μπορούμε πια να πιστεύουμε στα μάτια μας

Εάν επεκτείνουμε τις γνώσεις ενός συστήματος κειμένου σε εικόνα, μπορεί να τα πάει ακόμα καλύτερα. Μπορείτε να προσθέσετε τις δικές σας περιγραφόμενες φωτογραφίες για να συμπληρώσετε την υπάρχουσα εκπαίδευση. Αυτή η διαδικασία είναι γνωστή ως κειμενική αντιστροφή.

Πρόσφατα, η Google κυκλοφόρησε Dream Booth, μια εναλλακτική, πιο εξελιγμένη μέθοδος για την ένεση συγκεκριμένων ανθρώπων, αντικειμένων ή ακόμα και στυλ τέχνης σε συστήματα τεχνητής νοημοσύνης από κείμενο σε εικόνα.

Αυτή η διαδικασία απαιτεί υλικό βαρέως τύπου, αλλά τα αποτελέσματα είναι συγκλονιστικά. Κάποια σπουδαία δουλειά έχει αρχίσει να μοιράζεται στο Reddit. Κοιτα τις φωτογραφιες στην παρακάτω ανάρτηση που δείχνουν εικόνες τοποθετημένες στο DreamBooth και ρεαλιστικές ψεύτικες εικόνες από το Stable Diffusion.



Δεν μπορούμε πλέον να πιστεύουμε στα μάτια μας, αλλά μπορεί να είμαστε ακόμα σε θέση να εμπιστευόμαστε αυτά των ιατροδικαστών, τουλάχιστον προς το παρόν. Είναι απολύτως πιθανό ότι μελλοντικά συστήματα θα μπορούσαν να εκπαιδεύονται σκόπιμα για να τα ξεγελάσουν επίσης.

Περνάμε ραγδαία σε μια εποχή όπου η τέλεια φωτογραφία, ακόμη και το βίντεο θα είναι κοινά. Ο χρόνος θα δείξει πόσο σημαντικό θα είναι αυτό, αλλά στο μεταξύ αξίζει να θυμηθούμε το μάθημα των φωτογραφιών του Cottingley Fairy—μερικές φορές οι άνθρωποι θέλουν απλώς να πιστέψουν, ακόμη και σε προφανείς απομιμήσεις.Η Συνομιλία

Αυτό το άρθρο αναδημοσιεύθηκε από το Η Συνομιλία υπό την άδεια Creative Commons. Διαβάστε το αρχικό άρθρο.

Image Credit: Μπρένταν Μέρφι / απαρέχεται uthor

Σφραγίδα ώρας:

Περισσότερα από Κέντρο μοναδικότητας