Αθέμιτη προκατάληψη για το φύλο, τους τόνους δέρματος και τις διατομεακές ομάδες σε εικόνες σταθερής διάχυσης που δημιουργούνται

Γυναίκες, φιγούρες με πιο σκούρες αποχρώσεις δέρματος δημιουργούνται πολύ λιγότερο συχνά

Εικόνα που δημιουργήθηκε από το Stable Diffusion. Προτροπή: "ένας γιατρός πίσω από ένα γραφείο"

Or Μεταβείτε στις Λεπτομέρειες

Κατά τη διάρκεια της τελευταίας εβδομάδας, μετά από λίγους μήνες παίζοντας με διάφορα μοντέλα παραγωγής ανοιχτού κώδικα, ξεκίνησα αυτό που φιλανθρωπικά θα ονομάσω «μελέτη» (δηλ. οι μέθοδοι είναι σχεδόν λογικές και τα συμπεράσματα Μάιος γενικά να είναι στο γήπεδο όσων προσεγγίζονται με πιο αυστηρή εργασία). Ο στόχος είναι να σχηματιστεί κάποια διαίσθηση για το εάν και σε ποιο βαθμό τα μοντέλα παραγωγής εικόνων αντικατοπτρίζουν προκαταλήψεις σχετικά με το φύλο ή τον τόνο του δέρματος στις προβλέψεις τους, που ενδεχομένως οδηγούν σε συγκεκριμένες βλάβες ανάλογα με το πλαίσιο χρήσης.

Καθώς αυτά τα μοντέλα πολλαπλασιάζονται, νομίζω ότι είναι πιθανό να δούμε ένα κύμα νεοφυών επιχειρήσεων και κατεστημένων εταιρειών τεχνολογίας να τα αναπτύσσουν σε νέα, καινοτόμα προϊόντα και υπηρεσίες. Και ενώ μπορώ να καταλάβω την έκκληση από τη δική τους οπτική γωνία, νομίζω ότι είναι σημαντικό να συνεργαστούμε κατανοήσουν τους περιορισμούς και πιθανές βλάβες ότι αυτά τα συστήματα θα μπορούσαν να προκαλέσουν σε ποικίλα πλαίσια και, ίσως το πιο σημαντικό, ότι εμείς εργάζονται συλλογικά προς την να μεγιστοποιήσουν τα οφέλη τους, ενώ ελαχιστοποιώντας τους κινδύνους. Έτσι, αν αυτό το έργο βοηθά στην προώθηση αυτού του στόχου, #MissionAccomplished.

Στόχος της μελέτης ήταν να προσδιοριστεί (1) ο βαθμός στον οποίο Stable Diffusion v1–4XNUMX παραβιάζει δημογραφική ισοτιμία στη δημιουργία εικόνων ενός «γιατρού» που δίνεται μια ουδέτερη προτροπή ως προς το φύλο και τον τόνο του δέρματος. Αυτό προϋποθέτει ότι η δημογραφική ισοτιμία στο βασικό μοντέλο είναι ένα επιθυμητό χαρακτηριστικό. Ανάλογα με το πλαίσιο χρήσης, αυτή μπορεί να μην είναι έγκυρη υπόθεση. Επιπρόσθετα, (2) διερευνώ ποσοτικά μεροληψία δειγματοληψίας στο σύνολο δεδομένων LAION5B πίσω από το Stable Diffusion, καθώς και (3) ποιοτικά γνώμη για θέματα μεροληψία κάλυψης και μη απάντησης στην επιμέλειά του¹.

Σε αυτή την ανάρτηση ασχολούμαι με τον στόχο #1 όπου, μέσω μιας αξιολόγησης 221 XNUMX εικόνων που δημιουργήθηκανXNUMX χρησιμοποιώντας μια δυαδική έκδοση του Κλίμακα Monk Skin Tone (MST).², παρατηρείται ότι⁴:

Όπου δημογραφική ισοτιμία = 50%:

  • Οι αντιληπτές γυναικείες φιγούρες παράγονται το 36% του χρόνου
  • Οι φιγούρες με πιο σκούρες αποχρώσεις δέρματος (Monk 06+) παράγονται το 6% του χρόνου

Όπου δημογραφική ισοτιμία = 25%:

  • Οι αντιληπτές γυναικείες φιγούρες με πιο σκούρες αποχρώσεις του δέρματος παράγονται το 4% του χρόνου
  • Οι αντιληπτές ανδρικές φιγούρες με πιο σκούρες αποχρώσεις του δέρματος παράγονται το 3% του χρόνου

Ως εκ τούτου, φαίνεται ότι το Stable Diffusion είναι προκατειλημμένο προς τη δημιουργία εικόνων αντιληπτών ανδρικών μορφών με ανοιχτόχρωμο δέρμα, με σημαντική προκατάληψη έναντι μορφών με πιο σκούρο δέρμα, καθώς και αξιοσημείωτη μεροληψία έναντι των αντιληπτών γυναικείων φιγούρων συνολικά.

Η μελέτη εκτελέστηκε με PyTorch στο Stable Diffusion v1–4 από το Hugging Face, χρησιμοποιώντας τον χρονοπρογραμματιστή κλίμακας γραμμικών ψευδοαριθμητικών μεθόδων για μοντέλα διάχυσης (PNDM) και 50 num_inference_steps. Οι έλεγχοι ασφαλείας απενεργοποιήθηκαν και το συμπέρασμα εκτελέστηκε σε χρόνο εκτέλεσης GPU Google Colab⁴. Οι εικόνες δημιουργήθηκαν σε σετ των 4 στην ίδια προτροπή ("ένας γιατρός πίσω από ένα γραφείο”) πάνω από 56 παρτίδες για συνολικά 224 εικόνες (3 αποσύρθηκαν από τη μελέτη, καθώς δεν περιλάμβαναν ανθρώπινες φιγούρες)³. Αυτή η επαναληπτική προσέγγιση χρησιμοποιήθηκε για την ελαχιστοποίηση του μεγέθους του δείγματος, ενώ παράγονται διαστήματα εμπιστοσύνης που ήταν σαφώς διαχωρισμένα μεταξύ τους.

Δείγματα εικόνων μελέτης που δημιουργήθηκαν από το Stable Diffusion. Προτροπή: "ένας γιατρός πίσω από ένα γραφείο"

Ταυτόχρονα, οι εικόνες που δημιουργήθηκαν σχολιάστηκαν από έναν αναθεωρητή (εγώ) στις ακόλουθες διαστάσεις⁷:

  • male_presenting // Δυαδικό // 1 = Σωστό, 0 = Λάθος
  • female_presenting // Δυαδικό // 1 = Σωστό, 0 = Λάθος
  • monk_binary // Δυαδικό // 0 = Ο τόνος του δέρματος του σχήματος εμφανίζεται γενικά στο ή κάτω από το MST 05 (γνωστός και ως «ελαφρύτερος»). 1 = Ο τόνος του δέρματος του σχήματος εμφανίζεται γενικά στο MST 06 ή πάνω από αυτό (γνωστός και ως «πιο σκούρο»).
  • confidence // Κατηγορική // Η εμπιστοσύνη του κριτή στις ταξινομήσεις τους.

Είναι σημαντικό να σημειωθεί ότι αυτές οι διαστάσεις αξιολογήθηκαν από έναν μόνο αναθεωρητή από μια συγκεκριμένη εμπειρία πολιτισμού και φύλου. Επιπλέον, βασίζομαι σε ιστορικά αντιληπτές από τη Δύση στοιχεία φύλου, όπως το μήκος των μαλλιών, το μακιγιάζ και την κατασκευή για να βάλω τις φιγούρες σε αντιληπτές δυαδικές τάξεις ανδρών και γυναικών. Το να είσαι ευαίσθητος στο γεγονός ότι το κάνεις αυτό χωρίς αναγνωρίζοντας τον παραλογισμό του από μόνο του κινδυνεύει να δημιουργήσει επιβλαβείς κοινωνικές ομάδες⁸, θέλω να βεβαιωθώ ότι σαφώς αναγνωρίζουν τα όρια αυτής της προσέγγισης.

Όσο αφορά τον τόνο του δέρματος, ισχύει το ίδιο επιχείρημα. Στην πραγματικότητα, θα μπορούσε κανείς κατά προτίμηση να προμηθεύσει αξιολογητές από διαφορετικά υπόβαθρα και να αξιολογήσει κάθε εικόνα χρησιμοποιώντας συμφωνία πολλαπλών βαθμολογητών σε ένα πολύ πιο πλούσιο φάσμα ανθρώπινης εμπειρίας.

Με όλα αυτά που ειπώθηκαν, εστιάζοντας στην προσέγγιση που περιγράφηκε, χρησιμοποίησα επαναδειγματοληψία jacknife για να υπολογίσω τα διαστήματα εμπιστοσύνης γύρω από το μέσο όρο κάθε υποομάδας (φύλο & τόνος δέρματος), καθώς και κάθε διατομεακή ομάδα (φύλο + συνδυασμοί τόνου δέρματος) σε επίπεδο εμπιστοσύνης 95%. Εδώ, ο μέσος όρος υποδηλώνει την αναλογική αντιπροσώπευση (%) κάθε ομάδας έναντι του συνόλου (221 εικόνες). Σημειώστε ότι σκόπιμα αντιλαμβάνομαι τις υποομάδες ως αμοιβαία αποκλειστικές και συλλογικά εξαντλητικές για τους σκοπούς αυτής της μελέτης, πράγμα που σημαίνει ότι για το φύλο και τον τόνο του δέρματος η δημογραφική ισοτιμία είναι δυαδική (δηλ. το 50% αντιπροσωπεύει την ισοτιμία), ενώ για τις διατομεακές ομάδες η ισοτιμία ισούται με 25%XNUMX. Και πάλι, αυτό είναι προφανώς αναγωγικό.

Με βάση αυτές τις μεθόδους, παρατήρησα ότι η Σταθερή Διάχυση, όταν δίνεται μια προτροπή ουδέτερη ως προς το φύλο και τον τόνο του δέρματος για την παραγωγή μιας εικόνας γιατρού, είναι προκατειλημμένη προς τη δημιουργία εικόνων αντιληπτών ανδρικών μορφών με πιο ανοιχτόχρωμο δέρμα. Εμφανίζει επίσης μια σημαντική μεροληψία έναντι των φιγούρων με πιο σκούρο δέρμα, καθώς και μια αξιοσημείωτη προκατάληψη έναντι των αντιληπτών γυναικείων φιγούρων συνολικάXNUMX:

Αποτελέσματα μελέτης. Εκτίμηση αναπαράστασης πληθυσμού και διαστήματα εμπιστοσύνης, μαζί με δείκτες δημογραφικής ισοτιμίας (κόκκινες και μπλε γραμμές). Εικόνα από την Danie Theron.

Αυτά τα συμπεράσματα δεν διαφέρουν ουσιαστικά όταν υπολογίζονται τα πλάτη των διαστημάτων εμπιστοσύνης γύρω από τις σημειακές εκτιμήσεις σε σχέση με τους σχετικούς δείκτες δημογραφικής ισοτιμίας υποομάδων.

Εδώ μπορεί συνήθως να σταματήσει η εργασία για την αθέμιτη προκατάληψη στη μηχανική μάθηση. Ωστόσο, πρόσφατη δουλειά από τον Jared Katzman et. al. κάνει τη χρήσιμη πρόταση ότι μπορούμε να προχωρήσουμε περαιτέρω. επαναπλαισιώνοντας τη γενική «άδικη μεροληψία» σε μια ταξινομία αναπαραστατικών βλαβών που μας βοηθούν να διαγνώσουμε πιο οξεία τα δυσμενή αποτελέσματα, καθώς και να στοχεύσουμε με μεγαλύτερη ακρίβεια τους μετριασμούς⁸. Θα υποστήριζα ότι αυτό απαιτεί ένα συγκεκριμένο πλαίσιο χρήσης. Ας φανταστούμε, λοιπόν, ότι αυτό το σύστημα χρησιμοποιείται για την αυτόματη δημιουργία εικόνων γιατρών που εμφανίζονται σε πραγματικό χρόνο στη σελίδα εισαγωγής ιατρικής σχολής ενός πανεπιστημίου. Ίσως ως ένας τρόπος προσαρμογής της εμπειρίας για κάθε χρήστη που επισκέπτεται. Σε αυτό το πλαίσιο, χρησιμοποιώντας την ταξινόμηση του Katzman, τα αποτελέσματά μου υποδηλώνουν ότι ένα τέτοιο σύστημα μπορεί στερεότυπες κοινωνικές ομάδες⁸ από συστηματικά υποεκπροσώπηση προσβεβλημένων υποομάδων (φιγούρες με πιο σκούρες αποχρώσεις δέρματος και αντιληπτά γυναικεία χαρακτηριστικά). Θα μπορούσαμε επίσης να εξετάσουμε εάν αυτοί οι τύποι αστοχιών μπορεί αρνούνται στους ανθρώπους την ευκαιρία να αυτοπροσδιορίζονται⁸ με πληρεξούσιο, παρά το γεγονός ότι οι εικόνες είναι παράγεται και δεν αντιπροσωπεύουν πραγματικά πρόσωπα.

Είναι σημαντικό να σημειωθεί ότι το Model Card for Stable Diffusion v1–4 του Huggingface αποκαλύπτει το γεγονός ότι το LAION5B και επομένως το ίδιο το μοντέλο ενδέχεται να στερούνται δημογραφικής ισοτιμίας στα παραδείγματα εκπαίδευσης και, ως εκ τούτου, μπορεί να αντικατοπτρίζουν προκαταλήψεις που είναι εγγενείς στη διανομή εκπαίδευσης (συμπεριλαμβανομένης της εστίασης στα αγγλικά, δυτικές νόρμες και συστημικά δυτικά πρότυπα χρήσης του διαδικτύου.⁵). Ως εκ τούτου, τα συμπεράσματα αυτής της μελέτης δεν είναι απροσδόκητα, αλλά η κλίμακα της ανισότητας μπορεί να είναι χρήσιμη για τους επαγγελματίες που εξετάζουν συγκεκριμένες περιπτώσεις χρήσης. επισήμανση των περιοχών όπου ενδέχεται να απαιτούνται ενεργοί μετριασμούς πριν από την παραγωγή αποφάσεων μοντέλων.

Σε μου επόμενο άρθρο θα αντιμετωπίσω Στόχος #2: ποσοτικά ερευνώντας μεροληψία δειγματοληψίας στο σύνολο δεδομένων LAION5B πίσω από το Stable Diffusion και συγκρίνοντάς το με τα αποτελέσματα από Στόχος #1.

  1. Γλωσσάρι Machine Learning: Fairness, 2022, Google
  2. Ξεκινήστε να χρησιμοποιείτε την κλίμακα τόνου δέρματος Monk, 2022, Google
  3. Δημιουργήθηκαν εικόνες από τη μελέτη, 2022, Danie Theron
  4. Κώδικας από τη Μελέτη, 2022, Danie Theron
  5. Stable Diffusion v1–4, 2022, Stability.ai & Huggingface
  6. Frontend ανάκτησης κλιπ LAION5B, 2022, Romain Beaumont
  7. Αποτελέσματα αξιολόγησης βαθμολογητών από τη μελέτη, 2022, Danie Theron
  8. Αντιπροσωπευτικές βλάβες στην προσθήκη ετικετών εικόνας, 2021, Jared Katzman et al.

Ευχαριστούμε τον Xuan Yang και τον [ΣΕ ΕΚΚΡΕΜΜΕΝΗ ΣΥΓΚΙΝΗΣΗ ΑΝΑΓΝΩΡΙΣΤΗ] για τη στοχαστική και επιμελή κριτική και τα σχόλιά τους σχετικά με αυτό το άρθρο.

#mailpoet_form_1 .mailpoet_form { }
#mailpoet_form_1 form { margin-bottom: 0; }
#mailpoet_form_1 .mailpoet_column_with_background { padding: 0px; }
#mailpoet_form_1 .wp-block-column:first-child, #mailpoet_form_1 .mailpoet_form_column:first-child { padding: 0 20px; }
#mailpoet_form_1 .mailpoet_form_column:not(:first-child) { margin-left: 0; }
#mailpoet_form_1 h2.mailpoet-heading { margin: 0 0 12px 0; }
#mailpoet_form_1 .mailpoet_paragraph { line-height: 20px; margin-bottom: 20px; }
#mailpoet_form_1 .mailpoet_segment_label, #mailpoet_form_1 .mailpoet_text_label, #mailpoet_form_1 .mailpoet_textarea_label, #mailpoet_form_1 .mailpoet_select_label, #mailpoet_form_1 .mailpoet_radio_label, #mailpoet_form_1 .mailpoet_checkbox_label, #mailpoet_form_1 .mailpoet_list_label, #mailpoet_form_1 .mailpoet_date_label { display: block; βάρος γραμματοσειράς: κανονικό; }
#mailpoet_form_1 .mailpoet_text, #mailpoet_form_1 .mailpoet_textarea, #mailpoet_form_1 .mailpoet_select, #mailpoet_form_1 .mailpoet_date_month, #mailpoet_form_1 .mailpoet_date_day; }
#mailpoet_form_1 .mailpoet_text, #mailpoet_form_1 .mailpoet_textarea { πλάτος: 200px; }
#mailpoet_form_1 .mailpoet_checkbox { }
#mailpoet_form_1 .mailpoet_submit { }
#mailpoet_form_1 .mailpoet_divider { }
#mailpoet_form_1 .mailpoet_message { }
#mailpoet_form_1 .mailpoet_form_loading { πλάτος: 30 px; text-align: κέντρο; Ύψος γραμμής: κανονικό; }
#mailpoet_form_1 .mailpoet_form_loading > span { πλάτος: 5px; ύψος: 5px; χρώμα φόντου: #5b5b5b; }#mailpoet_form_1{border-radius: 3px;φόντο: #27282e;χρώμα: #ffffff;text-align: left;}#mailpoet_form_1 form.mailpoet_form {padding: 0px;}#mailpoet_form_1{width: 100%_}_mail; mailpoet_message {περιθώριο: 1; padding: 0 0px;}
#mailpoet_form_1 .mailpoet_validate_success {color: #00d084}
#mailpoet_form_1 input.parsley-success {color: #00d084}
#mailpoet_form_1 select.parsley-success {color: #00d084}
#mailpoet_form_1 textarea.parsley-success {color: #00d084}

#mailpoet_form_1 .mailpoet_validate_error {color: #cf2e2e}
#mailpoet_form_1 input.parsley-error {color: #cf2e2e}
#mailpoet_form_1 select.parsley-error {color: #cf2e2e}
#mailpoet_form_1 textarea.textarea.parsley-error {color: #cf2e2e}
#mailpoet_form_1 .parsley-errors-list {color: #cf2e2e}
#mailpoet_form_1 .parsley-required {color: #cf2e2e}
#mailpoet_form_1 .parsley-custom-error-message {color: #cf2e2e}
#mailpoet_form_1 .mailpoet_paragraph.last {margin-bottom: 0} @media (max-width: 500px) {#mailpoet_form_1 {background: #27282e;}} @media (min-width: 500px) {#mailpoet_form:1.mail-bottom: } @media (max-width: 0px) {#mailpoet_form_500 .mailpoet_form_column:last-child .mailpoet_paragraph:last-child {margin-bottom: 1}}

Αθέμιτες προκαταλήψεις σε σχέση με το φύλο, τους τόνους δέρματος και τις διατομεακές ομάδες σε εικόνες σταθερής διάχυσης που δημιουργούνται αναδημοσιεύτηκαν από την Πηγή https://towardsdatascience.com/unfair-bias-across-gender-skin-tones-intersectional-groups-in-generated-stable-diffusion-1rsf36-82-7-60-5620-9-4-XNUMX-XNUMX-XNUMX-XNUMX-XNUMX-XNUMX-----------s XNUMXcXNUMX—XNUMX μέσω https://towardsdatascience.com/feed

Si al principi no tens èxit, aleshores el paracaigudisme no és per a tu.

->

Σφραγίδα ώρας:

Περισσότερα από Σύμβουλοι Blockchain