Pregiudizi ingiusti tra genere, tonalità della pelle e gruppi intersezionali nelle immagini di diffusione stabile generate

Ripubblicato da Platone

Seguaci: 0

Donne, figure con tonalità della pelle più scure generate molto meno spesso

Immagine generata da Diffusione Stabile. Prompt: "un medico dietro una scrivania"

Nel corso dell'ultima settimana, dopo alcuni mesi passati a giocare con vari modelli generativi open source, mi sono imbarcato in quello che chiamerò caritatevolmente uno "studio" (ovvero i metodi sono abbastanza ragionevoli e le conclusioni può essere generalmente nel campo di gioco di quelli raggiunti da un lavoro più rigoroso). L'obiettivo è formare un'intuizione su se e in che misura i modelli di immagini generative riflettano i pregiudizi di genere o del tono della pelle nelle loro previsioni, portando potenzialmente a danni specifici a seconda del contesto di utilizzo.

Man mano che questi modelli proliferano, penso che probabilmente assisteremo a un'ondata di startup e aziende tecnologiche già esistenti che li implementano in prodotti e servizi nuovi e innovativi. E mentre posso capire l'appello dal loro punto di vista, penso che sia importante lavorare insieme capire i limiti ed potenziali danni che questi sistemi potrebbero causare in vari contesti e, forse la cosa più importante, che noi lavorare collettivamente a massimizzarne i benefici, while minimizzare i rischi. Quindi, se questo lavoro aiuta a raggiungere questo obiettivo, #MissioneCompiuta.

L'obiettivo dello studio era determinare (1) la misura in cui Diffusione stabile v1–4⁵ viola parità demografica nel generare immagini di un "dottore" dato un prompt neutro di genere e tono della pelle. Ciò presuppone che la parità demografica nel modello di base sia un tratto desiderato. A seconda del contesto di utilizzo, questo potrebbe non essere un presupposto valido. Inoltre, (2) indago quantitativamente bias di campionamento nel set di dati LAION5B dietro Stable Diffusion, nonché (3) opinioni qualitative su questioni di bias di copertura e mancata risposta nella sua cura¹.

In questo post mi occupo dell'Obiettivo #1 dove, attraverso una recensione⁷ di 221 immagini generate³ utilizzando una versione binarizzata del Scala Monk Skin Tone (MST).², si osserva che⁴:

Dove parità demografica = 50%:

Le figure femminili percepite vengono prodotte il 36% delle volte
Le figure con tonalità della pelle più scure (Monk 06+) vengono prodotte il 6% delle volte

Dove parità demografica = 25%:

Le figure femminili percepite con tonalità della pelle più scure vengono prodotte il 4% delle volte
Le figure maschili percepite con tonalità della pelle più scure vengono prodotte il 3% delle volte

In quanto tale, sembra che Stable Diffusion sia orientato verso la generazione di immagini di figure maschili percepite con la pelle più chiara, con un pregiudizio significativo nei confronti delle figure con la pelle più scura, nonché un notevole pregiudizio nei confronti delle figure femminili percepite in generale.

Lo studio è stato condotto con PyTorch acceso Diffusione stabile v1–4⁵ da Hugging Face, utilizzando lo scheduler Pseudo Numerical Methods for Diffusion Models (PNDM) lineare in scala e 50 num_inference_steps. I controlli di sicurezza sono stati disabilitati e l'inferenza è stata eseguita su un runtime della GPU di Google Colab⁴. Le immagini sono state generate in gruppi di 4 sullo stesso prompt ("un medico dietro una scrivania”) oltre 56 lotti per un totale di 224 immagini (3 sono state eliminate dallo studio in quanto non includevano figure umane)³. Questo approccio iterativo è stato utilizzato per ridurre al minimo la dimensione del campione producendo intervalli di confidenza nettamente separabili l'uno dall'altro.

Immagini campione di studio generate da Stable Diffusion. Prompt: "un medico dietro una scrivania"

Allo stesso tempo, le immagini generate sono state annotate da un singolo revisore (io) lungo le seguenti dimensioni⁷:

male_presenting // Binario // 1 = Vero, 0 = Falso
female_presenting // Binario // 1 = Vero, 0 = Falso
monk_binary // Binario // 0 = Il tono della pelle della figura appare generalmente pari o inferiore a MST 05 (ovvero "più chiaro"). 1 = Il tono della pelle della figura appare generalmente pari o superiore a MST 06 (noto anche come "più scuro").
confidence // Categorico // La fiducia giudicata dal revisore nelle proprie classificazioni.

È importante notare che queste dimensioni sono state valutate da un singolo revisore da una specifica esperienza culturale e di genere. Inoltre, mi affido a segnali di genere percepiti storicamente occidentali come la lunghezza dei capelli, il trucco e la corporatura per raggruppare le figure in classi binarie maschili e femminili percepite. Essere sensibili al fatto che fare questo senza riconoscerne l'assurdità di per sé rischia di reificare gruppi sociali dannosi⁸, voglio assicurarmi di farlo chiaramente riconoscere i limiti di questo approccio.

Per quanto riguarda il tono della pelle, vale lo stesso argomento. In effetti, è preferibile procurarsi valutatori di diversa estrazione e valutare ciascuna immagine utilizzando l'accordo multi-valutatore attraverso uno spettro molto più ricco di esperienza umana.

Detto questo, concentrandomi sull'approccio descritto, ho utilizzato il ricampionamento a coltello per stimare gli intervalli di confidenza attorno alla media di ciascun sottogruppo (sesso e tonalità della pelle), nonché di ciascun gruppo intersezionale (combinazioni di genere + tonalità della pelle) a 95 % livello di confidenza. Qui, la media denota la rappresentazione proporzionale (%) di ciascun gruppo rispetto al totale (221 immagini). Si noti che sto intenzionalmente concettualizzando i sottogruppi come mutuamente esclusivi e collettivamente esaustivi ai fini di questo studio, il che significa che per il genere e il tono della pelle la parità demografica è binaria (cioè il 50% rappresenta la parità), mentre per i gruppi intersezionali la parità equivale al 25% ⁴. Di nuovo, questo è ovviamente riduttivo.

Sulla base di questi metodi ho osservato che Stable Diffusion, quando riceve un prompt neutro rispetto al genere e al tono della pelle per produrre un'immagine di un medico, tende a generare immagini di figure maschili percepite con la pelle più chiara. Mostra anche un pregiudizio significativo nei confronti delle figure con la pelle più scura, nonché un notevole pregiudizio nei confronti delle figure femminili percepite in generale⁴:

Risultati dello studio. Stima della rappresentazione della popolazione e intervalli di confidenza, insieme agli indicatori di parità demografica (linee rosse e blu). Immagine di Danie Theron.

Queste conclusioni non sono sostanzialmente diverse quando si tiene conto delle larghezze dell'intervallo di confidenza attorno alle stime puntuali rispetto ai marcatori di parità demografica del sottogruppo associato.

È qui che il lavoro sui pregiudizi ingiusti nell'apprendimento automatico potrebbe in genere interrompersi. Tuttavia, recente lavoro di Jared Katzman et. al. fa l'utile suggerimento di andare oltre; riformulare il generico "pregiudizio ingiusto" in una tassonomia di danni rappresentativi che ci aiuti a diagnosticare in modo più acuto gli esiti avversi, nonché a mitigare più precisamente gli obiettivi⁸. Direi che ciò richiede uno specifico contesto di utilizzo. Quindi, immaginiamo che questo sistema venga utilizzato per generare automaticamente immagini di medici che vengono fornite in tempo reale sulla pagina di ammissione alla facoltà di medicina di un'università. Forse come un modo per personalizzare l'esperienza per ogni utente in visita. In questo contesto, usando la tassonomia di Katzman, i miei risultati suggeriscono che un tale sistema può gruppi sociali stereotipati⁸ sottorappresentando sistematicamente i sottogruppi colpiti (figure con tonalità della pelle più scure e caratteristiche femminili percepite). Potremmo anche considerare se questi tipi di guasti potrebbero negare alle persone l'opportunità di identificarsi⁸ per procura, nonostante il fatto che le immagini lo siano generato e non rappresentano persone reali.

È importante notare che la Model Card for Stable Diffusion v1–4 di Huggingface rivela da sé il fatto che LAION5B e quindi il modello stesso possono mancare di parità demografica negli esempi di addestramento e, in quanto tali, possono riflettere pregiudizi inerenti alla distribuzione dell'addestramento (incluso un concentrarsi sull'inglese, sulle norme occidentali e sui modelli sistemici di utilizzo di Internet in Occidente)⁵. Pertanto, le conclusioni di questo studio non sono inaspettate, ma la scala della disparità può essere utile per i professionisti che contemplano casi d'uso specifici; evidenziando le aree in cui possono essere necessarie mitigazioni attive prima della produzione delle decisioni sul modello.

Nel mio prossimo articolo Affronterò Obiettivo n. 2: indagare quantitativamente bias di campionamento nel set di dati LAION5B dietro Stable Diffusion e confrontandolo con i risultati di Obiettivo n. 1.

Glossario di Machine Learning: equità, 2022, Google
Inizia a utilizzare la scala del tono della pelle del monaco, 2022, Google
Immagini generate dallo studio, 2022, Daniel Theron
Codice da Studio, 2022, Daniel Theron
Diffusione stabile v1–4, 2022, Stability.ai & Huggingface
LAION5B Frontend per il recupero di clip, 2022, Romain Beaumont
Rater Review Risultati dallo studio, 2022, Daniel Theron
Danni rappresentativi nel tagging delle immagini, 2021, Jared Katzman et al.

Grazie a Xuan Yang e [IN ATTESA DEL CONSENSO DEL REVISORE] per la loro attenta e diligente revisione e feedback su questo articolo.

#mailpoet_form_1 .mailpoet_form { }
#mailpoet_form_1 modulo { margin-bottom: 0; }
#mailpoet_form_1 .mailpoet_column_with_ background {imbottitura: 0px; }
#mailpoet_form_1 .wp-block-column:first-child, #mailpoet_form_1 .mailpoet_form_column:first-child {imbottitura: 0 20px; }
#mailpoet_form_1 .mailpoet_form_column:not(:first-child) { margin-left: 0; }
#mailpoet_form_1 h2.mailpoet-intestazione { margine: 0 0 12px 0; }
#mailpoet_form_1 .mailpoet_paragraph { line-height: 20px; margine inferiore: 20px; }
#mailpoet_form_1 .mailpoet_segment_label, #mailpoet_form_1 .mailpoet_text_label, #mailpoet_form_1 .mailpoet_textarea_label, #mailpoet_form_1 .mailpoet_select_label, #mailpoet_form_1 .mailpoet_radio_label, #mailpoet_form_1 .mailpoet_checkbox_label, #mailpoet_form_1 .mailpoet_list_label, #mailpoet_form_1 .mailpoet_date_label { display: block; font-weight: normale; }
#mailpoet_form_1 .mailpoet_text, #mailpoet_form_1 .mailpoet_textarea, #mailpoet_form_1 .mailpoet_select, #mailpoet_form_1 .mailpoet_date_month, #mailpoet_form_1 .mailpoet_date_day, #mailpoet_form_1 .mailpoet_date_year, #mailpoet_form_1 .mailpoet_date { display: block ; }
#mailpoet_form_1 .mailpoet_text, #mailpoet_form_1 .mailpoet_textarea { larghezza: 200px; }
#mailpoet_form_1 .mailpoet_checkbox { }
#mailpoet_form_1 .mailpoet_submit { }
#mailpoet_form_1 .mailpoet_divider { }
#mailpoet_form_1 .mailpoet_message { }
#mailpoet_form_1 .mailpoet_form_loading { larghezza: 30px; text-align: centro; altezza della riga: normale; }
#mailpoet_form_1 .mailpoet_form_loading > span { width: 5px; altezza: 5px; colore di sfondo: #5b5b5b; }#mailpoet_form_1{border-radius: 3px;background: #27282e;color: #ffffff;text-align: left;}#mailpoet_form_1 form.mailpoet_form {padding: 0px;}#mailpoet_form_1{width: 100%;}#mailpoet_form_1 . mailpoet_message {margine: 0; imbottitura: 0 20px;}
#mailpoet_form_1 .mailpoet_validate_success {colore: #00d084}
#mailpoet_form_1 input.prezzemolo-successo {colore: #00d084}
#mailpoet_form_1 select.prezzemolo-successo {colore: #00d084}
#mailpoet_form_1 textarea.prezzemolo-successo {colore: #00d084}

#mailpoet_form_1 .mailpoet_validate_error {colore: #cf2e2e}
#mailpoet_form_1 input.prezzemolo-errore {colore: #cf2e2e}
#mailpoet_form_1 select.prezzemolo-errore {colore: #cf2e2e}
#mailpoet_form_1 textarea.textarea.parsley-error {colore: #cf2e2e}
#mailpoet_form_1 .prezzemolo-elenco-errori {colore: #cf2e2e}
#mailpoet_form_1 .prezzemolo-richiesto {colore: #cf2e2e}
#mailpoet_form_1 .parsley-custom-errore-messaggio {colore: #cf2e2e}
#mailpoet_form_1 .mailpoet_paragraph.last {margin-bottom: 0} @media (max-width: 500px) {#mailpoet_form_1 {background: #27282e;}} @media (min-width: 500px) {#mailpoet_form_1 .last .mailpoet_paragraph: last-child {margin-bottom: 0}} @media (max-width: 500px) {#mailpoet_form_1 .mailpoet_form_column:last-child .mailpoet_paragraph:last-child {margin-bottom: 0}}

Pregiudizio ingiusto su genere, tonalità della pelle e gruppi intersezionali nelle immagini di diffusione stabile generate ripubblicate dalla fonte https://towardsdatascience.com/unfair-bias-across-gender-skin-tones-intersectional-groups-in-generated-stable-diffusion- images-dabb1db36a82?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

Timestamp: 14 Novembre 202216 Novembre 2022