L'apprendimento automatico può prevedere con precisione il genere di uno scienziato basandosi solo sui dati delle citazioni PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

L'apprendimento automatico può prevedere con precisione il genere di uno scienziato sulla base dei soli dati di citazione

Effetto collettivo: le differenze di genere nelle reti di citazioni possono essere dovute a un effetto "ricchi diventano più ricchi" in cui i ricercatori più noti ottengono più credito. (Per gentile concessione: Shutterstock/aelitta)

Le donne e gli uomini hanno modelli di citazione così diversi che è possibile prevedere con precisione il genere di uno scienziato solo da tali dati. Questa è la scoperta di un nuovo studio che indaga su come uomini e donne citano – e sono citati da – le loro comunità (Proc. Natl. Accade. Sci 119 e2206070119).

Guidato dallo scienziato di rete Kristina Lerman della University of Southern California, gli autori hanno studiato 766 membri degli Stati Uniti Accademia Nazionale delle Scienze (NAS), che comprendeva 120 donne. Hanno abbinato gli studiosi ai loro profili su Microsoft Academic Graph, che contiene metadati su oltre 150 milioni di pubblicazioni accademiche.

Dopo aver identificato i sessi degli scienziati controllando i pronomi sulle biografie degli individui, i ricercatori hanno creato una "rete di citazione dell'ego" per ogni scienziato. Questo conteneva "collegamenti direzionali", che indicavano quali altri scienziati - rappresentati da nodi - l'individuo aveva citato e quali scienziati li avevano citati.

È risaputo che le scienziate ricevono meno citazioni rispetto ai loro omologhi maschi, ma il nuovo studio rivela che le donne ricambiano una frazione di citazioni significativamente più alta rispetto agli uomini. La rete di una donna ha anche più "connessione", suggerendo che le donne tendono a lavorare in comunità di ricerca più unite.

Lo studio ha rilevato anche che le donne hanno meno pari, anche se queste tendono ad essere colleghe altamente produttive, e che le donne hanno una percentuale maggiore di scienziate nelle loro reti.

I ricchi diventano più ricchi

I ricercatori hanno quindi addestrato un algoritmo di apprendimento automatico sul 75% dei dati selezionati in modo casuale. Utilizzando l'altro 25% per testare il sistema, hanno scoperto che l'algoritmo può prevedere con precisione il genere di uno scienziato in base alle reti di citazioni, facendolo correttamente circa l'80% delle volte.

Le reti di citazione hanno mostrato poche differenze significative in base al prestigio dell'istituzione affiliata di un autore, sebbene l'appartenenza al NAS sia fortemente sbilanciata verso istituti più prestigiosi. I ricercatori hanno anche scoperto che le donne sono sottorappresentate in tutti e sette i campi esaminati. Solo l'8% dei fisici NAS erano donne, la percentuale più bassa di tutti i campi studiati.

Lerman pensa che le differenze di genere nelle reti di citazioni potrebbero essere riconducibili a due aspetti. "C'è una preferenza di entrambi i sessi per citare gli uomini, e l'attaccamento preferenziale - o l'effetto 'ricchi diventano più ricchi' - è il ben noto meccanismo di ricompense nella scienza, dove i ricercatori già più noti ottengono più credito", dice . "Ora stiamo lavorando a un manoscritto che mostra come una grande disparità di genere possa emergere da queste componenti".

Timestamp:

Di più da Mondo della fisica