Maskinlæring kan nøyaktig forutsi en forskers kjønn basert på siteringsdata alene PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Maskinlæring kan nøyaktig forutsi en forskers kjønn basert på siteringsdata alene

Kollektiv effekt: kjønnsforskjeller i siteringsnettverk kan skyldes en «rik blir rikere»-effekt der bedre kjente forskere får mer kreditt. (Med tillatelse: Shutterstock/aelitta)

Kvinner og menn har så forskjellige siteringsmønstre at det er mulig å forutsi en forskers kjønn nøyaktig fra slike data alene. Det er funnet i en ny studie som undersøker hvordan menn og kvinner siterer – og blir sitert av – lokalsamfunnene deres (Proc. Natl. Acad. Sci 119 e2206070119).

Ledet av nettverksforsker Kristina Lerman fra University of Southern California, studerte forfatterne 766 medlemmer av USA Nasjonalt vitenskapsakademi (NAS), som inkluderte 120 kvinner. De matchet de lærde med profilene deres på Microsoft Academic Graph, som inneholder metadata om over 150 millioner akademiske publikasjoner.

Etter å ha identifisert forskernes kjønn ved å sjekke pronomen på individets biografier, opprettet forskerne et "ego-siteringsnettverk" for hver vitenskapsmann. Denne inneholdt "retningslinker", som indikerte hvilke andre forskere – representert ved noder – individet hadde sitert, og hvilke forskere som hadde sitert dem.

Det er velkjent at kvinnelige forskere mottar færre siteringer enn sine mannlige kolleger, men den nye studien avslører at kvinner gjengjelder en betydelig høyere brøkdel av siteringer enn menn gjør. Et kvinnenettverk har også mer "tilknytning", noe som tyder på at kvinner har en tendens til å jobbe i tettere forskningsmiljøer.

Studien fant også at kvinner har færre jevnaldrende – selv om disse pleier å være svært produktive kolleger – og at kvinner har en større andel kvinnelige forskere i nettverkene sine.

Rike blir rikere

Forskerne trente deretter en maskinlæringsalgoritme på 75 % av dataene som ble valgt tilfeldig. Ved å bruke de andre 25 % til å teste systemet, fant de ut at algoritmen nøyaktig kan forutsi en vitenskapsmanns kjønn basert på siteringsnettverk – og gjør det riktig omtrent 80 % av tiden.

Siteringsnettverkene viste få signifikante forskjeller basert på prestisje til en forfatters tilknyttede institusjon, selv om NAS-medlemskap er svært skjevt mot mer prestisjetunge institutter. Forskerne fant også at kvinner er underrepresentert på alle de syv feltene de så på. Bare 8 % av NAS-fysikere var kvinner – den laveste andelen av alle feltene som ble studert.

Lerman tror kjønnsforskjellene i siteringsnettverk kan skyldes to aspekter. "Det er en preferanse fra begge kjønn til å sitere menn, og fortrinnsrett tilknytning - eller "rik bli rikere"-effekten - er den velkjente belønningsmekanismen i vitenskapen, der de allerede bedre kjente forskerne får mer kreditt, sier hun . "Vi jobber nå med et manuskript som viser hvordan en stor kjønnsforskjell kan oppstå fra disse komponentene."

Tidstempel:

Mer fra Fysikkens verden