Maskininlärning kan exakt förutsäga en forskares kön baserat på enbart citeringsdata PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Maskininlärning kan exakt förutsäga en forskares kön baserat på enbart citeringsdata

Kollektiv effekt: könsskillnader i citeringsnätverk kan bero på en "rik blir rikare"-effekt där mer kända forskare får mer kredit. (Med tillstånd: Shutterstock/aelitta)

Kvinnor och män har så olika citeringsmönster att det är möjligt att exakt förutsäga en forskares kön enbart utifrån sådana data. Det är resultatet av en ny studie som undersöker hur män och kvinnor citerar – och citeras av – sina samhällen (Proc. Natl. Acad. Sci 119 e2206070119).

Leds av nätverksforskare Kristina Lerman från University of Southern California studerade författarna 766 medlemmar i USA National Academy of Sciences (NAS), som omfattade 120 kvinnor. De matchade forskarna med deras profiler på Microsoft Academic Graph, som innehåller metadata om över 150 miljoner akademiska publikationer.

Efter att ha identifierat forskarnas kön genom att kontrollera pronomen på individens biografier skapade forskarna ett "ego-citeringsnätverk" för varje forskare. Detta innehöll "riktningslänkar", som angav vilka andra forskare – representerade av noder – individen hade citerat och vilka forskare som hade citerat dem.

Det är välkänt att kvinnliga forskare får färre citeringar än sina manliga motsvarigheter, men den nya studien avslöjar att kvinnor återgäldar en betydligt högre andel citeringar än män. En kvinnas nätverk har också mer "anknytning", vilket tyder på att kvinnor tenderar att arbeta i mer sammansvetsade forskarsamhällen.

Studien fann också att kvinnor har färre jämnåriga – även om dessa tenderar att vara mycket produktiva kollegor – och att kvinnor har en större andel kvinnliga forskare i sina nätverk.

Rika blir rikare

Forskarna tränade sedan en maskininlärningsalgoritm på 75 % av data som valdes ut slumpmässigt. Genom att använda de övriga 25 % för att testa systemet, fann de att algoritmen exakt kan förutsäga en forskares kön baserat på citeringsnätverken – korrekt gör det ungefär 80 % av tiden.

Citeringsnätverken visade få signifikanta skillnader baserat på prestige hos en författares anslutna institution, även om NAS-medlemskap är mycket skevt mot mer prestigefyllda institut. Forskarna fann också att kvinnor är underrepresenterade inom alla sju områden de tittade på. Bara 8 % av NAS-fysikerna var kvinnor – den lägsta andelen av alla fält som studerades.

Lerman tror att könsskillnaderna i citeringsnätverk kan bero på två aspekter. "Det finns en förkärlek hos båda könen att citera män, och förmånlig anknytning - eller effekten "rika blir rikare" - är den välkända mekanismen för belöningar inom vetenskapen, där de redan mer kända forskarna får mer kredit, säger hon. . "Vi arbetar nu på ett manuskript som visar hur en stor könsskillnad kan uppstå från dessa komponenter."

Tidsstämpel:

Mer från Fysikvärlden