Maskinlæring kan nøjagtigt forudsige en videnskabsmands køn baseret på citationsdata alene PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Maskinlæring kan præcist forudsige en videnskabsmands køn baseret på citationsdata alene

Kollektiv effekt: kønsforskelle i citationsnetværk kan skyldes en "rig bliver rigere"-effekt, hvor bedre kendte forskere får mere kredit. (Med høflighed: Shutterstock/aelitta)

Kvinder og mænd har så forskellige citationsmønstre, at det er muligt nøjagtigt at forudsige en videnskabsmands køn ud fra sådanne data alene. Det er resultatet af en ny undersøgelse, der undersøger, hvordan mænd og kvinder citerer – og citeres af – deres samfund (Proc. Natl. Acad. Sci 119 e2206070119).

Ledet af netværksforsker Kristina Lerman fra University of Southern California undersøgte forfatterne 766 medlemmer af USA National Academy of Sciences (NAS), som omfattede 120 kvinder. De matchede de lærde med deres profiler på Microsoft Academic Graph, som indeholder metadata om over 150 millioner akademiske publikationer.

Efter at have identificeret forskernes køn ved at kontrollere pronominer på individets biografier, skabte forskerne et "ego-citationsnetværk" for hver videnskabsmand. Dette indeholdt "retningslinks", hvilket indikerede, hvilke andre videnskabsmænd - repræsenteret ved noder - individet havde citeret, og hvilke videnskabsmænd der havde citeret dem.

Det er velkendt, at kvindelige videnskabsmænd modtager færre citater end deres mandlige kolleger, men den nye undersøgelse afslører, at kvinder gengælder en betydeligt højere andel af citater end mænd. En kvindes netværk har også mere "forbundethed", hvilket tyder på, at kvinder har en tendens til at arbejde i tættere forskersamfund.

Undersøgelsen viste også, at kvinder har færre jævnaldrende – selvom disse har tendens til at være yderst produktive kolleger – og at kvinder har en større andel af kvindelige videnskabsmænd i deres netværk.

Rige bliver rigere

Forskerne trænede derefter en maskinlæringsalgoritme på 75 % af dataene, der blev tilfældigt udvalgt. Ved at bruge de øvrige 25 % til at teste systemet fandt de ud af, at algoritmen nøjagtigt kan forudsige en videnskabsmands køn baseret på citationsnetværkene – og gør det korrekt omkring 80 % af tiden.

Citationsnetværkene viste få væsentlige forskelle baseret på prestige af en forfatters tilknyttede institution, selvom NAS-medlemskab er stærkt skævt mod mere prestigefyldte institutter. Forskerne fandt også ud af, at kvinder er underrepræsenteret på tværs af alle syv felter, de så på. Kun 8% af NAS-fysikere var kvinder - den laveste andel af alle de undersøgte felter.

Lerman mener, at kønsforskellene i citationsnetværk kan skyldes to aspekter. "Der foretrækker begge køn at citere mænd, og præferencetilknytning - eller "rig bliver rigere"-effekten - er den velkendte belønningsmekanisme i videnskaben, hvor de i forvejen bedre kendte forskere får mere kredit, siger hun. . "Vi arbejder nu på et manuskript, der viser, hvordan en stor kønsforskel kan opstå fra disse komponenter."

Tidsstempel:

Mere fra Fysik verden