Koneoppiminen voi ennustaa tarkasti tiedemiehen sukupuolen pelkästään lainaustietojen perusteella PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Koneoppiminen voi ennustaa tarkasti tiedemiehen sukupuolen pelkästään viittaustietojen perusteella

Kollektiivinen vaikutus: sukupuolten väliset erot viittausverkostoissa voivat johtua "rikas rikastuu" -vaikutuksesta, jossa tunnetuimmat tutkijat saavat enemmän arvostusta. (Kohtelias: Shutterstock/aelitta)

Naisilla ja miehillä on niin erilaiset lainausmallit, että tutkijan sukupuoli on mahdollista ennustaa tarkasti pelkän tällaisen tiedon perusteella. Tämä on havainto uudesta tutkimuksesta, joka tutkii, kuinka miehet ja naiset mainitsevat – ja he ovat maininneet – yhteisönsä.Proc. Natl. Acad. Sci 119 e2206070119).

Verkkotutkijan johdolla Kristina Lerman Etelä-Kalifornian yliopiston kirjoittajat tutkivat 766 Yhdysvaltain jäsentä Kansallinen tiedeakatemia (NAS), johon kuului 120 naista. He yhdistivät tutkijat profiileihinsa Microsoft Academic Graphissa, joka sisältää metatietoja yli 150 miljoonasta akateemisesta julkaisusta.

Tunnistattuaan tutkijoiden sukupuolen tarkastamalla pronominit yksilöiden elämäkerroista, tutkijat loivat "minäviittausverkoston" jokaiselle tiedemiehelle. Tämä sisälsi "suuntalinkkejä", jotka osoittivat, mitä muita tiedemiehiä - solmujen edustamia - henkilö oli lainannut ja mitkä tutkijat olivat siteerannut niitä.

Tiedetään hyvin, että naispuoliset tutkijat saavat vähemmän viittauksia kuin miespuoliset tutkijat, mutta uusi tutkimus paljastaa, että naiset vastaavat huomattavasti enemmän lainauksista kuin miehet. Naisten verkostolla on myös enemmän "yhteyksiä", mikä viittaa siihen, että naiset työskentelevät tiiviimmissä tutkimusyhteisöissä.

Tutkimuksessa havaittiin myös, että naisilla on vähemmän vertaisia ​​– vaikka he ovat yleensä erittäin tuottavia työtovereita – ja että naisten verkostoissa on suurempi osuus naispuolisia tutkijoita.

Rikkaat rikastuvat

Sitten tutkijat kouluttivat koneoppimisalgoritmin 75 prosentille satunnaisesti valituista tiedoista. Käyttäen loput 25 % järjestelmän testaamiseen he havaitsivat, että algoritmi voi ennustaa tarkasti tutkijan sukupuolen lainausverkostojen perusteella – noin 80 % ajasta oikein.

Viittausverkostot osoittivat muutamia merkittäviä eroja tekijän sidosinstituutin arvostuksen perusteella, vaikka NAS-jäsenyys onkin erittäin vinoutunut kohti arvostetumpia instituutteja. Tutkijat havaitsivat myös, että naiset ovat aliedustettuina kaikilla seitsemällä alalla, joita he tarkastelivat. Vain 8 % NAS:n fyysikoista oli naisia ​​– pienin osuus kaikista tutkituista aloista.

Lerman uskoo, että sukupuolten väliset erot viittausverkostoissa voivat johtua kahdesta näkökulmasta. "Molemmat sukupuolet suosivat miesten mainitsemista, ja etuoikeutettu kiintymys eli "rikkaat rikastuvat" -vaikutus on tieteessä hyvin tunnettu palkitsemismekanismi, jossa jo tunnetuimmat tutkijat saavat enemmän tunnustusta, hän sanoo. . "Työstämme nyt käsikirjoitusta, joka osoittaa, kuinka suuri sukupuolten välinen ero voi syntyä näistä komponenteista."

Aikaleima:

Lisää aiheesta Fysiikan maailma