機械学習は、引用データのみに基づいて科学者の性別を正確に予測できます PlatoBlockchain Data Intelligence. 垂直検索。 あい。

機械学習は、引用データのみに基づいて科学者の性別を正確に予測できます

集団効果: 引用ネットワークにおける性差は、より有名な研究者がより多くのクレジットを得る「金持ちになる」効果による可能性があります。 (提供: Shutterstock/aelitta)

女性と男性では引用パターンが非常に異なるため、そのようなデータだけから科学者の性別を正確に予測することができます。 これは、男性と女性がどのようにコミュニティから引用され、どのように引用されるかを調査した新しい研究の発見です (議事録国立アカデミー。 科学 119 e2206070119).

ネットワーク科学者が率いる クリスティーナ・ラーマン 南カリフォルニア大学から、著者は米国の 766 人のメンバーを調査しました 全米科学アカデミー (NAS)、120 人の女性が含まれています。 彼らは、150 億 XNUMX 万を超える学術出版物に関するメタデータを含む Microsoft Academic Graph のプロファイルと奨学生を照合しました。

個人の伝記の代名詞をチェックして科学者の性別を特定した後、研究者は各科学者の「自我引用ネットワーク」を作成しました。 これには「方向リンク」が含まれており、ノードで表される他の科学者がどの科学者を引用したか、どの科学者がそれらを引用したかを示しています。

女性の科学者が男性の科学者よりも引用される回数が少ないことはよく知られていますが、新しい研究では、女性は男性よりも引用の割合が大幅に高いことが明らかになりました。 女性のネットワークは「つながり」も強く、女性はより緊密な研究コミュニティで働く傾向があることを示唆しています。

この研究では、女性は同僚が少なく、同僚は生産性の高い同僚である傾向があり、女性はネットワーク内の女性科学者の割合が高いこともわかりました.

金持ちはもっと金持ちになる

次に研究者は、ランダムに選択されたデータの 75% で機械学習アルゴリズムをトレーニングしました。 残りの 25% を使用してシステムをテストしたところ、引用ネットワークに基づいてアルゴリズムが科学者の性別を正確に予測できることがわかりました。約 80% の確率で正確に予測できました。

引用ネットワークは、著者の所属機関の名声に基づく有意差をほとんど示しませんでしたが、NAS メンバーシップはより権威のある機関に大きく偏っています。 研究者はまた、調査した8つの分野すべてで女性が過小評価されていることも発見しました. NAS 物理学者のわずか XNUMX% が​​女性であり、研究されたすべての分野の中で最も低い割合でした。

Lerman は、引用ネットワークにおける性差は XNUMX つの側面に帰着する可能性があると考えています。 「両方の性別で男性を引用する傾向があり、優先的な愛着、または「金持ちになる」効果は、科学における報酬のよく知られたメカニズムであり、すでによく知られている研究者がより多くの信用を得ています」と彼女は言います. . 「私たちは現在、これらの要素から大きな男女格差がどのように生じるかを示す原稿に取り組んでいます.」

タイムスタンプ:

より多くの 物理学の世界