Машинное обучение может точно предсказать пол ученого на основе только данных цитирования PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Машинное обучение может точно предсказать пол ученого, основываясь только на данных цитирования.

Коллективный эффект: гендерные различия в сетях цитирования могут быть связаны с эффектом «богатые становятся богаче», когда более известные исследователи получают больше признания. (Фото любезно предоставлено Shutterstock/aelitta)

Женщины и мужчины имеют настолько разные модели цитирования, что можно точно предсказать пол ученого только на основе таких данных. К такому выводу пришли результаты нового исследования, изучающего, как мужчины и женщины цитируют (и сами цитируются) свои сообщества (Учеб. Натл. акад. Наука 119 e2206070119).

Под руководством сетевого ученого Кристина Лерман из Университета Южной Калифорнии авторы изучили 766 членов США Национальная академия наук (НАН), в которую вошли 120 женщин. Они сопоставили ученых с их профилями в Microsoft Academic Graph, который содержит метаданные более чем 150 миллионов научных публикаций.

Определив пол ученых путем проверки местоимений в биографиях людей, исследователи создали «сеть цитирования эго» для каждого ученого. Он содержал «направленные ссылки», указывающие, каких других ученых, представленных узлами, цитировал человек, и какие ученые цитировали их.

Хорошо известно, что ученые-женщины цитируются меньше, чем их коллеги-мужчины, но новое исследование показывает, что женщины отвечают на значительно более высокую долю цитирований, чем мужчины. Женская сеть также имеет большую «связность», что позволяет предположить, что женщины, как правило, работают в более тесно связанных исследовательских сообществах.

Исследование также показало, что у женщин меньше коллег (хотя они, как правило, являются высокопродуктивными коллегами) и что в их сетях больше женщин-ученых.

Богатые становятся богаче

Затем исследователи обучили алгоритм машинного обучения на 75% данных, которые были выбраны случайным образом. Используя остальные 25% для тестирования системы, они обнаружили, что алгоритм может точно предсказать пол ученого на основе сетей цитирования – правильно делая это примерно в 80% случаев.

Сети цитирования показали мало существенных различий, основанных на престиже дочернего учреждения автора, хотя членство в НАН сильно перекошено в сторону более престижных институтов. Исследователи также обнаружили, что женщины недостаточно представлены во всех семи областях, которые они рассматривали. Всего 8% физиков НАН составляли женщины – это самый низкий процент среди всех изучаемых областей.

Лерман считает, что гендерные различия в сетях цитирования могут сводиться к двум аспектам. «Оба пола предпочитают цитировать мужчин, а предпочтительная привязанность — или эффект «богатые становятся богаче» — это хорошо известный механизм вознаграждения в науке, когда уже более известные исследователи получают больше признания», — говорит она. . «Сейчас мы работаем над рукописью, которая покажет, как из этих компонентов может возникнуть большое гендерное неравенство».

Отметка времени:

Больше от Мир физики