Học máy có thể dự đoán chính xác giới tính của một nhà khoa học chỉ dựa trên dữ liệu trích dẫn PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Máy học có thể dự đoán chính xác giới tính của một nhà khoa học chỉ dựa trên dữ liệu trích dẫn

Hiệu ứng tập thể: sự khác biệt về giới trong mạng lưới trích dẫn có thể là do hiệu ứng “giàu càng giàu”, nơi các nhà nghiên cứu nổi tiếng nhận được nhiều tín nhiệm hơn. (Được phép: Shutterstock / aelitta)

Phụ nữ và nam giới có các kiểu trích dẫn khác nhau đến mức có thể dự đoán chính xác giới tính của một nhà khoa học chỉ từ những dữ liệu đó. Đó là phát hiện của một nghiên cứu mới điều tra cách đàn ông và phụ nữ trích dẫn - và được trích dẫn bởi - cộng đồng của họ (Proc. Natl. Acad. Khoa học 119 e2206070119).

Được dẫn dắt bởi nhà khoa học mạng Kristina Lerman từ Đại học Nam California, các tác giả đã nghiên cứu 766 thành viên của Hoa Kỳ Học viện Khoa học Quốc gia (NAS), bao gồm 120 phụ nữ. Họ đối sánh các học giả với hồ sơ của họ trên Microsoft Academic Graph, nơi chứa siêu dữ liệu về hơn 150 triệu ấn phẩm học thuật.

Sau khi xác định giới tính của các nhà khoa học bằng cách kiểm tra các đại từ trên tiểu sử của từng cá nhân, các nhà nghiên cứu đã tạo ra một “mạng lưới trích dẫn bản ngã” cho mỗi nhà khoa học. Điều này chứa "các liên kết định hướng", cho biết các nhà khoa học khác - đại diện bởi các nút - mà cá nhân đó đã trích dẫn và các nhà khoa học nào đã trích dẫn chúng.

Ai cũng biết rằng các nhà khoa học nữ nhận được ít trích dẫn hơn các đồng nghiệp nam của họ, nhưng nghiên cứu mới cho thấy rằng phụ nữ đáp lại một phần trích dẫn cao hơn đáng kể so với nam giới. Mạng lưới của phụ nữ cũng có tính “kết nối” nhiều hơn, cho thấy rằng phụ nữ có xu hướng làm việc trong các cộng đồng nghiên cứu gắn bó chặt chẽ hơn.

Nghiên cứu cũng chỉ ra rằng phụ nữ có ít đồng nghiệp hơn - mặc dù những người này có xu hướng là đồng nghiệp có năng suất cao - và phụ nữ có tỷ lệ nhà khoa học nữ trong mạng lưới của họ nhiều hơn.

Giàu càng giàu

Sau đó, các nhà nghiên cứu đã đào tạo một thuật toán học máy trên 75% dữ liệu được chọn ngẫu nhiên. Sử dụng 25% còn lại để kiểm tra hệ thống, họ nhận thấy rằng thuật toán có thể dự đoán chính xác giới tính của một nhà khoa học dựa trên các mạng trích dẫn - thực hiện chính xác khoảng 80% thời gian.

Các mạng lưới trích dẫn cho thấy một số khác biệt đáng kể dựa trên uy tín của tổ chức liên kết của tác giả, mặc dù tư cách thành viên NAS rất nghiêng về các viện uy tín hơn. Các nhà nghiên cứu cũng phát hiện ra rằng phụ nữ ít được đại diện trong tất cả bảy lĩnh vực mà họ đã xem xét. Chỉ 8% nhà vật lý NAS là phụ nữ - tỷ lệ thấp nhất trong tất cả các lĩnh vực được nghiên cứu.

Lerman cho rằng sự khác biệt về giới tính trong các mạng lưới trích dẫn có thể do hai khía cạnh. Cô nói: “Cả hai giới đều ưa chuộng việc trích dẫn nam giới và sự ràng buộc ưu tiên - hay hiệu ứng 'giàu càng giàu' - là cơ chế phần thưởng nổi tiếng, nơi các nhà nghiên cứu vốn đã nổi tiếng nhận được nhiều tín nhiệm hơn. . “Chúng tôi hiện đang làm việc trên một bản thảo cho thấy sự chênh lệch giới tính lớn có thể xuất hiện từ các thành phần này như thế nào”.

Dấu thời gian:

Thêm từ Thế giới vật lý