Các nhà nghiên cứu AI hiện đang xem xét các đồng nghiệp của họ với sự hỗ trợ của AI

Được xuất bản lại bởi Plato

Người theo dõi: 0

Các học giả tập trung vào trí tuệ nhân tạo đã sử dụng AI tổng quát để giúp họ đánh giá công việc học máy của các đồng nghiệp.

Một nhóm các nhà nghiên cứu từ Đại học Stanford, NEC Labs America và UC Santa Barbara gần đây đã phân tích các đánh giá ngang hàng của các bài báo được gửi tới các hội nghị AI hàng đầu, bao gồm ICLR 2024, NeurIPS 2023, CoRL 2023 và EMNLP 2023.

Các tác giả – Weixin Liang, Zachary Izzo, Yaohui Zhang, Haley Lepp, Han Cheng Cao, Xuândong Zhao, Lingjiao Chen, Haotian Ye, Sheng Liu, Zhi Huang, Daniel A McFarland và James Y Zou – đã báo cáo những phát hiện của họ trên tạp chí một tờ giấy có tiêu đề “Giám sát nội dung được sửa đổi AI trên quy mô lớn: Nghiên cứu điển hình về tác động của ChatGPT đối với các đánh giá ngang hàng của hội nghị AI”.

Họ thực hiện nghiên cứu dựa trên sự quan tâm và thảo luận của công chúng về các mô hình ngôn ngữ lớn đã thống trị các cuộc thảo luận kỹ thuật vào năm ngoái.

Các tác giả nhận thấy mức độ sử dụng LLM rõ ràng tăng lên một chút nhưng nhất quán đối với các bài đánh giá được gửi ba ngày hoặc ít hơn trước thời hạn

Khó khăn trong việc phân biệt giữa văn bản do con người và máy viết và sự gia tăng được báo cáo về Trang web tin tức AI khiến các tác giả kết luận rằng cần phải phát triển các cách để đánh giá các tập dữ liệu trong thế giới thực có chứa một lượng nội dung không xác định do AI tạo ra.

Đôi khi quyền tác giả của AI nổi bật – như trong một giấy từ Báo cáo trường hợp X quang có tựa đề “Xử trí thành công tổn thương tĩnh mạch cửa và động mạch gan do điều trị ở bệnh nhân nữ 4 tháng tuổi: Báo cáo trường hợp và tổng quan tài liệu.”

Đoạn văn lộn xộn này mang tính chất tặng quà: “Tóm lại, việc quản lý phương pháp điều trị hai bên, tôi rất xin lỗi, nhưng tôi không có quyền truy cập vào thông tin thời gian thực hoặc dữ liệu cụ thể của bệnh nhân, vì tôi là người mẫu ngôn ngữ AI .”

Nhưng sự khác biệt không phải lúc nào cũng rõ ràng và những nỗ lực trước đây nhằm phát triển một cách tự động để sắp xếp văn bản do con người viết từ văn xuôi robot đã không thành công. OpenAI chẳng hạn đã giới thiệu Trình phân loại văn bản AI vì mục đích đó vào tháng 2023 năm XNUMX, chỉ sáu tháng sau mới đóng cửa “do tỷ lệ chính xác thấp".

Tuy nhiên, Lương et al cho rằng việc tập trung vào việc sử dụng tính từ trong văn bản – thay vì cố gắng đánh giá toàn bộ tài liệu, đoạn văn hoặc câu – sẽ dẫn đến kết quả đáng tin cậy hơn.

Các tác giả đã lấy hai bộ dữ liệu, hay còn gọi là tập hợp – một bộ được viết bởi con người và một bộ được viết bởi máy móc. Và họ đã sử dụng hai nội dung văn bản này để đánh giá các đánh giá – đánh giá ngang hàng của các bài báo AI trong hội nghị – về tần suất của các tính từ cụ thể.

Họ giải thích: “[A]Tất cả các tính toán của chúng tôi chỉ phụ thuộc vào các tính từ có trong mỗi tài liệu”. “Chúng tôi nhận thấy sự lựa chọn từ vựng này thể hiện sự ổn định cao hơn so với việc sử dụng các phần khác của lời nói như trạng từ, động từ, danh từ hoặc tất cả các mã thông báo có thể có.”

Hóa ra LLM có xu hướng sử dụng các tính từ như “đáng khen ngợi”, “sáng tạo” và “toàn diện” thường xuyên hơn so với các tác giả con người. Và những khác biệt thống kê như vậy trong cách sử dụng từ ngữ đã cho phép các nhà nghiên cứu xác định các bài đánh giá về các bài báo được cho là có khả năng hỗ trợ LLM.

Đám mây từ gồm 100 tính từ hàng đầu trong phản hồi LLM, với cỡ chữ biểu thị tần suất (bấm vào để phóng to)

Các tác giả lập luận: “Kết quả của chúng tôi cho thấy rằng từ 6.5% đến 16.9% văn bản được gửi dưới dạng đánh giá ngang hàng cho các hội nghị này có thể đã được sửa đổi đáng kể bởi LLM, tức là ngoài việc kiểm tra chính tả hoặc cập nhật văn bản nhỏ”. tạp chí khoa học Nature không có dấu hiệu hỗ trợ cơ giới hóa.

Một số yếu tố dường như có tương quan với việc sử dụng LLM nhiều hơn. Một là thời hạn đang đến gần: Các tác giả nhận thấy mức độ sử dụng LLM rõ ràng đã tăng lên một chút nhưng nhất quán đối với các đánh giá được gửi trước thời hạn ba ngày hoặc ít hơn.

Các nhà nghiên cứu nhấn mạnh rằng mục đích của họ không phải là đưa ra phán xét về việc sử dụng hỗ trợ viết AI, cũng như không khẳng định rằng bất kỳ bài báo nào họ đánh giá đều được viết hoàn toàn bằng mô hình AI. Nhưng họ cho rằng cộng đồng khoa học cần minh bạch hơn về việc sử dụng LLM.

Và họ cho rằng những cách làm như vậy có khả năng làm mất đi những phản hồi đa dạng từ các chuyên gia. Hơn nữa, phản hồi của AI có nguy cơ gây ra hiệu ứng đồng nhất, làm sai lệch các thành kiến của mô hình AI và làm mất đi những hiểu biết sâu sắc có ý nghĩa. ®

Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
nguồn: https://go.theregister.com/feed/www.theregister.com/2024/03/19/ai_researchers_reviewing_peers/

Dấu thời gian: 19 Tháng ba, 2024

Dấu thời gian: Tháng Mười Một 2, 2022

Các nhà nghiên cứu AI hiện đang xem xét các đồng nghiệp của họ với sự hỗ trợ của AI

Được xuất bản lại bởi Plato

Thêm từ Đăng ký

HPE cho biết tác động của AI đối với doanh nghiệp không 'cường điệu'

Khi một bước là một bước nhảy vọt

Bản demo chatbot internet AI của Meta nhanh chóng bắt đầu tung ra tin tức giả mạo và nhận xét phân biệt chủng tộc

AI để bảo vệ Washington DC trước các mối đe dọa từ trên không

BBC tiêu diệt các thí nghiệm AI được sử dụng để quảng cáo Doctor Who

AlphaCode 2, AI tạo mã được cải tiến với bộ công cụ Gemini

Một thư mục protein AI thế hệ tiếp theo có thể giúp ích gì cho khoa học? Meta tốt cho một cái gì đó

Về chúng tôi

Tìm kiếm dọc & Ai

Nền tảng

NHẬN THÔNG TIN

Tài khoản