Trình phân loại AI mới để chỉ ra văn bản do AI viết

Được xuất bản lại bởi Plato

Người theo dõi: 0

Trình phân loại AI mới để chỉ ra văn bản do AI viết PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Chúng tôi đang tung ra một bộ phân loại được đào tạo để phân biệt giữa văn bản do AI viết và do con người viết.

Chúng tôi đã đào tạo một bộ phân loại để phân biệt giữa văn bản do con người viết và văn bản do AI viết từ nhiều nhà cung cấp khác nhau. Mặc dù không thể phát hiện tất cả văn bản do AI viết một cách đáng tin cậy, nhưng chúng tôi tin rằng các trình phân loại tốt có thể thông báo các biện pháp giảm nhẹ đối với các tuyên bố sai rằng văn bản do AI tạo ra được viết bởi con người: ví dụ: đang chạy chiến dịch thông tin sai lệch tự động, sử dụng các công cụ AI cho hành vi gian lận trong học thuật và định vị một chatbot AI như một con người.

Trình phân loại của chúng tôi không hoàn toàn đáng tin cậy. Trong các đánh giá của chúng tôi về một “tập hợp thử thách” các văn bản tiếng Anh, bộ phân loại của chúng tôi xác định chính xác 26% văn bản do AI viết (các kết quả tích cực thực sự) là “có khả năng là do AI viết”, trong khi đánh dấu sai văn bản do con người viết là 9% văn bản do AI viết. thời gian (dương tính giả). Độ tin cậy của trình phân loại của chúng tôi thường được cải thiện khi độ dài của văn bản đầu vào tăng lên. so với của chúng tôi bộ phân loại đã phát hành trước đó, trình phân loại mới này đáng tin cậy hơn đáng kể đối với văn bản từ các hệ thống AI gần đây hơn.

Chúng tôi đang cung cấp công cụ phân loại này để nhận phản hồi về việc liệu các công cụ không hoàn hảo như công cụ này có hữu ích hay không. Công việc của chúng tôi về phát hiện văn bản do AI tạo ra sẽ tiếp tục và chúng tôi hy vọng sẽ chia sẻ các phương pháp cải tiến trong tương lai.

Hãy tự mình thử trình phân loại đang tiến hành miễn phí của chúng tôi:

Hạn chế

Trình phân loại của chúng tôi có một số hạn chế quan trọng. Nó không nên được sử dụng như một công cụ ra quyết định chính, mà thay vào đó là một phần bổ sung cho các phương pháp xác định nguồn gốc của một đoạn văn bản khác.

Trình phân loại rất không đáng tin cậy đối với các văn bản ngắn (dưới 1,000 ký tự). Thậm chí các văn bản dài hơn đôi khi được bộ phân loại dán nhãn không chính xác.
Đôi khi, văn bản do con người viết sẽ bị bộ phân loại của chúng tôi dán nhãn không chính xác nhưng chắc chắn là do AI viết.
Chúng tôi khuyên bạn chỉ nên sử dụng trình phân loại cho văn bản tiếng Anh. Nó hoạt động kém hơn đáng kể trong các ngôn ngữ khác và nó không đáng tin cậy trên mã.
Văn bản rất dễ đoán không thể được xác định một cách đáng tin cậy. Ví dụ: không thể dự đoán liệu danh sách 1,000 số nguyên tố đầu tiên được viết bởi AI hay con người, bởi vì câu trả lời đúng luôn giống nhau.
Văn bản do AI viết có thể được chỉnh sửa để tránh bộ phân loại. Các bộ phân loại như của chúng tôi có thể được cập nhật và đào tạo lại dựa trên các cuộc tấn công thành công, nhưng không rõ liệu việc phát hiện có lợi thế về lâu dài hay không.
Các bộ phân loại dựa trên mạng thần kinh được biết là được hiệu chỉnh kém bên ngoài dữ liệu đào tạo của chúng. Đối với các đầu vào rất khác với văn bản trong tập huấn luyện của chúng tôi, bộ phân loại đôi khi cực kỳ tin tưởng vào một dự đoán sai.

Huấn luyện bộ phân loại

Trình phân loại của chúng tôi là một mô hình ngôn ngữ được tinh chỉnh trên tập dữ liệu gồm các cặp văn bản do con người viết và văn bản do AI viết về cùng một chủ đề. Chúng tôi đã thu thập tập dữ liệu này từ nhiều nguồn khác nhau mà chúng tôi tin là do con người viết ra, chẳng hạn như dữ liệu trước khi đào tạo và bản trình diễn của con người về lời nhắc được gửi tới Hướng dẫnGPT. Chúng tôi chia mỗi văn bản thành một lời nhắc và một phản hồi. Trên những lời nhắc này, chúng tôi đã tạo ra phản hồi từ nhiều mô hình ngôn ngữ khác nhau do chúng tôi và các tổ chức khác đào tạo. Đối với ứng dụng web của mình, chúng tôi điều chỉnh ngưỡng tin cậy để giữ tỷ lệ dương tính giả ở mức thấp; nói cách khác, chúng tôi chỉ đánh dấu văn bản có khả năng được viết bởi AI nếu trình phân loại rất tự tin.

Tác động đến các nhà giáo dục và kêu gọi đầu vào

Chúng tôi nhận thấy rằng việc xác định văn bản do AI viết là một điểm thảo luận quan trọng giữa các nhà giáo dục và điều quan trọng không kém là nhận ra các giới hạn và tác động của các trình phân loại văn bản do AI tạo ra trong lớp học. Chúng tôi đã phát triển một tài nguyên sơ bộ về việc sử dụng ChatGPT cho các nhà giáo dục, trong đó phác thảo một số cách sử dụng cũng như các hạn chế và cân nhắc liên quan. Mặc dù tài nguyên này tập trung vào các nhà giáo dục, nhưng chúng tôi hy vọng bộ phân loại và các công cụ phân loại liên quan của chúng tôi sẽ có tác động đến các nhà báo, nhà nghiên cứu thông tin sai/sai và các nhóm khác.

Chúng tôi đang hợp tác với các nhà giáo dục ở Hoa Kỳ để tìm hiểu những gì họ thấy trong lớp học của họ và thảo luận về các khả năng cũng như hạn chế của ChatGPT, đồng thời chúng tôi sẽ tiếp tục mở rộng phạm vi tiếp cận của mình khi chúng tôi tìm hiểu. Đây là những cuộc trò chuyện quan trọng cần có trong sứ mệnh của chúng tôi là triển khai các mô hình ngôn ngữ lớn một cách an toàn, tiếp xúc trực tiếp với các cộng đồng bị ảnh hưởng.

Nếu bạn bị ảnh hưởng trực tiếp bởi những vấn đề này (bao gồm nhưng không giới hạn ở giáo viên, quản trị viên, phụ huynh, học sinh và nhà cung cấp dịch vụ giáo dục), vui lòng cung cấp phản hồi cho chúng tôi bằng cách sử dụng biểu mẫu này. Phản hồi trực tiếp về tài nguyên sơ bộ hữu ích và chúng tôi cũng hoan nghênh mọi tài nguyên mà các nhà giáo dục đang phát triển hoặc thấy hữu ích (ví dụ: hướng dẫn khóa học, quy tắc danh dự và cập nhật chính sách, công cụ tương tác, chương trình xóa mù chữ AI).

Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
Platoblockchain. Web3 Metaverse Intelligence. Khuếch đại kiến thức. Truy cập Tại đây.
nguồn: https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/

Dấu thời gian: 31 Tháng một, 2023

Dấu thời gian: Tháng 25, 2024

Được xuất bản lại bởi Plato

Giới thiệu ChatGPT Enterprise

Đầu vào dân chủ cho AI

Tài trợ nhanh siêu liên kết

Giảm thiên vị và cải thiện an toàn trong DALL · E 2

Đào tạo hiệu quả các mô hình ngôn ngữ để điền vào giữa

plugin ChatGPT

Mô hình tạo video như mô phỏng thế giới

Đầu vào dân chủ cho chương trình tài trợ AI: bài học kinh nghiệm và kế hoạch thực hiện

Giới thiệu API ChatGPT và Whisper

Sora: Ấn tượng đầu tiên

Về chúng tôi

Tìm kiếm dọc & Ai

Nền tảng

NHẬN THÔNG TIN

Tài khoản