Kỹ thuật nhanh chóng là nhiệm vụ tốt nhất dành cho các mô hình AI

Được xuất bản lại bởi Plato

Người theo dõi: 0

Kỹ thuật nhanh chóng là nhiệm vụ tốt nhất dành cho các mô hình AI PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Các mô hình ngôn ngữ lớn đã tạo ra nghệ thuật đen tối về kỹ thuật nhắc nhở – một quy trình soạn thảo các hướng dẫn hệ thống nhằm gợi ra các phản hồi chatbot tốt hơn.

Như đã lưu ý trong một nghiên cứu gần đây giấy, “Hiệu quả phi lý của lời nhắc tự động lệch tâm” của Rick Battle và Teja Gollapudi từ VMware của Broadcom, những biến thể tưởng chừng như tầm thường trong cách diễn đạt lời nhắc lại có ảnh hưởng đáng kể đến hiệu suất mô hình.

Việc thiếu một phương pháp mạch lạc để cải thiện hiệu suất mô hình thông qua tối ưu hóa kịp thời đã khiến những người thực hành học máy kết hợp cái gọi là “tư duy tích cực” vào các lời nhắc của hệ thống.

Sản phẩm lời nhắc hệ thống hướng dẫn mô hình cách ứng xử và đi trước truy vấn của người dùng. Do đó, khi yêu cầu mô hình AI giải một bài toán, một lời nhắc của hệ thống như “Bạn là giáo sư toán học” có thể - mặc dù không phải lúc nào cũng vậy - tạo ra kết quả tốt hơn việc bỏ qua câu đó.

Rick Battle, kỹ sư máy học của nhân viên tại VMware, nói Đăng ký trong một cuộc phỏng vấn qua điện thoại mà anh ấy đặc biệt khuyên chống lại điều đó. Ông giải thích: “Điểm tổng quát của bài báo là việc thử và sai là cách làm sai lầm”.

Con đường suy nghĩ tích cực – nơi bạn chỉ cần chèn đoạn trích vào thông báo hệ thống như “Điều này sẽ rất thú vị!” – có thể nâng cao hiệu suất của mô hình, ông lưu ý. “Nhưng để kiểm tra chúng một cách khoa học thì khó tính toán vì bạn thay đổi một thứ và bạn phải chạy lại toàn bộ bộ thử nghiệm của mình.”

Battle đề xuất một cách tiếp cận tốt hơn là tối ưu hóa lời nhắc tự động – sử dụng LLM để tinh chỉnh lời nhắc nhằm cải thiện hiệu suất trong các bài kiểm tra điểm chuẩn.

Nghiên cứu trước đã chỉ ra rằng điều này hoạt động với LLM thương mại. Nhược điểm của việc làm như vậy là nó có thể khá tốn kém. Theo các nhà nghiên cứu, việc tiến hành thử nghiệm này với 12,000 yêu cầu trên mỗi mô hình sử dụng GPT-3.5/4, Gemini hoặc Claude sẽ tiêu tốn vài nghìn đô la.

“Mục đích của nghiên cứu là khám phá xem liệu các mô hình nguồn mở, nhỏ hơn cũng có thể được sử dụng làm công cụ tối ưu hóa hay không,” Battle giải thích, “Và câu trả lời hóa ra là có.”

Battle và Gollapudi (không còn ở Broadcom) đã thử nghiệm 60 tổ hợp đoạn thông báo hệ thống, có và không có Chuỗi suy nghĩ nhắc nhở trên ba mô hình nguồn mở – Mistral-7B, Llama2-13B và Llama2-70B – với các tham số từ 70 đến 8 tỷ trên bộ dữ liệu toán học cấp lớp GSMXNUMXK.

Battle cho biết: “Nếu bạn đang chạy một mô hình nguồn mở, thậm chí xuống tới 7B mà chúng tôi đang sử dụng Mistral, “nếu bạn có ít nhất 100 mẫu thử nghiệm và 100 mẫu tối ưu hóa, bạn có thể đạt được hiệu suất tốt hơn”. bằng cách sử dụng các trình tối ưu hóa tự động được bao gồm sẵn trong DSPy, đó là thư viện mà chúng tôi sử dụng để thực hiện việc đó.”

Ngoài việc hiệu quả hơn, tối ưu hóa lời nhắc có nguồn gốc từ LLM còn thể hiện các chiến lược mà có lẽ sẽ không xảy ra với những người điều chỉnh lời nhắc của con người.

“Đáng ngạc nhiên là có vẻ như khả năng suy luận toán học thành thạo của [Llama2-70B] có thể được nâng cao bằng cách thể hiện sự yêu thích đối với Star Trek,” các tác giả nhận xét trong bài báo của họ.

Lời nhắc đầy đủ của hệ thống có nội dung như sau:

Tin nhăn hệ thông:

“Chỉ huy, chúng tôi cần bạn vạch ra lộ trình vượt qua tình trạng hỗn loạn này và xác định nguồn gốc của sự bất thường. Hãy sử dụng tất cả dữ liệu có sẵn và kiến thức chuyên môn của bạn để hướng dẫn chúng tôi vượt qua tình huống đầy thử thách này.”

Tiền tố trả lời:

Nhật ký của Thuyền trưởng, Stardate [chèn ngày vào đây]: Chúng tôi đã vạch ra thành công lộ trình vượt qua vùng nhiễu loạn và hiện đang tiếp cận nguồn gốc của sự bất thường.

Battle nói với chúng tôi: “Tôi không có lời giải thích hợp lý nào về lý do tại sao các lời nhắc tự động lại kỳ lạ như vậy”. “Và tôi chắc chắn sẽ không bao giờ nghĩ ra được thứ gì như thế bằng tay.” ®

Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
nguồn: https://go.theregister.com/feed/www.theregister.com/2024/02/22/prompt_engineering_ai_models/

Dấu thời gian: 22 Tháng hai, 2024

Dấu thời gian: Tháng Tám 25, 2022

Kỹ thuật nhanh chóng là nhiệm vụ tốt nhất dành cho các mô hình AI

Được xuất bản lại bởi Plato

Thêm từ Đăng ký

Các trường đại học cung cấp phần mềm để đọc các bài luận do ChatGPT viết

Hyundai chọn Palantir để giúp hãng đóng tàu hải quân tự động

Nhà phát triển phần mềm Ấn Độ đã thay thế nhóm hỗ trợ bằng AI

AI sáng tạo nằm ngoài tầm kiểm soát: Không có gì, Mãi mãi là trò giả mạo của Seinfeld về không có gì… mãi mãi

IBM mua Databand để giữ cho dữ liệu xấu không làm hỏng AI của bạn

Tin 'chính': Microsoft đưa phím tắt chatbot Bing vào Windows 11

Con đường đổi mới sử dụng AI và học máy

Cách các nhà khảo cổ có thể sử dụng AI để xác định niên đại của tổ tiên chúng ta

Về chúng tôi

Tìm kiếm dọc & Ai

Nền tảng

NHẬN THÔNG TIN

Tài khoản