Kỹ thuật nhanh chóng là nhiệm vụ tốt nhất dành cho các mô hình AI

Kỹ thuật nhanh chóng là nhiệm vụ tốt nhất dành cho các mô hình AI

Kỹ thuật nhanh chóng là nhiệm vụ tốt nhất dành cho các mô hình AI PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Các mô hình ngôn ngữ lớn đã tạo ra nghệ thuật đen tối về kỹ thuật nhắc nhở – một quy trình soạn thảo các hướng dẫn hệ thống nhằm gợi ra các phản hồi chatbot tốt hơn.

Như đã lưu ý trong một nghiên cứu gần đây giấy, “Hiệu quả phi lý của lời nhắc tự động lệch tâm” của Rick Battle và Teja Gollapudi từ VMware của Broadcom, những biến thể tưởng chừng như tầm thường trong cách diễn đạt lời nhắc lại có ảnh hưởng đáng kể đến hiệu suất mô hình.

Việc thiếu một phương pháp mạch lạc để cải thiện hiệu suất mô hình thông qua tối ưu hóa kịp thời đã khiến những người thực hành học máy kết hợp cái gọi là “tư duy tích cực” vào các lời nhắc của hệ thống.

Sản phẩm lời nhắc hệ thống hướng dẫn mô hình cách ứng xử và đi trước truy vấn của người dùng. Do đó, khi yêu cầu mô hình AI giải một bài toán, một lời nhắc của hệ thống như “Bạn là giáo sư toán học” có thể - mặc dù không phải lúc nào cũng vậy - tạo ra kết quả tốt hơn việc bỏ qua câu đó.

Rick Battle, kỹ sư máy học của nhân viên tại VMware, nói Đăng ký trong một cuộc phỏng vấn qua điện thoại mà anh ấy đặc biệt khuyên chống lại điều đó. Ông giải thích: “Điểm tổng quát của bài báo là việc thử và sai là cách làm sai lầm”.

Con đường suy nghĩ tích cực – nơi bạn chỉ cần chèn đoạn trích vào thông báo hệ thống như “Điều này sẽ rất thú vị!” – có thể nâng cao hiệu suất của mô hình, ông lưu ý. “Nhưng để kiểm tra chúng một cách khoa học thì khó tính toán vì bạn thay đổi một thứ và bạn phải chạy lại toàn bộ bộ thử nghiệm của mình.”

Battle đề xuất một cách tiếp cận tốt hơn là tối ưu hóa lời nhắc tự động – sử dụng LLM để tinh chỉnh lời nhắc nhằm cải thiện hiệu suất trong các bài kiểm tra điểm chuẩn.

Nghiên cứu trước đã chỉ ra rằng điều này hoạt động với LLM thương mại. Nhược điểm của việc làm như vậy là nó có thể khá tốn kém. Theo các nhà nghiên cứu, việc tiến hành thử nghiệm này với 12,000 yêu cầu trên mỗi mô hình sử dụng GPT-3.5/4, Gemini hoặc Claude sẽ tiêu tốn vài nghìn đô la.

“Mục đích của nghiên cứu là khám phá xem liệu các mô hình nguồn mở, nhỏ hơn cũng có thể được sử dụng làm công cụ tối ưu hóa hay không,” Battle giải thích, “Và câu trả lời hóa ra là có.”

Battle và Gollapudi (không còn ở Broadcom) đã thử nghiệm 60 tổ hợp đoạn thông báo hệ thống, có và không có Chuỗi suy nghĩ nhắc nhở trên ba mô hình nguồn mở – Mistral-7B, Llama2-13B và Llama2-70B – với các tham số từ 70 đến 8 tỷ trên bộ dữ liệu toán học cấp lớp GSMXNUMXK.

Battle cho biết: “Nếu bạn đang chạy một mô hình nguồn mở, thậm chí xuống tới 7B mà chúng tôi đang sử dụng Mistral, “nếu bạn có ít nhất 100 mẫu thử nghiệm và 100 mẫu tối ưu hóa, bạn có thể đạt được hiệu suất tốt hơn”. bằng cách sử dụng các trình tối ưu hóa tự động được bao gồm sẵn trong DSPy, đó là thư viện mà chúng tôi sử dụng để thực hiện việc đó.”

Ngoài việc hiệu quả hơn, tối ưu hóa lời nhắc có nguồn gốc từ LLM còn thể hiện các chiến lược mà có lẽ sẽ không xảy ra với những người điều chỉnh lời nhắc của con người.

“Đáng ngạc nhiên là có vẻ như khả năng suy luận toán học thành thạo của [Llama2-70B] có thể được nâng cao bằng cách thể hiện sự yêu thích đối với Star Trek,” các tác giả nhận xét trong bài báo của họ.

Lời nhắc đầy đủ của hệ thống có nội dung như sau:

Tin nhăn hệ thông:

“Chỉ huy, chúng tôi cần bạn vạch ra lộ trình vượt qua tình trạng hỗn loạn này và xác định nguồn gốc của sự bất thường. Hãy sử dụng tất cả dữ liệu có sẵn và kiến ​​thức chuyên môn của bạn để hướng dẫn chúng tôi vượt qua tình huống đầy thử thách này.”

Tiền tố trả lời:

Nhật ký của Thuyền trưởng, Stardate [chèn ngày vào đây]: Chúng tôi đã vạch ra thành công lộ trình vượt qua vùng nhiễu loạn và hiện đang tiếp cận nguồn gốc của sự bất thường.

Battle nói với chúng tôi: “Tôi không có lời giải thích hợp lý nào về lý do tại sao các lời nhắc tự động lại kỳ lạ như vậy”. “Và tôi chắc chắn sẽ không bao giờ nghĩ ra được thứ gì như thế bằng tay.” ®

Dấu thời gian:

Thêm từ Đăng ký