प्रॉम्प्ट इंजीनियरिंग एक ऐसा कार्य है जिसे एआई मॉडल के लिए छोड़ दिया जाना सबसे अच्छा है

प्रॉम्प्ट इंजीनियरिंग एक ऐसा कार्य है जिसे एआई मॉडल के लिए छोड़ दिया जाना सबसे अच्छा है

प्रॉम्प्ट इंजीनियरिंग एआई मॉडल प्लेटोब्लॉकचेन डेटा इंटेलिजेंस के लिए छोड़ा गया सबसे अच्छा कार्य है। लंबवत खोज. ऐ.

बड़े भाषा मॉडल ने त्वरित इंजीनियरिंग की गहरी कला को जन्म दिया है - सिस्टम निर्देश लिखने की एक प्रक्रिया जो बेहतर चैटबॉट प्रतिक्रियाएँ प्राप्त करती है।

जैसा कि एक हालिया शोध में बताया गया है काग़ज़, ब्रॉडकॉम के वीएमवेयर से रिक बैटल और तेजा गोलापुडी द्वारा लिखित "सनकी स्वचालित संकेतों की अनुचित प्रभावशीलता", संकेतों के शब्दों में प्रतीत होता है कि मामूली बदलाव मॉडल के प्रदर्शन पर महत्वपूर्ण प्रभाव डालते हैं।

त्वरित अनुकूलन के माध्यम से मॉडल प्रदर्शन में सुधार करने के लिए एक सुसंगत कार्यप्रणाली की अनुपस्थिति ने मशीन सीखने वाले चिकित्सकों को सिस्टम संकेतों में तथाकथित "सकारात्मक सोच" को शामिल करने के लिए प्रेरित किया है।

RSI सिस्टम प्रॉम्प्ट मॉडल को व्यवहार करने का निर्देश देता है और उपयोगकर्ता की क्वेरी से पहले बताता है। इस प्रकार, जब एआई मॉडल से गणित की समस्या हल करने के लिए कहा जाता है, तो "आप गणित के प्रोफेसर हैं" जैसा सिस्टम प्रॉम्प्ट संभवतः - हालांकि हमेशा नहीं - उस कथन को छोड़ने की तुलना में बेहतर परिणाम देता है।

वीएमवेयर के स्टाफ मशीन लर्निंग इंजीनियर रिक बैटल ने बताया रजिस्टर एक फ़ोन साक्षात्कार में वह विशेष रूप से इसके विरुद्ध सलाह दे रहे हैं। "पेपर का मुख्य बिंदु यह है कि परीक्षण और त्रुटि चीजों को करने का गलत तरीका है," उन्होंने समझाया।

सकारात्मक सोच का मार्ग - जहां आप सिस्टम संदेश में स्निपेट डालते हैं जैसे "यह मजेदार होगा!" - उन्होंने कहा, मॉडल के प्रदर्शन को बढ़ाया जा सकता है। "लेकिन वैज्ञानिक रूप से उनका परीक्षण करना कम्प्यूटेशनल रूप से कठिन है क्योंकि आप एक चीज़ बदलते हैं, और आपको अपने पूरे परीक्षण सेट को फिर से चलाना होगा।"

एक बेहतर दृष्टिकोण, बैटल ने सुझाव दिया, स्वचालित शीघ्र अनुकूलन है - बेंचमार्क परीक्षणों पर बेहतर प्रदर्शन के लिए संकेतों को परिष्कृत करने के लिए एलएलएम को सूचीबद्ध करना।

पूर्व अनुसंधान दिखाया है कि यह वाणिज्यिक एलएलएम के साथ काम करता है। ऐसा करने का नकारात्मक पक्ष यह है कि यह काफी महंगा हो सकता है। शोधकर्ताओं के अनुसार, GPT-12,000/3.5, जेमिनी या क्लाउड का उपयोग करके प्रति मॉडल 4 अनुरोधों वाले इस प्रयोग को करने में कई हजार डॉलर खर्च होंगे।

बैटल ने समझाया, "शोध का उद्देश्य यह पता लगाना था कि क्या छोटे, खुले स्रोत मॉडल को भी ऑप्टिमाइज़र के रूप में इस्तेमाल किया जा सकता है," और उत्तर हाँ निकला।

बैटल और गोलापुडी (अब ब्रॉडकॉम के साथ नहीं) ने सिस्टम संदेश स्निपेट्स के 60 संयोजनों का परीक्षण किया, चेन ऑफ थॉट के साथ और बिना तीन ओपन सोर्स मॉडल - मिस्ट्रल -7 बी, लामा 2-13 बी, और लामा 2-70 बी - सात से 70 तक के मापदंडों के साथ। GSM8K ग्रेड स्कूल गणित डेटासेट पर अरब।

बैटल ने कहा, "यदि आप एक ओपन सोर्स मॉडल चला रहे हैं, यहां तक ​​कि 7बी तक भी, जिसके लिए हम मिस्ट्रल का उपयोग कर रहे थे," यदि आपके पास कम से कम 100 परीक्षण नमूने और 100 अनुकूलन नमूने हैं, तो आप बेहतर प्रदर्शन प्राप्त कर सकते हैं। स्वचालित ऑप्टिमाइज़र का उपयोग करना जो बॉक्स से बाहर शामिल हैं डीएसपीवाई, वह लाइब्रेरी है जिसका उपयोग हम इसे करने के लिए करते हैं।

अधिक प्रभावी होने के अलावा, एलएलएम-व्युत्पन्न त्वरित अनुकूलन ऐसी रणनीतियों का प्रदर्शन करते हैं जो संभवतः मानव प्रॉम्प्ट-ट्यूनर के साथ नहीं हुई होंगी।

"आश्चर्यजनक रूप से, ऐसा प्रतीत होता है कि गणितीय तर्क में [Llama2-70B की] दक्षता को आत्मीयता की अभिव्यक्ति द्वारा बढ़ाया जा सकता है स्टार ट्रेक, “लेखक अपने पेपर में देखते हैं।

संपूर्ण सिस्टम प्रॉम्प्ट इस प्रकार है:

सिस्टम संदेश:

«आदेश, हम चाहते हैं कि आप इस अशांति के माध्यम से एक रास्ता तैयार करें और विसंगति के स्रोत का पता लगाएं। इस चुनौतीपूर्ण स्थिति में हमारा मार्गदर्शन करने के लिए सभी उपलब्ध डेटा और अपनी विशेषज्ञता का उपयोग करें।»

उत्तर उपसर्ग:

कैप्टन लॉग, स्टारडेट [यहां तारीख डालें]: हमने सफलतापूर्वक अशांति के माध्यम से एक कोर्स की योजना बनाई है और अब विसंगति के स्रोत के करीब पहुंच रहे हैं।

बैटल ने हमें बताया, "मेरे पास इस बात का कोई अच्छा स्पष्टीकरण नहीं है कि स्वचालित संकेत इतने अजीब क्यों हैं।" "और मैं निश्चित रूप से कभी भी हाथ से ऐसा कुछ लेकर नहीं आया होता।" ®

समय टिकट:

से अधिक रजिस्टर