एंथ्रोपिक ने उपयोगकर्ताओं को इसके मूल्यों के लिए वोट करने की सुविधा देकर एक लोकतांत्रिक एआई चैटबॉट बनाया

एंथ्रोपिक ने उपयोगकर्ताओं को इसके मूल्यों के लिए वोट करने की सुविधा देकर एक लोकतांत्रिक एआई चैटबॉट बनाया

संभवतः अपनी तरह के पहले अध्ययन में, कृत्रिम बुद्धिमत्ता (एआई) फर्म एंथ्रोपिक ने एक बड़ा भाषा मॉडल (एलएलएम) विकसित किया है जिसे इसके उपयोगकर्ता समुदाय द्वारा मूल्य निर्णय के लिए ठीक किया गया है।

कई सार्वजनिक-सामना वाले एलएलएम को अवांछित आउटपुट को सीमित करने के प्रयास में रेलिंग - विशिष्ट व्यवहार को निर्देशित करने वाले एन्कोडेड निर्देश - के साथ विकसित किया गया है। उदाहरण के लिए, एंथ्रोपिक के क्लाउड और ओपनएआई के चैटजीपीटी, आमतौर पर उपयोगकर्ताओं को हिंसक या विवादास्पद विषयों से संबंधित आउटपुट अनुरोधों के लिए एक डिब्बाबंद सुरक्षा प्रतिक्रिया देते हैं।

हालाँकि, जैसा कि असंख्य पंडितों ने बताया है, रेलिंग और अन्य पारंपरिक तकनीकें उनकी एजेंसी के उपयोगकर्ताओं को लूटने का काम कर सकती हैं। जो स्वीकार्य माना जाता है वह हमेशा उपयोगी नहीं होता है, और जो उपयोगी माना जाता है वह हमेशा स्वीकार्य नहीं होता है। और नैतिकता या मूल्य-आधारित निर्णयों की परिभाषाएँ संस्कृतियों, आबादी और समय की अवधि के बीच भिन्न हो सकती हैं।

संबंधित: यूके नियोजित नवंबर शिखर सम्मेलन में संभावित एआई खतरों को लक्षित करेगा

इसका एक संभावित उपाय उपयोगकर्ताओं को एआई मॉडल के लिए मूल्य संरेखण निर्धारित करने की अनुमति देना है। एंथ्रोपिक का "सामूहिक संवैधानिक एआई" प्रयोग इस "गंदी चुनौती" पर एक वार है।

एंथ्रोपिक ने पोलिस और कलेक्टिव इंटेलिजेंस प्रोजेक्ट के सहयोग से, विभिन्न जनसांख्यिकी के 1,000 उपयोगकर्ताओं को टैप किया और उनसे मतदान के माध्यम से सवालों की एक श्रृंखला का जवाब देने के लिए कहा।

एंथ्रोपिक ने उपयोगकर्ताओं को इसके मूल्यों प्लेटोब्लॉकचेन डेटा इंटेलिजेंस के लिए वोट करने की अनुमति देकर एक लोकतांत्रिक एआई चैटबॉट बनाया। लंबवत खोज. ऐ.
स्रोत, anthropic

चुनौती एजेंसी के उपयोगकर्ताओं को यह निर्धारित करने की अनुमति देने पर केन्द्रित है कि अनुचित आउटपुट को उजागर किए बिना क्या उचित है। इसमें उपयोगकर्ता मूल्यों की मांग करना और फिर उन विचारों को एक ऐसे मॉडल में लागू करना शामिल है जो पहले से ही प्रशिक्षित है।

एंथ्रोपिक "संवैधानिक एआई" नामक एक विधि का उपयोग करता है प्रत्यक्ष एलएलएम को सुरक्षा और उपयोगिता के अनुरूप बनाने के इसके प्रयास। अनिवार्य रूप से, इसमें मॉडल को उन नियमों की एक सूची देना शामिल है जिनका उसे पालन करना चाहिए और फिर उसे अपनी पूरी प्रक्रिया में उन नियमों को लागू करने के लिए प्रशिक्षित करना है, ठीक उसी तरह जैसे एक संविधान कई देशों में शासन के लिए मुख्य दस्तावेज़ के रूप में कार्य करता है।

सामूहिक संवैधानिक एआई प्रयोग में, एंथ्रोपिक ने समूह-आधारित प्रतिक्रिया को मॉडल के संविधान में एकीकृत करने का प्रयास किया। परिणाम, अनुसार एंथ्रोपिक के एक ब्लॉग पोस्ट के अनुसार, यह एक वैज्ञानिक सफलता प्रतीत होती है कि इसने एलएलएम उत्पाद के उपयोगकर्ताओं को अपने सामूहिक मूल्यों को निर्धारित करने की अनुमति देने के लक्ष्य को प्राप्त करने की दिशा में आगे की चुनौतियों पर प्रकाश डाला।

टीम को जिन कठिनाइयों से पार पाना था उनमें से एक थी बेंचमार्किंग प्रक्रिया के लिए एक नई पद्धति का आविष्कार करना। चूंकि यह प्रयोग अपनी तरह का पहला प्रतीत होता है, और यह एंथ्रोपिक की संवैधानिक एआई पद्धति पर निर्भर करता है, बेस मॉडल की तुलना भीड़-स्रोत मूल्यों से तुलना करने के लिए कोई स्थापित परीक्षण नहीं है।

अंततः, ऐसा प्रतीत होता है जैसे उपयोगकर्ता मतदान प्रतिक्रिया के परिणामस्वरूप डेटा लागू करने वाले मॉडल ने पक्षपातपूर्ण आउटपुट के क्षेत्र में आधार मॉडल को "थोड़ा" बेहतर प्रदर्शन किया।

ब्लॉग पोस्ट के अनुसार:

“परिणामस्वरूप मॉडल से अधिक, हम इस प्रक्रिया को लेकर उत्साहित हैं। हमारा मानना ​​है कि यह पहला उदाहरण हो सकता है जिसमें जनता के सदस्यों ने, एक समूह के रूप में, जानबूझकर एक बड़े भाषा मॉडल के व्यवहार को निर्देशित किया है। हमें उम्मीद है कि दुनिया भर के समुदाय सांस्कृतिक और संदर्भ-विशिष्ट मॉडलों को प्रशिक्षित करने के लिए इस तरह की तकनीकों का निर्माण करेंगे जो उनकी आवश्यकताओं को पूरा करते हैं।

समय टिकट:

से अधिक CoinTelegraph