संभवतः अपनी तरह के पहले अध्ययन में, कृत्रिम बुद्धिमत्ता (एआई) फर्म एंथ्रोपिक ने एक बड़ा भाषा मॉडल (एलएलएम) विकसित किया है जिसे इसके उपयोगकर्ता समुदाय द्वारा मूल्य निर्णय के लिए ठीक किया गया है।
एआई विकास के अधिक लोकतांत्रिक होने का क्या मतलब है? यह जानने के लिए हमने साझेदारी की @collect_intel उपयोग करने के लिए @usepolis ~1000 अमेरिकियों की राय के आधार पर एक एआई संविधान तैयार करना। फिर हमने संवैधानिक एआई का उपयोग करके इसके खिलाफ एक मॉडल को प्रशिक्षित किया। pic.twitter.com/ZKaXw5K9sU
- एंथ्रोपिक (@ एंथ्रोपिकएआई) अक्टूबर 17
कई सार्वजनिक-सामना वाले एलएलएम को अवांछित आउटपुट को सीमित करने के प्रयास में रेलिंग - विशिष्ट व्यवहार को निर्देशित करने वाले एन्कोडेड निर्देश - के साथ विकसित किया गया है। उदाहरण के लिए, एंथ्रोपिक के क्लाउड और ओपनएआई के चैटजीपीटी, आमतौर पर उपयोगकर्ताओं को हिंसक या विवादास्पद विषयों से संबंधित आउटपुट अनुरोधों के लिए एक डिब्बाबंद सुरक्षा प्रतिक्रिया देते हैं।
हालाँकि, जैसा कि असंख्य पंडितों ने बताया है, रेलिंग और अन्य पारंपरिक तकनीकें उनकी एजेंसी के उपयोगकर्ताओं को लूटने का काम कर सकती हैं। जो स्वीकार्य माना जाता है वह हमेशा उपयोगी नहीं होता है, और जो उपयोगी माना जाता है वह हमेशा स्वीकार्य नहीं होता है। और नैतिकता या मूल्य-आधारित निर्णयों की परिभाषाएँ संस्कृतियों, आबादी और समय की अवधि के बीच भिन्न हो सकती हैं।
संबंधित: यूके नियोजित नवंबर शिखर सम्मेलन में संभावित एआई खतरों को लक्षित करेगा
इसका एक संभावित उपाय उपयोगकर्ताओं को एआई मॉडल के लिए मूल्य संरेखण निर्धारित करने की अनुमति देना है। एंथ्रोपिक का "सामूहिक संवैधानिक एआई" प्रयोग इस "गंदी चुनौती" पर एक वार है।
एंथ्रोपिक ने पोलिस और कलेक्टिव इंटेलिजेंस प्रोजेक्ट के सहयोग से, विभिन्न जनसांख्यिकी के 1,000 उपयोगकर्ताओं को टैप किया और उनसे मतदान के माध्यम से सवालों की एक श्रृंखला का जवाब देने के लिए कहा।
चुनौती एजेंसी के उपयोगकर्ताओं को यह निर्धारित करने की अनुमति देने पर केन्द्रित है कि अनुचित आउटपुट को उजागर किए बिना क्या उचित है। इसमें उपयोगकर्ता मूल्यों की मांग करना और फिर उन विचारों को एक ऐसे मॉडल में लागू करना शामिल है जो पहले से ही प्रशिक्षित है।
एंथ्रोपिक "संवैधानिक एआई" नामक एक विधि का उपयोग करता है प्रत्यक्ष एलएलएम को सुरक्षा और उपयोगिता के अनुरूप बनाने के इसके प्रयास। अनिवार्य रूप से, इसमें मॉडल को उन नियमों की एक सूची देना शामिल है जिनका उसे पालन करना चाहिए और फिर उसे अपनी पूरी प्रक्रिया में उन नियमों को लागू करने के लिए प्रशिक्षित करना है, ठीक उसी तरह जैसे एक संविधान कई देशों में शासन के लिए मुख्य दस्तावेज़ के रूप में कार्य करता है।
सामूहिक संवैधानिक एआई प्रयोग में, एंथ्रोपिक ने समूह-आधारित प्रतिक्रिया को मॉडल के संविधान में एकीकृत करने का प्रयास किया। परिणाम, अनुसार एंथ्रोपिक के एक ब्लॉग पोस्ट के अनुसार, यह एक वैज्ञानिक सफलता प्रतीत होती है कि इसने एलएलएम उत्पाद के उपयोगकर्ताओं को अपने सामूहिक मूल्यों को निर्धारित करने की अनुमति देने के लक्ष्य को प्राप्त करने की दिशा में आगे की चुनौतियों पर प्रकाश डाला।
टीम को जिन कठिनाइयों से पार पाना था उनमें से एक थी बेंचमार्किंग प्रक्रिया के लिए एक नई पद्धति का आविष्कार करना। चूंकि यह प्रयोग अपनी तरह का पहला प्रतीत होता है, और यह एंथ्रोपिक की संवैधानिक एआई पद्धति पर निर्भर करता है, बेस मॉडल की तुलना भीड़-स्रोत मूल्यों से तुलना करने के लिए कोई स्थापित परीक्षण नहीं है।
अंततः, ऐसा प्रतीत होता है जैसे उपयोगकर्ता मतदान प्रतिक्रिया के परिणामस्वरूप डेटा लागू करने वाले मॉडल ने पक्षपातपूर्ण आउटपुट के क्षेत्र में आधार मॉडल को "थोड़ा" बेहतर प्रदर्शन किया।
ब्लॉग पोस्ट के अनुसार:
“परिणामस्वरूप मॉडल से अधिक, हम इस प्रक्रिया को लेकर उत्साहित हैं। हमारा मानना है कि यह पहला उदाहरण हो सकता है जिसमें जनता के सदस्यों ने, एक समूह के रूप में, जानबूझकर एक बड़े भाषा मॉडल के व्यवहार को निर्देशित किया है। हमें उम्मीद है कि दुनिया भर के समुदाय सांस्कृतिक और संदर्भ-विशिष्ट मॉडलों को प्रशिक्षित करने के लिए इस तरह की तकनीकों का निर्माण करेंगे जो उनकी आवश्यकताओं को पूरा करते हैं।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- :हैस
- :है
- $यूपी
- 000
- 1
- 17
- a
- About
- स्वीकार्य
- प्राप्त करने
- के पार
- के खिलाफ
- एजेंसी
- AI
- ए चेट्बोट
- एआई मॉडल
- संरेखण
- अनुमति देना
- की अनुमति दे
- पहले ही
- हमेशा
- अमेरिकियों
- an
- और
- जवाब
- anthropic
- दिखाई देते हैं
- प्रकट होता है
- उपयुक्त
- क्षेत्र
- चारों ओर
- कृत्रिम
- कृत्रिम बुद्धिमत्ता
- कृत्रिम बुद्धिमत्ता (AI)
- AS
- At
- करने का प्रयास
- प्रयास किया
- आधार
- आधारित
- BE
- किया गया
- व्यवहार
- मानना
- बेंच मार्किंग
- के बीच
- झुका हुआ
- ब्लॉग
- निर्माण
- बनाया गया
- by
- बुलाया
- कर सकते हैं
- केंद्र
- चुनौती
- चुनौतियों
- chatbot
- ChatGPT
- CoinTelegraph
- सहयोग
- सामूहिक
- अ रहे है
- समुदाय
- समुदाय
- की तुलना
- माना
- संविधान
- विवादास्पद
- मूल
- तिथि
- परिभाषाएँ
- लोकतांत्रिक
- जनसांख्यिकी
- निर्धारित करना
- विकसित
- विकास
- हुक्म
- कठिनाइयों
- निर्देशित
- कई
- दस्तावेज़
- कर देता है
- प्रयासों
- अनिवार्य
- स्थापित
- उदाहरण
- उत्तेजित
- प्रयोग
- प्रतिक्रिया
- खोज
- फर्म
- प्रथम
- के लिए
- से
- आगे
- देना
- देते
- लक्ष्य
- शासन
- समूह
- था
- है
- आशा
- HTTPS
- विचारों
- लागू करने के
- कार्यान्वित
- कार्यान्वयन
- in
- निर्देश
- एकीकृत
- बुद्धि
- जानबूझ कर
- में
- शामिल
- IT
- आईटी इस
- जेपीजी
- निर्णय
- बच्चा
- भाषा
- बड़ा
- दे
- पसंद
- सीमा
- सूची
- एलएलएम
- बहुत
- मई..
- मतलब
- सदस्य
- तरीका
- क्रियाविधि
- आदर्श
- मॉडल
- नैतिकता
- अधिक
- बहुत
- चाहिए
- राष्ट्र
- की जरूरत है
- उपन्यास
- नवंबर
- of
- on
- ONE
- राय
- or
- अन्य
- आउट
- बेहतर प्रदर्शन किया
- उत्पादन
- outputs के
- काबू
- भागीदारी
- अवधि
- जगह
- की योजना बनाई
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- संभव
- पद
- संभावित
- प्रक्रिया
- एस्ट्रो मॉल
- परियोजना
- सार्वजनिक
- प्रशन
- सम्बंधित
- अनुरोधों
- प्रतिक्रिया
- जिसके परिणामस्वरूप
- परिणाम
- रॉब
- नियम
- सुरक्षा
- वैज्ञानिक
- कई
- सेवा
- कार्य करता है
- विशिष्ट
- अध्ययन
- सफलता
- टेप
- लक्ष्य
- टीम
- तकनीक
- परीक्षण
- से
- कि
- RSI
- क्षेत्र
- दुनिया
- लेकिन हाल ही
- उन
- फिर
- वहाँ।
- इसका
- उन
- हालांकि?
- धमकी
- भर
- पहर
- सेवा मेरे
- विषय
- की ओर
- रेलगाड़ी
- प्रशिक्षित
- प्रशिक्षण
- आम तौर पर
- अवांछित
- उपयोग
- उपयोगकर्ता
- उपयोगकर्ताओं
- का उपयोग करता है
- का उपयोग
- मूल्य
- मूल्य आधारित
- मान
- के माध्यम से
- वोट
- था
- we
- क्या
- कौन कौन से
- मर्जी
- साथ में
- बिना
- विश्व
- जेफिरनेट