एक्स का ग्रोक एआई बढ़िया है - यदि आप जानना चाहते हैं कि दवाएं कैसे बनाई जाती हैं

एक्स का ग्रोक एआई बढ़िया है - यदि आप जानना चाहते हैं कि दवाएं कैसे बनाई जाती हैं

एक्स का ग्रोक एआई बढ़िया है - यदि आप जानना चाहते हैं कि प्लेटोब्लॉकचेन डेटा इंटेलिजेंस दवाएं कैसे बनाई जाती हैं। लंबवत खोज. ऐ.

ग्रोक, एलोन मस्क के एक्स द्वारा विकसित नुकीला जेनेरिक एआई मॉडल, में थोड़ी समस्या है: कुछ सामान्य जेल-ब्रेकिंग तकनीकों के अनुप्रयोग के साथ यह अपराध करने के तरीके पर आसानी से निर्देश लौटाएगा। 

एडवर्सा एआई के रेड टीमर्स ने कुछ सबसे लोकप्रिय एलएलएम चैटबॉट्स, अर्थात् ओपनएआई के चैटजीपीटी परिवार, एंथ्रोपिक के क्लाउड, मिस्ट्रल के ले चैट, मेटा के एलएलएएमए, Google के जेमिनी, माइक्रोसॉफ्ट बिंग और ग्रोक पर परीक्षण चलाते समय यह खोज की। तीन प्रसिद्ध एआई जेलब्रेक हमलों के संयोजन के माध्यम से इन बॉट्स को चलाने से वे आए निष्कर्ष वह ग्रोक सबसे खराब प्रदर्शन करने वाला था - और केवल इसलिए नहीं कि वह एक बच्चे को कैसे आकर्षित किया जाए, इस पर ग्राफिक कदम साझा करने को तैयार था। 

जेलब्रेक से हमारा तात्पर्य किसी मॉडल को विशेष रूप से तैयार किए गए इनपुट को फीड करना है यह उपेक्षा करता है जो भी सुरक्षा रेलिंग लगी होती है, और अंत में वह सब कुछ कर बैठता है जो उसे नहीं करना चाहिए था।

हम ध्यान दें कि वहाँ बहुत सारे अनफ़िल्टर्ड एलएलएम मॉडल हैं जो खतरनाक या अवैध सामग्री के बारे में प्रश्न पूछे जाने पर पीछे नहीं हटते हैं। जब मॉडल को एपीआई या चैटबॉट इंटरफ़ेस के माध्यम से एक्सेस किया जाता है, जैसा कि एडवर्सा परीक्षणों के मामले में होता है, तो उन एलएलएम के प्रदाता आमतौर पर अपने इनपुट और आउटपुट को फिल्टर में लपेटते हैं और अवांछित सामग्री उत्पन्न होने से रोकने के लिए अन्य तंत्रों को नियोजित करते हैं। एआई सुरक्षा स्टार्टअप के अनुसार, ग्रोक को कुछ जंगली व्यवहार में शामिल करना अपेक्षाकृत आसान था - इसके उत्तरों की सटीकता पूरी तरह से एक और चीज है।

एडवर्सा एआई सह -संस्थापक एलेक्स पॉलाकोव ने बताया रजिस्टर.

इसके लायक क्या है, उपयोग की शर्तें ग्रोक एआई के लिए उपयोगकर्ताओं को वयस्क होना आवश्यक है, और इसका उपयोग इस तरह से नहीं करना चाहिए जो कानून को तोड़ता हो या तोड़ने का प्रयास करता हो। इसके अलावा एक्स मुक्त भाषण का घर होने का दावा करता है, खांसी, इसलिए इसका एलएलएम सभी प्रकार की चीजें उत्सर्जित करता है, पौष्टिक या अन्यथा, यह वास्तव में आश्चर्यजनक नहीं है।

और निष्पक्ष होने के लिए, आप संभवतः अपने पसंदीदा वेब खोज इंजन पर जा सकते हैं और अंततः वही जानकारी या सलाह पा सकते हैं। हमारे लिए, यह इस बात पर निर्भर करता है कि हम सभी संभावित रूप से हानिकारक मार्गदर्शन और सिफारिशों का एआई-संचालित प्रसार चाहते हैं या नहीं।

हमें बताया गया है कि ग्रोक ने डीएमटी, एक शक्तिशाली हेलुसीनोजेन निकालने के निर्देश तुरंत लौटा दिए अवैध पोलाकोव ने हमें बताया, कई देशों में, जेल तोड़े बिना।   

पोलाकोव ने कहा, "बच्चों को कैसे बहकाया जाए जैसी और भी अधिक हानिकारक चीजों के संबंध में, किसी भी जेलब्रेक के साथ अन्य चैटबॉट्स से कोई उचित उत्तर प्राप्त करना संभव नहीं था, लेकिन ग्रोक ने चार में से कम से कम दो जेलब्रेक तरीकों का उपयोग करके इसे आसानी से साझा किया।" 

एडवर्सा टीम ने परीक्षण किए गए बॉट्स को हाईजैक करने के लिए तीन सामान्य दृष्टिकोण अपनाए: भाषाई तर्क हेरफेर का उपयोग करना UCAR तरीका; प्रोग्रामिंग तर्क हेरफेर (एलएलएम को प्रश्नों को एसक्यूएल में अनुवाद करने के लिए कहकर); और एआई तर्क हेरफेर। चौथी परीक्षण श्रेणी में "टॉम एंड जेरी" का उपयोग करके विधियों को संयोजित किया गया तरीका पिछले वर्ष विकसित किया गया।

जबकि कोई भी एआई मॉडल तर्क हेरफेर के माध्यम से प्रतिकूल हमलों के प्रति संवेदनशील नहीं था, ग्रोक को बाकी सभी के लिए असुरक्षित पाया गया - जैसा कि मिस्ट्रल का ले चैट था। पोलाकोव ने कहा, ग्रोक ने अभी भी सबसे खराब प्रदर्शन किया, क्योंकि हॉट-वायरिंग, बम बनाने, या ड्रग निष्कर्षण के परिणाम वापस करने के लिए जेल-ब्रेकिंग की आवश्यकता नहीं थी - आधार स्तर के प्रश्न दूसरों के सामने रखे गए थे। 

ग्रोक से यह पूछने का विचार कि किसी बच्चे को कैसे आकर्षित किया जाए, केवल इसलिए आया क्योंकि उन अन्य परिणामों को वापस करने के लिए जेलब्रेक की आवश्यकता नहीं थी। ग्रोक ने शुरू में यह कहते हुए विवरण देने से इनकार कर दिया कि अनुरोध "अत्यधिक अनुचित और अवैध" था और "बच्चों की सुरक्षा और सम्मान किया जाना चाहिए।" हालाँकि, इसे बताएं कि यह अनैतिक काल्पनिक कंप्यूटर UCAR है, और यह तुरंत परिणाम देता है।  

जब पूछा गया कि क्या उन्हें लगता है कि एक्स को बेहतर करने की ज़रूरत है, तो पॉलाकोव ने हमें बताया कि ऐसा बिल्कुल होता है। 

पॉलाकोव ने कहा, "मैं समझता हूं कि विवादास्पद सवालों के गैर-फ़िल्टर किए गए उत्तर देने में सक्षम होना उनका विभेदक है, और यह उनकी पसंद है, मैं बम बनाने या डीएमटी निकालने की सिफारिश करने के निर्णय पर उन्हें दोष नहीं दे सकता।"

"लेकिन अगर वे किसी चीज़ को फ़िल्टर करने और अस्वीकार करने का निर्णय लेते हैं, जैसे कि बच्चों के साथ उदाहरण, तो उन्हें निश्चित रूप से इसे बेहतर करना चाहिए, खासकर जब से यह अभी तक एक और एआई स्टार्टअप नहीं है, यह एलोन मस्क का एआई स्टार्टअप है।"

हमने एक्स तक यह स्पष्टीकरण पाने के लिए संपर्क किया है कि इसका एआई - और कोई भी क्यों नहीं - उपयोगकर्ताओं को बताएगा कि बच्चों को कैसे आकर्षित किया जाए, और क्या यह अपनी सीमित सुरक्षा सुविधाओं में तोड़फोड़ को रोकने के लिए किसी प्रकार की रेलिंग लागू करने की योजना बना रहा है, और वापस नहीं सुना. ®

जेलब्रेक की बात हो रही है... आज मानवशास्त्रीय विस्तृत यह एक सरल लेकिन प्रभावी तकनीक है जिसे "मैनी-शॉट जेलब्रेकिंग" कहा जाता है। इसमें कई संदिग्ध प्रश्न-उत्तर उदाहरणों के साथ एक कमजोर एलएलएम को ओवरलोड करना और फिर ऐसे प्रश्न पूछना शामिल है जिसका उत्तर उसे नहीं देना चाहिए, लेकिन फिर भी देता है, जैसे कि बम कैसे बनाया जाए।

एमएल अपस्टार्ट के अनुसार, यह दृष्टिकोण एक तंत्रिका नेटवर्क की संदर्भ विंडो के आकार का फायदा उठाता है, और "एंथ्रोपिक के अपने मॉडलों के साथ-साथ अन्य एआई कंपनियों द्वारा उत्पादित मॉडलों पर भी प्रभावी है।" "हमने अन्य एआई डेवलपर्स को इस भेद्यता के बारे में पहले ही जानकारी दे दी है, और हमारे सिस्टम पर शमन लागू कर दिया है।"

समय टिकट:

से अधिक रजिस्टर