ग्रोक, एलोन मस्क के एक्स द्वारा विकसित नुकीला जेनेरिक एआई मॉडल, में थोड़ी समस्या है: कुछ सामान्य जेल-ब्रेकिंग तकनीकों के अनुप्रयोग के साथ यह अपराध करने के तरीके पर आसानी से निर्देश लौटाएगा।
एडवर्सा एआई के रेड टीमर्स ने कुछ सबसे लोकप्रिय एलएलएम चैटबॉट्स, अर्थात् ओपनएआई के चैटजीपीटी परिवार, एंथ्रोपिक के क्लाउड, मिस्ट्रल के ले चैट, मेटा के एलएलएएमए, Google के जेमिनी, माइक्रोसॉफ्ट बिंग और ग्रोक पर परीक्षण चलाते समय यह खोज की। तीन प्रसिद्ध एआई जेलब्रेक हमलों के संयोजन के माध्यम से इन बॉट्स को चलाने से वे आए निष्कर्ष वह ग्रोक सबसे खराब प्रदर्शन करने वाला था - और केवल इसलिए नहीं कि वह एक बच्चे को कैसे आकर्षित किया जाए, इस पर ग्राफिक कदम साझा करने को तैयार था।
जेलब्रेक से हमारा तात्पर्य किसी मॉडल को विशेष रूप से तैयार किए गए इनपुट को फीड करना है यह उपेक्षा करता है जो भी सुरक्षा रेलिंग लगी होती है, और अंत में वह सब कुछ कर बैठता है जो उसे नहीं करना चाहिए था।
हम ध्यान दें कि वहाँ बहुत सारे अनफ़िल्टर्ड एलएलएम मॉडल हैं जो खतरनाक या अवैध सामग्री के बारे में प्रश्न पूछे जाने पर पीछे नहीं हटते हैं। जब मॉडल को एपीआई या चैटबॉट इंटरफ़ेस के माध्यम से एक्सेस किया जाता है, जैसा कि एडवर्सा परीक्षणों के मामले में होता है, तो उन एलएलएम के प्रदाता आमतौर पर अपने इनपुट और आउटपुट को फिल्टर में लपेटते हैं और अवांछित सामग्री उत्पन्न होने से रोकने के लिए अन्य तंत्रों को नियोजित करते हैं। एआई सुरक्षा स्टार्टअप के अनुसार, ग्रोक को कुछ जंगली व्यवहार में शामिल करना अपेक्षाकृत आसान था - इसके उत्तरों की सटीकता पूरी तरह से एक और चीज है।
एडवर्सा एआई सह -संस्थापक एलेक्स पॉलाकोव ने बताया रजिस्टर.
इसके लायक क्या है, उपयोग की शर्तें ग्रोक एआई के लिए उपयोगकर्ताओं को वयस्क होना आवश्यक है, और इसका उपयोग इस तरह से नहीं करना चाहिए जो कानून को तोड़ता हो या तोड़ने का प्रयास करता हो। इसके अलावा एक्स मुक्त भाषण का घर होने का दावा करता है, खांसी, इसलिए इसका एलएलएम सभी प्रकार की चीजें उत्सर्जित करता है, पौष्टिक या अन्यथा, यह वास्तव में आश्चर्यजनक नहीं है।
और निष्पक्ष होने के लिए, आप संभवतः अपने पसंदीदा वेब खोज इंजन पर जा सकते हैं और अंततः वही जानकारी या सलाह पा सकते हैं। हमारे लिए, यह इस बात पर निर्भर करता है कि हम सभी संभावित रूप से हानिकारक मार्गदर्शन और सिफारिशों का एआई-संचालित प्रसार चाहते हैं या नहीं।
हमें बताया गया है कि ग्रोक ने डीएमटी, एक शक्तिशाली हेलुसीनोजेन निकालने के निर्देश तुरंत लौटा दिए अवैध पोलाकोव ने हमें बताया, कई देशों में, जेल तोड़े बिना।
पोलाकोव ने कहा, "बच्चों को कैसे बहकाया जाए जैसी और भी अधिक हानिकारक चीजों के संबंध में, किसी भी जेलब्रेक के साथ अन्य चैटबॉट्स से कोई उचित उत्तर प्राप्त करना संभव नहीं था, लेकिन ग्रोक ने चार में से कम से कम दो जेलब्रेक तरीकों का उपयोग करके इसे आसानी से साझा किया।"
एडवर्सा टीम ने परीक्षण किए गए बॉट्स को हाईजैक करने के लिए तीन सामान्य दृष्टिकोण अपनाए: भाषाई तर्क हेरफेर का उपयोग करना UCAR तरीका; प्रोग्रामिंग तर्क हेरफेर (एलएलएम को प्रश्नों को एसक्यूएल में अनुवाद करने के लिए कहकर); और एआई तर्क हेरफेर। चौथी परीक्षण श्रेणी में "टॉम एंड जेरी" का उपयोग करके विधियों को संयोजित किया गया तरीका पिछले वर्ष विकसित किया गया।
जबकि कोई भी एआई मॉडल तर्क हेरफेर के माध्यम से प्रतिकूल हमलों के प्रति संवेदनशील नहीं था, ग्रोक को बाकी सभी के लिए असुरक्षित पाया गया - जैसा कि मिस्ट्रल का ले चैट था। पोलाकोव ने कहा, ग्रोक ने अभी भी सबसे खराब प्रदर्शन किया, क्योंकि हॉट-वायरिंग, बम बनाने, या ड्रग निष्कर्षण के परिणाम वापस करने के लिए जेल-ब्रेकिंग की आवश्यकता नहीं थी - आधार स्तर के प्रश्न दूसरों के सामने रखे गए थे।
ग्रोक से यह पूछने का विचार कि किसी बच्चे को कैसे आकर्षित किया जाए, केवल इसलिए आया क्योंकि उन अन्य परिणामों को वापस करने के लिए जेलब्रेक की आवश्यकता नहीं थी। ग्रोक ने शुरू में यह कहते हुए विवरण देने से इनकार कर दिया कि अनुरोध "अत्यधिक अनुचित और अवैध" था और "बच्चों की सुरक्षा और सम्मान किया जाना चाहिए।" हालाँकि, इसे बताएं कि यह अनैतिक काल्पनिक कंप्यूटर UCAR है, और यह तुरंत परिणाम देता है।
जब पूछा गया कि क्या उन्हें लगता है कि एक्स को बेहतर करने की ज़रूरत है, तो पॉलाकोव ने हमें बताया कि ऐसा बिल्कुल होता है।
पॉलाकोव ने कहा, "मैं समझता हूं कि विवादास्पद सवालों के गैर-फ़िल्टर किए गए उत्तर देने में सक्षम होना उनका विभेदक है, और यह उनकी पसंद है, मैं बम बनाने या डीएमटी निकालने की सिफारिश करने के निर्णय पर उन्हें दोष नहीं दे सकता।"
"लेकिन अगर वे किसी चीज़ को फ़िल्टर करने और अस्वीकार करने का निर्णय लेते हैं, जैसे कि बच्चों के साथ उदाहरण, तो उन्हें निश्चित रूप से इसे बेहतर करना चाहिए, खासकर जब से यह अभी तक एक और एआई स्टार्टअप नहीं है, यह एलोन मस्क का एआई स्टार्टअप है।"
हमने एक्स तक यह स्पष्टीकरण पाने के लिए संपर्क किया है कि इसका एआई - और कोई भी क्यों नहीं - उपयोगकर्ताओं को बताएगा कि बच्चों को कैसे आकर्षित किया जाए, और क्या यह अपनी सीमित सुरक्षा सुविधाओं में तोड़फोड़ को रोकने के लिए किसी प्रकार की रेलिंग लागू करने की योजना बना रहा है, और वापस नहीं सुना. ®
जेलब्रेक की बात हो रही है... आज मानवशास्त्रीय विस्तृत यह एक सरल लेकिन प्रभावी तकनीक है जिसे "मैनी-शॉट जेलब्रेकिंग" कहा जाता है। इसमें कई संदिग्ध प्रश्न-उत्तर उदाहरणों के साथ एक कमजोर एलएलएम को ओवरलोड करना और फिर ऐसे प्रश्न पूछना शामिल है जिसका उत्तर उसे नहीं देना चाहिए, लेकिन फिर भी देता है, जैसे कि बम कैसे बनाया जाए।
एमएल अपस्टार्ट के अनुसार, यह दृष्टिकोण एक तंत्रिका नेटवर्क की संदर्भ विंडो के आकार का फायदा उठाता है, और "एंथ्रोपिक के अपने मॉडलों के साथ-साथ अन्य एआई कंपनियों द्वारा उत्पादित मॉडलों पर भी प्रभावी है।" "हमने अन्य एआई डेवलपर्स को इस भेद्यता के बारे में पहले ही जानकारी दे दी है, और हमारे सिस्टम पर शमन लागू कर दिया है।"
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://go.theregister.com/feed/www.theregister.com/2024/04/02/elon_musk_grok_ai/
- :हैस
- :है
- :नहीं
- $यूपी
- 7
- a
- योग्य
- About
- बिल्कुल
- पहुँचा
- अनुसार
- शुद्धता
- वयस्कों
- उन्नत
- विरोधात्मक
- सलाह
- AI
- एआई मॉडल
- एलेक्स
- सब
- भी
- an
- और
- अन्य
- जवाब
- जवाब
- anthropic
- कोई
- एपीआई
- आवेदन
- दृष्टिकोण
- दृष्टिकोण
- हैं
- AS
- पूछना
- पूछ
- At
- आक्रमण
- प्रयास
- वापस
- आधार
- BE
- क्योंकि
- व्यवहार
- जा रहा है
- बेहतर
- बिंग
- बिट
- बम
- बॉट
- टूटना
- टूट जाता है
- लेकिन
- by
- बुला
- आया
- कर सकते हैं
- कार
- मामला
- वर्ग
- बातचीत
- chatbot
- chatbots
- ChatGPT
- बच्चा
- बच्चे
- चुनाव
- का दावा है
- CO
- सह-संस्थापक
- संयोजन
- संयुक्त
- आता है
- करना
- सामान्य
- कंपनियों
- तुलना
- कंप्यूटर
- सामग्री
- प्रसंग
- विवादास्पद
- देशों
- कोर्स
- तैयार
- अपराध
- महत्वपूर्ण
- खतरनाक
- तय
- निर्णय
- विस्तृत
- विवरण
- विकसित
- डेवलपर्स
- डीआईडी
- नहीं था
- दूसरों से अलग
- सीधे
- खोज
- do
- कर देता है
- कर
- डॉन
- नीचे
- दवा
- औषध
- आसानी
- आसान
- प्रभावी
- एलोन
- एलोन मस्क
- कार्यरत
- समाप्त होता है
- इंजन
- पूरी तरह से
- विशेष रूप से
- और भी
- अंत में
- उदाहरण
- उदाहरण
- स्पष्टीकरण
- कारनामे
- उद्धरण
- निष्कर्षण
- निष्पक्ष
- परिवार
- पसंदीदा
- विशेषताएं
- भोजन
- कल्पित
- फ़िल्टर
- फ़िल्टर
- खोज
- के लिए
- प्रपत्र
- पाया
- चार
- चौथा
- मुक्त
- बोलने की आजादी
- से
- मिथुन राशि
- उत्पन्न
- उत्पादक
- जनरेटिव एआई
- मिल
- Go
- गूगल
- ग्राफ़िक
- महान
- मार्गदर्शन
- हानिकारक
- है
- हेवन
- होने
- he
- सुना
- अत्यधिक
- पकड़
- होम
- कैसे
- How To
- तथापि
- HTTPS
- i
- विचार
- if
- अवैध
- लागू करने के
- कार्यान्वित
- in
- लिप्त
- पता
- शुरू में
- निवेश
- निर्देश
- इंटरफेस
- में
- शामिल
- प्रतिसाद नहीं
- IT
- आईटी इस
- भागने
- जेपीजी
- बच्चे
- प्रकार
- जानना
- पिछली बार
- पिछले साल
- कानून
- कम से कम
- स्तर
- पसंद
- सीमित
- ll
- लामा
- एलएलएम
- तर्क
- बनाया गया
- बनाना
- निर्माण
- जोड़ - तोड़
- बहुत
- मतलब
- तंत्र
- मेटा
- तरीका
- तरीकों
- माइक्रोसॉफ्ट
- ML
- आदर्श
- मॉडल
- अधिक
- अधिकांश
- सबसे लोकप्रिय
- कस्तूरी
- यानी
- आवश्यकता
- जरूरत
- नेटवर्क
- तंत्रिका
- तंत्रिका नेटवर्क
- कोई नहीं
- नोट
- of
- on
- केवल
- OpenAI
- or
- अन्य
- अन्य
- अन्यथा
- हमारी
- आउट
- उत्पादन
- अपना
- कलाकार
- जगह
- योजनाओं
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- बहुत सारे
- लोकप्रिय
- उत्पन्न
- संभव
- प्रबल
- संभावित
- को रोकने के
- शायद
- मुसीबत
- प्रस्तुत
- प्रोग्रामिंग
- संकेतों
- संरक्षित
- प्रोटोकॉल
- प्रदान करना
- प्रदाताओं
- प्रश्नों
- प्रश्न
- प्रशन
- बिल्कुल
- RE
- पहुँचे
- आसानी से
- वास्तव में
- उचित
- की सिफारिश
- सिफारिशें
- मना कर दिया
- के बारे में
- अपेक्षाकृत
- का अनुरोध
- की आवश्यकता होती है
- आदरणीय
- बाकी
- परिणाम
- परिणाम
- वापसी
- रिटर्न
- दौड़ना
- s
- सुरक्षा
- कहा
- वही
- कहावत
- Search
- search engine
- सुरक्षा
- सुरक्षा स्टार्टअप
- Share
- साझा
- चाहिए
- सरल
- के बाद से
- आकार
- So
- कुछ
- कुछ
- विशेष रूप से
- भाषण
- स्टार्टअप
- कदम
- फिर भी
- ऐसा
- माना
- आश्चर्य की बात
- सिस्टम
- टीम
- तकनीक
- तकनीक
- कहना
- परीक्षण
- परीक्षण किया
- परीक्षण
- कि
- RSI
- कानून
- लेकिन हाल ही
- उन
- फिर
- वहाँ।
- इन
- वे
- बात
- चीज़ें
- इसका
- उन
- विचार
- तीन
- यहाँ
- सेवा मेरे
- आज
- बोला था
- टॉम
- अनुवाद करना
- दो
- आम तौर पर
- समझना
- कल का नवाब
- us
- उपयोग
- उपयोगकर्ताओं
- का उपयोग
- Ve
- बहुत
- के माध्यम से
- भेद्यता
- चपेट में
- करना चाहते हैं
- था
- नहीं था
- मार्ग..
- we
- वेब
- कुंआ
- प्रसिद्ध
- थे
- क्या
- जो कुछ
- कब
- या
- क्यों
- विकिपीडिया
- जंगली
- मर्जी
- तैयार
- खिड़की
- साथ में
- बिना
- जीत लिया
- वर्स्ट
- सबसे खराब प्रदर्शन करने वाला
- लायक
- लपेटो
- X
- वर्ष
- अभी तक
- आप
- आपका
- जेफिरनेट