एक अग्रणी अध्ययन में, उत्तरी कैरोलिना विश्वविद्यालय, चैपल हिल की एक टीम ने ओपनएआई के चैटजीपीटी और गूगल के बार्ड जैसे बड़े भाषा मॉडल (एलएलएम) में डेटा प्रतिधारण के महत्वपूर्ण मुद्दे पर प्रकाश डाला है।
हटाने के प्रयासों के बावजूद, इन एआई मॉडल की पेचीदगियाँ फिर से सामने आ रही हैं संवेदनशील डेटा, सूचना सुरक्षा और एआई नैतिकता पर एक गंभीर बातचीत को बढ़ावा देना।
'अनडिलीटेबल' डेटा पहेली
शोधकर्ताओं ने एलएलएम से संवेदनशील जानकारी के उन्मूलन की जांच करने के लिए एक खोज शुरू की। हालाँकि, उन्हें एक रहस्योद्घाटन हुआ। ऐसे डेटा को हटाना कठिन है, लेकिन हटाए जाने की पुष्टि करना भी उतनी ही चुनौती है। एक बार विस्तृत डेटासेट पर प्रशिक्षित होने के बाद, ये एआई दिग्गज पैरामीटर और वजन के अपने जटिल चक्रव्यूह के भीतर डेटा को सुरक्षित रखते हैं।
यह परिस्थिति तब अशुभ हो जाती है जब एआई मॉडल व्यक्तिगत पहचानकर्ता या वित्तीय रिकॉर्ड जैसे संवेदनशील डेटा को अनजाने में फैलाना, संभावित रूप से नापाक उपयोग के लिए आधार तैयार करना।
शोधकर्ताओं ने पाया कि चैटजीपीटी जैसे एलएलएम 'हटाए जाने' के बाद भी संवेदनशील डेटा आउटपुट करते हैं - https://t.co/P5QG8eGxwE
- ⚡️जॉन द कलेक्टर⚡️ (@JohnTheCollectr) अक्टूबर 2
इसके अलावा, मुद्दे का मूल इन मॉडलों के डिज़ाइन ब्लूप्रिंट में निहित है। प्रारंभिक चरण में सुसंगत आउटपुट सुनिश्चित करने के लिए विशाल डेटाबेस पर प्रशिक्षण और फाइन-ट्यूनिंग शामिल है। जीपीटी में समाहित शब्दावली "जेनरेटिव प्रीट्रेंड ट्रांसफार्मर", इस तंत्र की एक झलक पेश करती है।
यूएनसी विद्वानों ने एक काल्पनिक परिदृश्य को स्पष्ट किया जहां एक एलएलएम, संवेदनशील बैंकिंग डेटा के ढेर पर दावत देकर, एक संभावित खतरा बन जाता है। एआई डेवलपर्स द्वारा नियोजित समकालीन रेलिंग इस चिंता को दूर करने में विफल हैं।
ये सुरक्षात्मक उपाय, जैसे हार्ड-कोडित संकेत या मानव प्रतिक्रिया (आरएलएचएफ) से सुदृढीकरण सीखने के रूप में जाना जाने वाला प्रतिमान, अवांछनीय आउटपुट को रोकने में महत्वपूर्ण भूमिका निभाते हैं। हालाँकि, वे अभी भी डेटा को मॉडल की गहराई में छुपा कर छोड़ देते हैं, जो केवल एक संकेत के पुनर्लेखन के साथ बुलाए जाने के लिए तैयार होता है।
सुरक्षा अंतर को पाटना
रैंक-वन मॉडल एडिटिंग जैसे अत्याधुनिक मॉडल संपादन तरीकों को तैनात करने के बावजूद, यूएनसी टीम ने पाया कि पर्याप्त तथ्यात्मक जानकारी सुलभ बनी हुई है। उनके निष्कर्षों से पता चला कि व्हाइटबॉक्स और ब्लैकबॉक्स हमलों के माध्यम से क्रमशः 38% और 29% मामलों में तथ्यों को पुनर्जीवित किया जा सकता है।
अपनी खोज में, शोधकर्ताओं ने GPT-J नामक एक मॉडल का उपयोग किया। अपने 6 बिलियन मापदंडों के साथ, यह विशाल GPT-3.5 की तुलना में बौना है चैटजीपीटी के लिए बेस मॉडल 170 बिलियन मापदंडों के साथ। यह स्पष्ट विरोधाभास जीपीटी-3.5 जैसे बड़े मॉडलों को अनावश्यक डेटा से स्वच्छ करने की बड़ी चुनौती की ओर संकेत करता है।
इसके अलावा, यूएनसी विद्वानों ने एलएलएम को विशिष्ट "निष्कर्षण हमलों" से बचाने के लिए नई रक्षा पद्धतियां तैयार कीं। ये नापाक योजनाएं संवेदनशील डेटा हासिल करने के लिए मॉडल की रेलिंग का फायदा उठाती हैं। बहरहाल, अखबार ने बिल्ली और चूहे के एक सतत खेल की ओर अशुभ संकेत दिया, जहां रक्षात्मक रणनीतियाँ हमेशा विकसित हो रही आक्रामक रणनीति का पीछा करेंगी।
माइक्रोसॉफ्ट ने एआई को बढ़ावा देने के लिए एक परमाणु टीम सौंपी है
संबंधित नोट पर, एआई के बढ़ते दायरे ने माइक्रोसॉफ्ट जैसे तकनीकी दिग्गजों को अज्ञात क्षेत्रों में उद्यम करने के लिए प्रेरित किया है। एआई पहल को बढ़ावा देने के लिए माइक्रोसॉफ्ट द्वारा हाल ही में एक परमाणु ऊर्जा टीम का गठन बढ़ती मांगों और एआई और ऊर्जा संसाधनों के परस्पर जुड़े भविष्य को रेखांकित करता है। जैसे-जैसे एआई मॉडल विकसित होते हैं, ऊर्जा के प्रति उनकी भूख बढ़ती है, जिससे इस बढ़ती मांग को पूरा करने के लिए नवीन समाधानों का मार्ग प्रशस्त होता है।
AI को समर्थन देने के लिए Microsoft परमाणु ऊर्जा टीम बनाएगा: रिपोर्टhttps://t.co/OvAGclfMnt#समाचार #crypto #Bitcoin #मशीन लर्निंग #microsoft #समाचार #technology https://t.co/OvAGclfMnt
- क्रिप्टो ब्रेकिंग न्यूज़: नवीनतम क्रिप्टो और बिटकॉइन समाचार (@CryptoBreakNews) अक्टूबर 1
एलएलएम में डेटा प्रतिधारण और विलोपन के आसपास की चर्चा अकादमिक गलियारों से परे है। यह एक मजबूत ढांचे को बढ़ावा देने के लिए एक गहन जांच और एक उद्योग-व्यापी बातचीत का सुझाव देता है जो एआई की वृद्धि और क्षमता का पोषण करते हुए डेटा सुरक्षा सुनिश्चित करता है।
यूएनसी शोधकर्ताओं का यह उद्यम 'अनडिलीटेबल' डेटा समस्या को समझने और अंततः हल करने की दिशा में एक महत्वपूर्ण कदम है, जो डिजिटल युग में एआई को एक सुरक्षित उपकरण बनाने के करीब एक कदम है।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://metanews.com/llms-like-chatgpt-persistently-leak-sensitive-data-despite-deletion-efforts/
- :हैस
- :है
- :कहाँ
- 1
- 7
- a
- शैक्षिक
- सुलभ
- बाद
- उम्र
- AI
- एआई मॉडल
- an
- और
- भूख
- चारों ओर
- AS
- At
- आक्रमण
- प्रयास
- बैंकिंग
- BE
- हो जाता है
- किया गया
- पाकर
- बिलियन
- Bitcoin
- Bitcoin समाचार
- खाका
- सिलेंडर
- तोड़कर
- खबर
- तेजी से बढ़ते
- लेकिन
- by
- कैट
- चुनौती
- पीछा
- ChatGPT
- करीब
- सुसंगत
- तुलना
- जटिल
- चिंता
- समकालीन
- जारी रखने के
- इसके विपरीत
- कन्वर्सेशन (Conversation)
- मूल
- सका
- तैयार
- क्रिप्टो
- को रोकने
- तिथि
- डाटा सुरक्षा
- डेटाबेस
- डेटासेट
- रक्षा
- बचाव
- प्रतिनिधियों
- मांग
- मांग
- तैनाती
- डिज़ाइन
- डेवलपर्स
- बातचीत
- डिजिटल
- डिजिटल युग
- प्रवचन
- की खोज
- शुरू
- कार्यरत
- समझाया
- ऊर्जा
- सुनिश्चित
- सुनिश्चित
- बराबर
- आचार
- और भी
- अंत में
- विकसित करना
- उद्विकासी
- प्रशस्त
- शोषण करना
- तथ्यों
- गिरना
- प्रतिक्रिया
- वित्तीय
- खोज
- निष्कर्ष
- मछली
- के लिए
- सदा
- प्रपत्र
- निर्माण
- पोषण
- ढांचा
- से
- भविष्य
- खेल
- झलक
- गूगल की
- नींव
- बढ़ रहा है
- विकास
- बंदरगाह
- होने
- संकेत
- तथापि
- HTTPS
- मानव
- पहचानकर्ता
- in
- अनजाने में
- करें-
- सूचना सुरक्षा
- पहल
- अभिनव
- आपस में जुड़े हुए
- में
- पेचीदगियों
- जांच
- मुद्दा
- IT
- आईटी इस
- जानने वाला
- भाषा
- बड़ा
- बड़ा
- ताज़ा
- रिसाव
- सीख रहा हूँ
- छोड़ना
- प्रकाश
- पसंद
- एलएलएम
- निर्माण
- उपायों
- तंत्र
- mers
- तरीकों
- माइक्रोसॉफ्ट
- आदर्श
- मॉडल
- स्मरणार्थ
- नया
- समाचार
- उत्तर
- उत्तरी कैरोलिना
- नाभिकीय
- परमाणु ऊर्जा
- पोषण
- of
- अपमानजनक
- ऑफर
- on
- एक बार
- or
- आउट
- उत्पादन
- काग़ज़
- मिसाल
- पैरामीटर
- फ़र्श
- पीडीएफ
- सतत
- लगातार
- स्टाफ़
- चरण
- अग्रणी
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- प्ले
- बन गया है
- संभावित
- संभावित
- बिजली
- दबाव
- मुसीबत
- चलनेवाला
- रक्षात्मक
- खोज
- तैयार
- क्षेत्र
- हाल
- अभिलेख
- सम्बंधित
- बने रहे
- शोधकर्ताओं
- उपयुक्त संसाधन चुनें
- क्रमश
- प्रतिधारण
- प्रकट
- रहस्योद्घाटन
- मजबूत
- भूमिका
- सुरक्षित
- परिदृश्य
- योजनाओं
- विद्वानों
- सुरक्षा
- संवेदनशील
- गंभीर
- शेड
- शील्ड
- कम
- महत्वपूर्ण
- समाधान ढूंढे
- सुलझाने
- विशिष्ट
- निरा
- राज्य के-the-कला
- कदम
- फिर भी
- रणनीतियों
- प्रगति
- अध्ययन
- पर्याप्त
- ऐसा
- समर्थन
- युक्ति
- टीम
- तकनीक
- शब्दावली
- प्रदेशों
- कि
- RSI
- लेकिन हाल ही
- इन
- वे
- इसका
- धमकी
- यहाँ
- पहर
- सेवा मेरे
- साधन
- की ओर
- प्रशिक्षित
- प्रशिक्षण
- अतिक्रमण
- ट्रांसफार्मर
- <strong>उद्देश्य</strong>
- बदल जाता है
- न सुलझा हुआ
- रेखांकित
- समझ
- विश्वविद्यालय
- के ऊपर
- का उपयोग करता है
- उपयोग किया
- व्यापक
- उद्यम
- पुष्टि करने
- महत्वपूर्ण
- मार्ग..
- कब
- जब
- साथ में
- अंदर
- होगा
- जेफिरनेट