प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़न वेब सेवाएँ

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़न वेब सेवाएँ

यह पोस्ट प्रोटोपिया एआई के बालाजी चंद्रशेखरन, जेनिफर क्वाजेनबर्ग और एंड्रयू सेन्सम और इमान इब्राहिमी के सहयोग से लिखी गई है।

नए और शक्तिशाली बड़े भाषा मॉडल (एलएलएम) व्यवसायों को तेजी से बदल रहे हैं, विभिन्न उद्यम उपयोग के मामलों के लिए दक्षता और प्रभावशीलता में सुधार कर रहे हैं। गति सबसे महत्वपूर्ण है, और एलएलएम प्रौद्योगिकियों को अपनाना किसी व्यवसाय के प्रतिस्पर्धात्मक लाभ को बना या बिगाड़ सकता है। महत्वपूर्ण निर्णय लेने में सक्षम बनाने के लिए बड़े पैमाने पर एलएलएम को तैनात करने के लिए उद्यमों को आवश्यक उपकरण प्रदान करने के लिए एडब्ल्यूएस विशेष रूप से उपयुक्त है।

जेनेरिक एआई तकनीक के कार्यान्वयन में, उद्यमों को डेटा एक्सपोज़र और गोपनीय जानकारी के स्वामित्व के बारे में वास्तविक चिंताएं हैं जो एलएलएम को भेजी जा सकती हैं। गोपनीयता और डेटा सुरक्षा की ये चिंताएँ संगठनों में एलएलएम के उपयोग को धीमा या सीमित कर सकती हैं। उद्यमों को ऑन-प्रिमाइसेस DevOps के अक्सर निषेधात्मक रूप से उच्च ओवरहेड्स को झेलने की आवश्यकता के बिना मॉडलों को संवेदनशील जानकारी भेजने के लिए एक जिम्मेदार और सुरक्षित तरीके की आवश्यकता होती है।

पोस्ट में बताया गया है कि आप अपने डेटा की सुरक्षा के लिए प्रोटोपिया एआई के स्टेन्ड ग्लास ट्रांसफॉर्म को तैनात करके एलएलएम का उपयोग करते समय डेटा स्वामित्व बनाए रखने और डेटा गोपनीयता को संरक्षित करने की चुनौतियों को कैसे दूर कर सकते हैं। प्रोटोपिया एआई जेनेरिक एआई को सुरक्षित और कुशल उद्यम अपनाने के लिए डेटा सुरक्षा और स्वामित्व के महत्वपूर्ण घटक को वितरित करने के लिए AWS के साथ साझेदारी की है। यह पोस्ट समाधान की रूपरेखा प्रस्तुत करती है और दर्शाती है कि लोकप्रिय उद्यम उपयोग के मामलों के लिए AWS में इसका उपयोग कैसे किया जा सकता है पुनर्प्राप्ति संवर्धित पीढ़ी (आरएजी) और अत्याधुनिक एलएलएम जैसे लामा 2.

सना हुआ ग्लास रूपांतरण सिंहावलोकन

संगठन अपने संवेदनशील उद्यम डेटा का पूर्ण स्वामित्व और नियंत्रण बनाए रखना चाहते हैं। यह जिम्मेदार एआई का एक स्तंभ है और एलएलएम प्रदाताओं की बुनियादी सुरक्षा और कानूनी गारंटी से ऊपर और परे एक उभरती हुई डेटा सुरक्षा और गोपनीयता आवश्यकता है।

हालाँकि उद्यम व्यवसाय इकाइयाँ विभिन्न कार्यों के लिए एलएलएम का उपयोग करना चाहती हैं, लेकिन वे इन मॉडलों को भेजे गए डेटा के माध्यम से लीक होने वाले व्यापार रहस्य, बौद्धिक संपदा और अन्य मालिकाना जानकारी के बारे में भी चिंतित हैं। साथ ही, उद्यम सुरक्षा, अनुपालन, डेटा प्रबंधन और सूचना कार्यालय सादे पाठ ग्राहक जानकारी या उद्यम के बाहर अन्य विनियमित डेटा को उजागर करने या लीक करने से आशंकित हैं। AWS और प्रोटोपिया AI उस महत्वपूर्ण घटक को वितरित करने के लिए साझेदारी कर रहे हैं जो इस सामान्य उद्यम ग्राहक की आवश्यकता को हल करता है।

प्रोटोपिया एआई का स्टेन्ड ग्लास ट्रांसफॉर्म (एसजीटी) असुरक्षित एंटरप्राइज़ डेटा को यादृच्छिक पुन: प्रतिनिधित्व में परिवर्तित करके इन चुनौतियों का समाधान करता है, जिसे RmoRed डेटा कहा जाता है, जैसा कि निम्नलिखित आंकड़े में दिखाया गया है। यह प्रतिनिधित्व मूल डेटा का एक स्टोकेस्टिक एम्बेडिंग है, जो संवेदनशील संकेतों या प्रश्नों, संदर्भ, या फाइन-ट्यूनिंग डेटा को उजागर किए बिना लक्ष्य एलएलएम को कार्य करने के लिए आवश्यक जानकारी को संरक्षित करता है। यह पुनः प्रतिनिधित्व एक तरफ़ा परिवर्तन है जिसे उलटा नहीं किया जा सकता है, जिससे एंटरप्राइज़ डेटा की समग्र गोपनीयता सुनिश्चित होती है और एलएलएम को सादे पाठ संवेदनशील जानकारी लीक होने से सुरक्षा मिलती है। एसजीटी की प्रयोज्यता भाषा मॉडल तक सीमित नहीं है। दृश्य और संरचित डेटा के लिए यादृच्छिक पुन: अभ्यावेदन भी उत्पन्न किया जा सकता है। स्टेन्ड ग्लास ट्रांसफॉर्म नाम दृश्य डेटा के यादृच्छिक पुन: प्रस्तुतीकरण के दृश्य स्वरूप में निहित है जो कि स्टेन्ड ग्लास के माध्यम से डेटा को देखने जैसा हो सकता है, जैसा कि इसमें दिखाया गया है। अमेरिकी नौसेना उपयोग मामला.

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

एसजीटी लामा 2 जैसे अत्याधुनिक एलएलएम के साथ काम करता है। निम्नलिखित आंकड़ा निर्देश और संदर्भ में सुरक्षा की एक परत जोड़ते हुए अनुदेश के लिए लामा 2 मॉडल में एसजीटी लागू करने का एक उदाहरण दिखाता है। चित्र के बाईं ओर संदर्भ के रूप में एक वित्तीय दस्तावेज़ का एक उदाहरण दिखाया गया है, जिसमें निर्देश मॉडल से दस्तावेज़ को सारांशित करने के लिए कहता है। नीचे बाईं ओर, रॉ प्रॉम्प्ट पर संचालन करते समय लामा 2 द्वारा उत्पन्न प्रतिक्रिया दिखाई गई है। एसजीटी का उपयोग करते समय, इस प्रॉम्प्ट से जुड़ी एम्बेडिंग क्लाइंट साइड पर स्टोकेस्टिक एम्बेडिंग में बदल जाती है, जैसा कि इस पोस्ट में बाद में अधिक विस्तार से बताया गया है। नीचे दाईं ओर दिखाया गया है कि अगर असुरक्षित एम्बेडिंग के बजाय RmoRed डेटा (पोस्ट-ट्रांसफॉर्मेशन एम्बेडिंग) भेजा जाता है तो लामा 2 अभी भी सही प्रतिक्रिया उत्पन्न कर सकता है। शीर्ष दाईं ओर से पता चलता है कि यदि RmoRed डेटा लीक हो गया, तो मूल संकेत के पुनर्निर्माण के परिणामस्वरूप अस्पष्ट पाठ प्राप्त होगा।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

लामा 2 जैसे किसी दिए गए मॉडल के लिए एसजीटी बनाने के लिए, प्रोटोपिया एआई स्टेन्ड ग्लास एसडीके नामक एक हल्की लाइब्रेरी प्रदान करता है, जो पायटोरच का विस्तार है। जैसा कि निम्नलिखित चित्र में दिखाया गया है, एसजीटी बनने के बाद, इसे कई तरीकों से तैनाती पाइपलाइनों में एकीकृत किया जा सकता है। एसडीके से बनाया गया परिवर्तन स्थानीय रूप से, हाइब्रिड सेटअप में या पूरी तरह से क्लाउड पर तैनात किया जा सकता है। यह संभव है क्योंकि एसजीटी को एक हल्की प्रक्रिया के रूप में डिज़ाइन किया गया है जिसमें बहुत कम गणना संसाधनों की आवश्यकता होती है और इस तरह इसका अनुमान महत्वपूर्ण पथ पर न्यूनतम प्रभाव पड़ता है। एक अन्य प्रमुख मूल्यांकन पुन: प्रस्तुत डेटा का उपयोग करके मॉडल सटीकता को बनाए रखना है। हम देखते हैं कि विभिन्न डेटा प्रकारों और मॉडल विविधताओं में, पुन: प्रस्तुत डेटा का उपयोग करते समय सटीकता को वांछनीय सहनशीलता सीमा के भीतर बनाए रखा जाता है।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

तैनाती और सटीकता बनाए रखने के ये विकल्प एक उद्यम संगठन के भीतर सभी हितधारकों द्वारा एसजीटी को आत्मविश्वास से अपनाने की अनुमति देते हैं। एलएलएम के आउटपुट को और अधिक सुरक्षित रखने के लिए, प्रोटोपिया एआई क्वेरी आउटपुट को एक प्रतिनिधित्व में एन्कोड कर सकता है जिसका डिकोडर केवल एंटरप्राइज़ डेटा स्वामी के लिए उपलब्ध है।

समाधान अवलोकन

पिछले अनुभाग में बताया गया है कि आप विभिन्न आर्किटेक्चर में स्टेन्ड ग्लास ट्रांसफॉर्म का उपयोग कैसे कर सकते हैं। निम्नलिखित आंकड़ा एलएलएम के लिए एसजीटी बनाने, तैनात करने और उपयोग करने में शामिल चरणों का विवरण देता है:

  • एसजीटी निर्माण - वह टीम जो बेसलाइन एलएलएम फाउंडेशन मॉडल (मालिकाना एलएलएम के प्रदाता, क्लाउड सेवा प्रदाता, या अपने स्वयं के एलएलएम बनाने वाली एंटरप्राइज़ एमएल टीमें) को प्रशिक्षित करती है, एलएलएम के प्रशिक्षण और तैनाती के लिए अपनी मौजूदा प्रथाओं में बदलाव किए बिना प्रोटोपिया एआई के स्टेन्ड ग्लास एसडीके सॉफ्टवेयर चलाती है। फाउंडेशन मॉडल प्रशिक्षण पूरा होने के बाद, एसडीके एसजीटी की गणना करने के लिए भाषा मॉडल पर एक अनुकूलन पास के रूप में चलता है। यह अनुकूलन पास PyTorch के एक एक्सटेंशन के माध्यम से वितरित किया जाता है। एसडीके फाउंडेशन मॉडल को लपेटता है और गणितीय रूप से उस एलएलएम के लिए एक अद्वितीय सना हुआ ग्लास ट्रांसफॉर्म की खोज करता है। अंतर्निहित गणित का अधिक विवरण यहां पाया जा सकता है श्वेतपत्र के साथ. ध्यान दें कि क्योंकि एलएलएम को प्रशिक्षित करने वाली टीम स्वयं भी स्टेन्ड ग्लास एसडीके चला रही है, इसलिए इस चरण को पूरा करने के लिए आवश्यक मॉडल वेट का कोई एक्सपोज़र या भेजना नहीं है।
  • एसजीटी रिलीज़ और परिनियोजन - एसजीटी जो पहले अनुकूलन चरण से आउटपुट है, प्रशिक्षित एलएलएम को फीड करने वाली डेटा पाइपलाइन के हिस्से के रूप में तैनात किया गया है। जैसा कि पिछले अनुभाग में बताया गया है, SGT एंटरप्राइज़ क्लाइंट पक्ष पर बैठता है।
  • एसजीटी उपयोग - एसजीटी उद्यम द्वारा बनाए गए संकेतों पर चलता है और संरक्षित संकेत उत्पन्न करता है, जो तैनात एलएलएम को भेजे जाते हैं। यह उद्यम को उनके संवेदनशील प्रश्नों और संदर्भ का स्वामित्व बनाए रखने में सक्षम बनाता है। प्रोटोपिया एआई स्टेन्ड ग्लास का उपयोग करते हुए, असुरक्षित संवेदनशील डेटा उद्यम की साइट या ट्रस्ट क्षेत्र को नहीं छोड़ता है।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

आप कई तरीकों से एसजीटी बनाने के लिए सना हुआ ग्लास एसडीके का उपयोग कर सकते हैं। उदाहरण के लिए, आप स्व-प्रबंधित मशीन लर्निंग (एमएल) वातावरण में सना हुआ ग्लास एसडीके का उपयोग कर सकते हैं अमेज़ॅन इलास्टिक कुबेरनेट्स सेवा (अमेज़ॅन ईकेएस) प्रशिक्षण और अनुमान के लिए या भीतर अमेज़ॅन इलास्टिक कम्प्यूट क्लाउड (अमेज़ॅन EC2) सीधे। दूसरा विकल्प यह है कि यह भीतर चल सकता है अमेज़न SageMaker किसी दिए गए प्रशिक्षित मॉडल के लिए SGT बनाना। क्लाइंट से अनुमान के दौरान तैनाती के लिए इनपुट को बदलना चुने हुए तैनाती कार्यान्वयन से स्वतंत्र है।

निम्नलिखित आंकड़ा स्व-प्रबंधित एमएल वातावरण में संभावित कार्यान्वयन को दर्शाता है जहां अमेज़ॅन ईकेएस पर स्टेन्ड ग्लास ट्रांसफॉर्म का प्रशिक्षण किया जाता है।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

इस वर्कफ़्लो में, स्टेन्ड ग्लास SDK का उपयोग करके एक कंटेनर बनाया जाता है और उसमें तैनात किया जाता है अमेज़ॅन इलास्टिक कंटेनर रजिस्ट्री (अमेज़ॅन ईसीआर)। फिर इस कंटेनर को एक एसजीटी को प्रशिक्षित करने के लिए अमेज़ॅन ईकेएस पर तैनात किया जाता है जिसे सहेजा जाता है अमेज़न सरल भंडारण सेवा (अमेज़ॅन एस3)। यदि आप अमेज़ॅन ईसी2 का उपयोग कर रहे हैं, तो आप अपने एमएल सेटअप के हिस्से के रूप में सीधे अपने इंस्टेंस पर एक परिवर्तन को प्रशिक्षित कर सकते हैं। सना हुआ ग्लास एसडीके आपके आधार एलएलएम आवश्यकताओं के आधार पर अमेज़ॅन पी 5, पी 4, या जी 5 इंस्टेंस परिवारों सहित विभिन्न प्रकार के इंस्टेंस प्रकारों पर चल सकता है। एलएलएम को अनुमान के लिए उपयोग करने के लिए तैनात किए जाने के बाद, क्लाइंट एप्लिकेशन एलएलएम में भेजने से पहले संकेतों और संदर्भ को बदलने के लिए बनाए गए एसजीटी का उपयोग करता है, जो एक हल्का ऑपरेशन है। ऐसा करने से, केवल रूपांतरित डेटा एलएलएम के संपर्क में आता है, और मूल इनपुट का स्वामित्व क्लाइंट पक्ष पर बरकरार रहता है।

निम्नलिखित चित्र दर्शाता है कि आप सेजमेकर पर ट्रांसफ़ॉर्म और रन इनफ़रेंसिंग को कैसे प्रशिक्षित कर सकते हैं।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

SGT का निर्माण Amazon EKS सेटअप के समान पथ का अनुसरण करता है, जिसमें Amazon S3 से प्रशिक्षण डेटा प्राप्त करना, एक कंटेनर पर SGT को प्रशिक्षित करना और इसे Amazon S3 में सहेजना शामिल है। आप अपने मौजूदा सेजमेकर सेटअप में सना हुआ ग्लास एसडीके का उपयोग कर सकते हैं अमेज़ॅन सैजमेकर स्टूडियो, सेजमेकर नोटबुक, और एक सेजमेकर ट्रेनिंग जॉब. एलएलएम को सेजमेकर एंडपॉइंट के रूप में होस्ट किया गया है जो क्लाइंट एप्लिकेशन द्वारा पहुंच योग्य है। क्लाइंट एप्लिकेशन के लिए अनुमान भी अमेज़ॅन ईकेएस सेटअप के समान है, सिवाय इसके कि मॉडल क्या परोस रहा है।

एलएलएम संकेतों की सुरक्षा और डेटा को फाइन-ट्यूनिंग करने के लिए यादृच्छिक पुन: अभ्यावेदन

यह अनुभाग विभिन्न प्रकार के उपयोग के मामलों को शामिल करता है जो दर्शाता है कि कैसे यादृच्छिक पुन: प्रतिनिधित्व एलएलएम संकेतों की सुरक्षा करता है। उदाहरण एंटरप्राइज जेनरेटर एआई प्रयासों के प्रमुख निहितार्थों को दर्शाते हैं: एआई उपयोग के मामलों के लिए नए दरवाजे खोलना, एंटरप्राइज डेटा की उचित सुरक्षा करते हुए बाजार में गति बढ़ाना और एलएलएम संकेतों में उपयोग के लिए आवश्यक संवेदनशील डेटा का स्वामित्व बनाए रखना।

आरएजी उपयोग मामला

एलएलएम के लिए एक लोकप्रिय उद्यम उपयोग मामला रिट्रीवल ऑगमेंटेड जेनरेशन (आरएजी) है। निम्नलिखित चित्र एक उदाहरणात्मक उदाहरण दिखाता है जहां संकेतों और स्रोतों को सना हुआ ग्लास का उपयोग करके संरक्षित किया जाता है। चित्र के बाईं ओर असुरक्षित संकेत और स्रोत जानकारी दिखाई गई है। आरएजी के उद्यम कार्यान्वयन में, स्रोतों में उद्यम व्यापार रहस्य, बौद्धिक संपदा, या वित्तीय जानकारी जैसी संवेदनशील जानकारी शामिल हो सकती है। दाहिना भाग SGT द्वारा बनाए गए RmoRed संकेतों से मानव पठनीय पाठ में सर्वोत्तम संभव पुनर्निर्माण दिखाता है।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

हम देख सकते हैं कि सर्वोत्तम संभव पुनर्निर्माण में भी, जानकारी पूरी तरह से अस्पष्ट है। हालाँकि, परिवर्तन के साथ और बिना परिवर्तन के मॉडल की प्रतिक्रिया मूल स्रोत दस्तावेज़ों के संकेतकों के साथ समान है, जिससे इस लोकप्रिय उद्यम उपयोग मामले को निष्पादित करते समय प्रश्न और स्रोत दस्तावेज़ दोनों की सटीकता संरक्षित रहती है।

एलएलएम और भाषाओं में व्यापक प्रयोज्यता

सना हुआ ग्लास एसडीके का एक मुख्य आकर्षण यह है कि यह मॉडल प्रगति के लिए अत्यधिक लचीला है और अत्याधुनिक मॉडल जैसे अनुकूलनीय है। लामा 2. निम्नलिखित आंकड़ा एक एसजीटी दिखाता है जो लामा 2 एलएलएम पर बनाया गया था जिसे पहले जापानी पाठ के साथ काम करने के लिए ठीक किया गया था। यह उदाहरण आगे दर्शाता है कि एसजीटी को किसी भी भाषा के लिए बनाया और लागू किया जा सकता है और यहां तक ​​कि फाइन-ट्यून किए गए मॉडल के लिए इनपुट को भी बदला जा सकता है। एसजीटी की सामान्य प्रयोज्यता सना हुआ ग्लास एसडीके के मॉडल- और डेटा-अज्ञेयवादी होने की मजबूत नींव से प्रेरित है।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

फ़ाइन-ट्यूनिंग डेटा के साथ-साथ संकेतों की सुरक्षा करना

स्टेन्ड ग्लास ट्रांसफॉर्म केवल अनुमान के समय डेटा की सुरक्षा तक ही सीमित नहीं है; यह फाउंडेशन मॉडल को बेहतर बनाने के लिए उपयोग किए जाने वाले डेटा की सुरक्षा भी कर सकता है। फाइन-ट्यूनिंग डेटासेट के लिए परिवर्तन बनाने की प्रक्रिया वही है जो इस पोस्ट में पहले समाधान आर्किटेक्चर अनुभाग में बताई गई है। फाइन-ट्यूनिंग डेटा तक पहुंच के बिना फाउंडेशन मॉडल को फाइन-ट्यून करने के लिए परिवर्तन बनाया गया है। फाउंडेशन मॉडल के लिए एसजीटी के निर्माण और प्रशिक्षण के बाद, फाइन-ट्यूनिंग डेटासेट को यादृच्छिक पुन: अभ्यावेदन में बदल दिया जाता है, जिसका उपयोग फाउंडेशन मॉडल को फाइन-ट्यून करने के लिए किया जाएगा। इस प्रक्रिया को और अधिक विस्तार से बताया गया है श्वेतपत्र के साथ.

निम्नलिखित उदाहरण में, एक एंटरप्राइज़ ग्राहक को नेटवर्क लॉग विसंगति का पता लगाने के लिए मौजूदा मॉडल को ठीक करने की आवश्यकता है। उन्होंने संवेदनशील फाइन-ट्यूनिंग डेटासेट को यादृच्छिक एम्बेडिंग में बदलने के लिए स्टेन्ड ग्लास का उपयोग किया, जिसका उपयोग उनके फाउंडेशन मॉडल को फाइन-ट्यून करने के लिए किया गया था। उन्होंने पाया कि असुरक्षित फाइन-ट्यूनिंग डेटासेट पर फाउंडेशन मॉडल को फाइन-ट्यूनिंग के काल्पनिक परिदृश्य की तुलना में परिवर्तित अभ्यावेदन पर फाइन-ट्यून किया गया डिटेक्शन मॉडल लगभग समान सटीकता के साथ निष्पादित हुआ। निम्न तालिका फाइन-ट्यूनिंग डेटासेट से सादे पाठ डेटा रिकॉर्ड के दो उदाहरण दिखाती है और फाइन-ट्यूनिंग डेटासेट से उन्हीं डेटा रिकॉर्ड के टेक्स्ट का पुनर्निर्माण करती है।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

एलएलएम के लिए स्टेन्ड ग्लास ट्रांसफॉर्म के हुड के तहत

जब कंप्यूटर विज़न पर लागू किया जाता है, तो एसजीटी इनपुट पिक्सेल सुविधाओं पर काम करता है, और एलएलएम के लिए, यह एम्बेडिंग स्तर पर काम करता है। स्टेन्ड ग्लास ट्रांसफ़ॉर्म कैसे काम करता है, इस पर प्रकाश डालने के लिए, एक मैट्रिक्स के रूप में शीघ्र एम्बेडिंग की कल्पना करें, जैसा कि निम्नलिखित चित्र के बाईं ओर दिखाया गया है। प्रत्येक प्रविष्टि में, एक नियतात्मक मान होता है। इस मान को मूल डेटा में मैप किया जा सकता है, जो असुरक्षित संकेत को उजागर करता है। स्टेन्ड ग्लास ट्रांसफॉर्म नियतात्मक मूल्यों के इस मैट्रिक्स को एक मैट्रिक्स में परिवर्तित करता है जिसके तत्व संभावनाओं के बादल हैं।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

रूपांतरित प्रॉम्प्ट को एसजीटी द्वारा परिभाषित संभाव्यता वितरणों से शोर का नमूना लेकर और नियतात्मक एम्बेडिंग में नमूना शोर जोड़कर प्रस्तुत किया जाता है, जो मूल प्रॉम्प्ट मानों को अपरिवर्तनीय रूप से यादृच्छिक बनाता है। मॉडल अभी भी गणितीय स्तर पर यादृच्छिक पुन: प्रस्तुत संकेत को समझता है और अपने कार्य को सटीकता से पूरा कर सकता है।

निष्कर्ष

इस पोस्ट में चर्चा की गई है कि कैसे प्रोटोपिया एआई का स्टेन्ड ग्लास ट्रांसफॉर्म एमएल संचालन प्रक्रिया से कच्चे डेटा के स्वामित्व और सुरक्षा को अलग करता है, जिससे उद्यमों को स्वामित्व बनाए रखने और एलएलएम संकेतों और फाइन-ट्यूनिंग डेटा में संवेदनशील जानकारी की गोपनीयता बनाए रखने में सक्षम बनाया जाता है। एलएलएम उपयोग के लिए इस अत्याधुनिक डेटा सुरक्षा का उपयोग करके, उद्यम संवेदनशील जानकारी के जोखिम के बारे में कम चिंता करके फाउंडेशन मॉडल और एलएलएम को अपनाने में तेजी ला सकते हैं। वास्तविक उद्यम डेटा में मूल्य को सुरक्षित रूप से अनलॉक करके, संगठन एलएलएम की वादा की गई दक्षताओं और व्यावसायिक परिणामों को अधिक कुशलतापूर्वक और तेज़ी से सक्षम कर सकते हैं। इस तकनीक के बारे में अधिक जानने के लिए, आप आगे पढ़ सकते हैं श्वेतपत्र के साथ और प्रोटोपिया एआई से जुड़ें पहुंच प्राप्त करने और इसे अपने एंटरप्राइज़ डेटा पर आज़माने के लिए।

प्रोटोपिया एआई के बारे में

प्रोटोपिया एआई ऑस्टिन, टेक्सास में स्थित डेटा सुरक्षा और गोपनीयता-संरक्षण एआई/एमएल प्रौद्योगिकियों में अग्रणी है, और एआई एल्गोरिदम और सॉफ्टवेयर प्लेटफार्मों को सादे पाठ जानकारी तक पहुंचने की आवश्यकता के बिना संचालित करने में सक्षम बनाने में माहिर है। पिछले 2 वर्षों में, प्रोटोपिया एआई ने अमेरिकी नौसेना, अग्रणी वित्तीय सेवाओं और वैश्विक प्रौद्योगिकी प्रदाताओं के साथ विभिन्न एमएल उपयोग मामलों और डेटा प्रकारों में अपने प्रमुख स्टेन्ड ग्लास ट्रांसफॉर्म उत्पाद का सफलतापूर्वक प्रदर्शन किया है।

प्रोटोपिया एआई एआई/एमएल समाधानों का उपयोग करते समय एंटरप्राइज़ डेटा के स्वामित्व और गोपनीयता को बनाए रखने में सक्षम बनाने के लिए उद्यमों, जेनरेटिव एआई और एलएलएम प्रदाताओं और क्लाउड सेवा प्रदाताओं (सीएसपी) के साथ काम करता है। प्रोटोपिया एआई ने जेनेरिक एआई को उद्यम में अपनाने के लिए डेटा सुरक्षा और स्वामित्व का एक महत्वपूर्ण घटक प्रदान करने के लिए एडब्ल्यूएस के साथ साझेदारी की है, और उद्घाटन के लिए चुने गए 21 स्टार्टअप में से एक था। 2023 में AWS जेनरेटर एआई एक्सेलेरेटर.


लेखक के बारे में

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ. बालाजी चन्द्रशेखरन प्रोटोपिया एआई में गो-टू-मार्केट और ग्राहक सक्षमता के उपाध्यक्ष हैं, डेटा सुरक्षा और गोपनीयता को प्राथमिकता देते हुए अपने व्यवसाय में एआई का लाभ उठाने के लिए ग्राहकों के साथ मिलकर काम करते हैं। प्रोटोपिया एआई से पहले, बालाजी इन्फोर में एआई सॉल्यूशंस के उत्पाद प्रमुख थे, जो विभिन्न उद्योगों में उद्यम ग्राहकों के लिए एक विश्वसनीय भागीदार के रूप में कार्य करते हुए मूल्य-केंद्रित उत्पाद विकसित कर रहे थे। काम के बाहर, उन्हें संगीत, लंबी पैदल यात्रा और परिवार के साथ यात्रा करना पसंद है।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.जेनिफ़र क्वागनबर्ग प्रोटोपिया एआई में इंजीनियरिंग टीम का नेतृत्व करते हैं और यह सुनिश्चित करने के लिए काम करते हैं कि स्टेन्ड ग्लास तकनीक उनके ग्राहकों की डेटा की सुरक्षा की जरूरतों को पूरा करती है। जेनिफर को टोयोटा में उनके उत्पाद साइबर सुरक्षा समूह में सुरक्षा कार्य करने, एन-एबल में क्लाउड वर्कलोड प्रबंधित करने और मैच डॉट कॉम पर डेटा के लिए जिम्मेदार होने का पूर्व अनुभव है।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.एंड्रयू सैन्सोम प्रोटोपिया एआई में एक एआई सॉल्यूशंस इंजीनियर है जहां वह उद्यमों को उनके डेटा में निजी और संवेदनशील जानकारी को संरक्षित करते हुए एआई का उपयोग करने में मदद करता है। प्रोटोपिया एआई से पहले, उन्होंने वित्त, विनिर्माण, स्वास्थ्य सेवा और शिक्षा सहित कई उद्योगों में ग्राहकों के लिए एआई समाधान सक्षम करने पर ध्यान केंद्रित करते हुए एक तकनीकी सलाहकार के रूप में काम किया। उन्होंने हाई स्कूल, विश्वविद्यालय और व्यावसायिक छात्रों को कंप्यूटर विज्ञान और गणित भी पढ़ाया।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.इमान इब्राहिमी, पीएचडी, प्रोटोपिया एआई के सह-संस्थापक और मुख्य कार्यकारी अधिकारी हैं। डॉ. इब्राहिमी को विभिन्न सामाजिक और उद्योग क्षेत्रों में मानवीय अनुभव को समृद्ध करने के लिए एआई को सक्षम करने का शौक है। प्रोटोपिया एआई लेंस को बढ़ाने का एक दृष्टिकोण है जिसके माध्यम से एआई संवेदनशील जानकारी की सुरक्षा के लिए नवीन क्षमताओं का निर्माण करते हुए आवश्यक आवश्यक और गुणवत्ता वाले डेटा का निरीक्षण करता है। प्रोटोपिया एआई से पहले, वह 9 वर्षों तक NVIDIA में वरिष्ठ अनुसंधान वैज्ञानिक थे। NVIDIA अनुसंधान में उनके काम का उद्देश्य एमएल/एआई में बड़े पैमाने पर डेटासेट तक पहुंच की समस्याओं को हल करना था। उन्होंने बड़े भाषा मॉडलों के प्रशिक्षण को व्यवहार्य बनाने के लिए हजारों जीपीयू की शक्ति का उपयोग करने के तरीके पर सहकर्मी-समीक्षित प्रकाशनों का सह-लेखन भी किया।

प्रोटोपिया एआई के साथ एंटरप्राइज़ एलएलएम त्वरण के लिए मूलभूत डेटा सुरक्षा | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.रोहित तल्लूरी अमेज़ॅन वेब सर्विसेज (एडब्ल्यूएस) में जेनेरेटिव एआई जीटीएम विशेषज्ञ हैं। वह AWS पर कृत्रिम बुद्धिमत्ता, मशीन लर्निंग और त्वरित कंप्यूटिंग की अगली पीढ़ी को सक्षम करने के लिए शीर्ष जेनरेटिव AI मॉडल बिल्डरों, रणनीतिक ग्राहकों, प्रमुख AI/ML भागीदारों और AWS सेवा टीमों के साथ साझेदारी कर रहा है। वह पहले एक एंटरप्राइज सॉल्यूशंस आर्किटेक्ट थे, और एडब्ल्यूएस विलय और अधिग्रहण सलाहकार के लिए ग्लोबल सॉल्यूशंस लीड थे।

समय टिकट:

से अधिक AWS मशीन लर्निंग

मेडिडेटा ने 30 गुना तेजी से एमएल अनुमान भविष्यवाणियों को तेज करने के लिए अमेज़ॅन सेजमेकर एसिंक्रोनस इंट्रेंस का उपयोग कैसे किया

स्रोत नोड: 1662307
समय टिकट: सितम्बर 12, 2022