फाइन-ट्यूनिंग एपीआई में सुधार पेश करना और हमारे कस्टम मॉडल प्रोग्राम का विस्तार करना

फाइन-ट्यूनिंग एपीआई में सुधार पेश करना और हमारे कस्टम मॉडल प्रोग्राम का विस्तार करना

फाइन-ट्यूनिंग एपीआई में सुधार पेश करना और हमारे कस्टम मॉडल प्रोग्राम प्लेटोब्लॉकचेन डेटा इंटेलिजेंस का विस्तार करना। लंबवत खोज. ऐ.

सहायक फ़ाइन-ट्यूनिंग

पिछले नवंबर में देव दिवस पर, हम की घोषणा ओपनएआई शोधकर्ताओं के एक समर्पित समूह के साथ साझेदारी में, एक विशिष्ट डोमेन के लिए मॉडल को प्रशिक्षित और अनुकूलित करने के लिए डिज़ाइन किया गया एक कस्टम मॉडल प्रोग्राम। तब से, हमने दर्जनों ग्राहकों से मिलकर उनकी कस्टम मॉडल आवश्यकताओं का आकलन किया है और प्रदर्शन को और अधिकतम करने के लिए अपना कार्यक्रम विकसित किया है।

आज, हम कस्टम मॉडल कार्यक्रम के हिस्से के रूप में औपचारिक रूप से हमारी सहायता प्राप्त फाइन-ट्यूनिंग पेशकश की घोषणा कर रहे हैं। असिस्टेड फाइन-ट्यूनिंग, फाइन-ट्यूनिंग एपीआई से परे तकनीकों का लाभ उठाने के लिए हमारी तकनीकी टीमों के साथ एक सहयोगात्मक प्रयास है, जैसे कि बड़े पैमाने पर अतिरिक्त हाइपरपैरामीटर और विभिन्न पैरामीटर कुशल फाइन-ट्यूनिंग (पीईएफटी) तरीके। यह उन संगठनों के लिए विशेष रूप से सहायक है जिन्हें अपने उपयोग के मामले या कार्य के लिए मॉडल प्रदर्शन को अधिकतम करने के लिए कुशल प्रशिक्षण डेटा पाइपलाइन, मूल्यांकन प्रणाली और बीस्पोक पैरामीटर और तरीकों की स्थापना में सहायता की आवश्यकता होती है।

उदाहरण के लिए, एस के दूरसंचारदक्षिण कोरिया में 30 मिलियन से अधिक ग्राहकों को सेवा प्रदान करने वाला एक दूरसंचार ऑपरेटर, ग्राहक सेवा पर प्रारंभिक ध्यान देने के साथ दूरसंचार क्षेत्र में विशेषज्ञ बनने के लिए एक मॉडल को अनुकूलित करना चाहता था। उन्होंने कोरियाई भाषा में दूरसंचार से संबंधित बातचीत में अपने प्रदर्शन को बेहतर बनाने के लिए GPT-4 को बेहतर बनाने के लिए OpenAI के साथ काम किया। कई हफ्तों के दौरान, SKT और OpenAI ने दूरसंचार ग्राहक सेवा कार्यों में सार्थक प्रदर्शन में सुधार किया - बातचीत सारांश गुणवत्ता में 35% की वृद्धि, इरादे की पहचान सटीकता में 33% की वृद्धि, और संतुष्टि स्कोर में 3.6 से 4.5 तक की वृद्धि (बाहर)। 5 में से) जब परिष्कृत मॉडल की तुलना जीपीटी-4 से की जाती है। 

कस्टम-प्रशिक्षित मॉडल

कुछ मामलों में, संगठनों को शुरू से ही एक उद्देश्य-निर्मित मॉडल को प्रशिक्षित करने की आवश्यकता होती है जो उनके व्यवसाय, उद्योग या डोमेन को समझता हो। पूरी तरह से कस्टम-प्रशिक्षित मॉडल उपन्यास मध्य-प्रशिक्षण और प्रशिक्षण के बाद की तकनीकों का उपयोग करके मॉडल प्रशिक्षण प्रक्रिया के प्रमुख चरणों को संशोधित करके एक विशिष्ट डोमेन से नया ज्ञान प्राप्त करते हैं। जो संगठन पूरी तरह से कस्टम-प्रशिक्षित मॉडल के साथ सफलता देखते हैं, उनके पास अक्सर बड़ी मात्रा में मालिकाना डेटा होता है - लाखों उदाहरण या अरबों टोकन - जिनका उपयोग वे मॉडल को नए ज्ञान या अत्यधिक विशिष्ट उपयोग के मामलों के लिए जटिल, अद्वितीय व्यवहार सिखाने के लिए करना चाहते हैं। 

उदाहरण के लिए, हार्वे, वकीलों के लिए एक एआई-देशी कानूनी उपकरण, ने ओपनएआई के साथ साझेदारी की केस कानून के लिए एक कस्टम-प्रशिक्षित बड़ा भाषा मॉडल बनाएं. जबकि फाउंडेशन मॉडल तर्क करने में मजबूत थे, उनमें कानूनी मामले के इतिहास और कानूनी कार्य के लिए आवश्यक अन्य ज्ञान का व्यापक ज्ञान नहीं था। त्वरित इंजीनियरिंग, आरएजी और फाइन-ट्यूनिंग का परीक्षण करने के बाद, हार्वे ने मॉडल में आवश्यक संदर्भ की गहराई को जोड़ने के लिए हमारी टीम के साथ काम किया - 10 बिलियन टोकन मूल्य के डेटा के बराबर। हमारी टीम ने डोमेन-विशिष्ट मध्य-प्रशिक्षण से लेकर प्रशिक्षण के बाद की प्रक्रियाओं को अनुकूलित करने और विशेषज्ञ वकील की प्रतिक्रिया को शामिल करने तक, मॉडल प्रशिक्षण प्रक्रिया के हर चरण को संशोधित किया। परिणामी मॉडल ने तथ्यात्मक प्रतिक्रियाओं में 83% की वृद्धि हासिल की और वकीलों ने 97% समय जीपीटी-4 की तुलना में अनुकूलित मॉडल के आउटपुट को प्राथमिकता दी।

समय टिकट:

से अधिक OpenAI

GPT-4

स्रोत नोड: 1813337
समय टिकट: मार्च 14, 2023