सर्च इंजन हमेशा चैटबॉट की सटीकता में मदद नहीं करते हैं

सर्च इंजन हमेशा चैटबॉट की सटीकता में मदद नहीं करते हैं

खोज इंजन हमेशा चैटबॉट सटीकता प्लेटोब्लॉकचेन डेटा इंटेलिजेंस की मदद नहीं करते हैं। लंबवत खोज. ऐ.

शोध के अनुसार, खोज इंजन तक पहुंच से एआई चैटबॉट की प्रश्नों के सटीक और अद्यतित उत्तर उत्पन्न करने की क्षमता में सुधार नहीं होता है, जिसका अर्थ है कि डेवलपर्स को इंटरैक्शन को और अधिक उपयोगी बनाने के लिए नई तकनीकों को ढूंढना होगा।

जीपीटी-3.5 जैसे बड़े भाषा मॉडल (एलएलएम) - चैटजीपीटी का आधार - को सितंबर 2021 तक इंटरनेट से स्क्रैप किए गए टेक्स्ट पर प्रशिक्षित किया जाता है। Google और Microsoft जैसी कंपनियां खोज इंजन के साथ एलएलएम को बढ़ाने की कोशिश करती हैं, जिससे उन्हें वर्तमान वेब में ज्ञान तक पहुंच मिलती है। पन्ने.

जैसा कि उनके संबंधितों द्वारा प्रदर्शित किया गया है चारण और बिंग चैटबॉट, Google और Microsoft अभी भी खोज क्वेरी पर सटीक प्रतिक्रिया देने के लिए संघर्ष कर रहे हैं - भले ही सही उत्तर कहीं इंटरनेट पर हो।

एमआईटी के कंप्यूटर साइंस एंड आर्टिफिशियल इंटेलिजेंस लेबोरेटरी में पोस्टडॉक्टरल एसोसिएट होंगयिन लुओ ने कहा, "कोई सोच सकता है कि सर्च इंजन और चैटजीपीटी को जोड़ना एक सही समाधान है, लेकिन खोज परिणामों की सीमित सटीकता के कारण वास्तविकता अधिक चुनौतीपूर्ण है।" रजिस्टर.

लुओ बताते हैं कि खोज इंजन कीवर्ड-आधारित पुनर्प्राप्ति प्रणाली हैं और हमेशा अधिकांश प्रश्नों के सीधे उत्तर प्रदान नहीं करते हैं। साथ ही, अलग-अलग वेब पेजों में असंबद्ध, विरोधाभासी या गलत जानकारी हो सकती है। बिंग ने गलत दावा किया एडॉल्फ हिटलर रेडियोहेड बैंड का सदस्य था उदाहरण के लिए, एक खोज परिणाम में।

netizens अनुमान लगाया क्या त्रुटि किसी कारण से हो सकती है? पृष्ठ विकिडेटा पर रेडियोहेड और एडॉल्फ हिटलर का उल्लेख है।

यदि बार्ड और बिंग को उपयोगी बनाना है, तो डेवलपर्स को यह पता लगाना होगा कि एलएलएम को शोर, भ्रमित करने वाले और असंगत पाठ के समुद्र से सबसे उपयोगी जानकारी कैसे निकाली जाए। एमआईटी और हांगकांग के चीनी विश्वविद्यालय के लुओ और उनके सहयोगियों का मानना ​​है कि मॉडलों को और बेहतर बनाने की आवश्यकता है ताकि वे वेब खोज के लिए प्रतिक्रियाएं उत्पन्न करने के निर्देशों का बेहतर ढंग से पालन कर सकें।

टीम ने मेटा में बदलाव किया लामा, एक सात-बिलियन-पैरामीटर एलएलएम, इसे GPT-52,000 द्वारा उत्पन्न पाठ-आधारित निर्देशों और संबंधित प्रतिक्रियाओं के 4 जोड़े वाले डेटाबेस पर ठीक से ट्यून किया गया है। शोधकर्ताओं ने एक अलग डेटासेट भी बनाया जिसमें प्रत्येक निर्देश से जुड़े शीर्ष पांच वेब पेज शामिल थे, और स्रोतों को रैंकिंग देकर सही प्रतिक्रिया उत्पन्न करने के लिए मॉडल को प्रशिक्षित किया कि वे कितने प्रासंगिक और सही प्रतिक्रिया के साथ निकटता से जुड़े हुए थे।

लुओ ने कहा कि सुव्यवस्थित मॉडल - उपनाम सेल-7बी, जो खोज-संवर्धित निर्देश शिक्षण के लिए है - ध्यान भटकाने वाले या अविश्वसनीय खोज परिणामों को नजरअंदाज करने में बेहतर है और उच्च गुणवत्ता वाले उत्तर उत्पन्न करता है। ब्यौरा दिया गया है प्रकाशित [पीडीएफ] arXiv और मॉडल पर जारी एक पेपर में कोड GitHub पर है. आप इसके साथ भी खेल सकते हैं डेमो हगिंग फेस पर होस्ट किए गए सिस्टम का।

“हमारा मॉडल शोर-शराबे वाले खोज परिणामों से उपयोगी जानकारी ढूंढना और यथासंभव सटीक प्रतिक्रियाएँ उत्पन्न करना सीखता है। परिणामस्वरूप, हमारा मॉडल मूल्यवान जानकारी को बेहतर ढंग से सारांशित कर सकता है और विभिन्न खोज प्रश्नों के लिए बेहतर उत्तर उत्पन्न कर सकता है, तब भी जब खोज इंजन उन्हें बहुत अच्छी तरह से संभाल नहीं सकते हैं, ”लुओ ने कहा।

“हमारे प्रशिक्षण में स्पष्ट रूप से एक चरण शामिल है जो स्पष्ट करता है कि प्रत्येक खोज परिणाम सहायक है या नहीं, और भाषा मॉडल चयनित उपयोगी जानकारी का अनुसरण करता है। यह प्रक्रिया अधिकांश अविश्वसनीय और असंबंधित खोज परिणामों को फ़िल्टर करती है और औसत अनुदेश-पालन प्रदर्शन में सुधार करती है।

प्रारंभिक प्रयोगों से पता चला कि SAIL-7B ने विभिन्न कार्यों में GPT-3.5 और अधिक पैरामीटर वाले अन्य मॉडलों से बेहतर प्रदर्शन किया। प्रयोगों में सामान्य ज्ञान और खुले प्रश्नों के उत्तर देने के साथ-साथ तथ्य की जाँच करने और घृणास्पद भाषण का पता लगाने की उनकी क्षमताओं का आकलन किया गया। उम्मीदवारों की प्रतिक्रियाओं की सूची से सही उत्तर चुनने में मदद करने के लिए मॉडलों को विकिपीडिया से वेब पेज और डकडकगो से खोज परिणाम दिए गए। हालाँकि, GPT-4, SAIL-7B से अभी भी बेहतर था।

“चुनौती यह है कि बड़े मॉडलों में अधिक मजबूत ज्ञान, याद रखने और तर्क करने की क्षमता होती है, इसलिए हमारा मॉडल अभी तक GPT-4 जितना अच्छा नहीं है। हालाँकि, SAIL-7B एक 'छोटे' मॉडल के साथ अवधारणा का प्रमाण है, और हमारा अगला कदम हमारे द्वारा प्रस्तावित रणनीति के साथ एक बड़े मॉडल को प्रशिक्षित करना है," लुओ ने हमें बताया।

हालाँकि, वर्तमान खोज-संवर्धित अनुदेश शिक्षण तकनीक से सुव्यवस्थित मॉडल परिपूर्ण नहीं हैं। शोधकर्ताओं ने कहा कि वे समझा नहीं सकते क्यों कोई खोज परिणाम विश्वसनीय है या नहीं। उन्हें भविष्य में सटीकता और विश्वसनीयता बढ़ाने के लिए एक और रणनीति के साथ आने की उम्मीद है। ®

समय टिकट:

से अधिक रजिस्टर