शोध के अनुसार, खोज इंजन तक पहुंच से एआई चैटबॉट की प्रश्नों के सटीक और अद्यतित उत्तर उत्पन्न करने की क्षमता में सुधार नहीं होता है, जिसका अर्थ है कि डेवलपर्स को इंटरैक्शन को और अधिक उपयोगी बनाने के लिए नई तकनीकों को ढूंढना होगा।
जीपीटी-3.5 जैसे बड़े भाषा मॉडल (एलएलएम) - चैटजीपीटी का आधार - को सितंबर 2021 तक इंटरनेट से स्क्रैप किए गए टेक्स्ट पर प्रशिक्षित किया जाता है। Google और Microsoft जैसी कंपनियां खोज इंजन के साथ एलएलएम को बढ़ाने की कोशिश करती हैं, जिससे उन्हें वर्तमान वेब में ज्ञान तक पहुंच मिलती है। पन्ने.
जैसा कि उनके संबंधितों द्वारा प्रदर्शित किया गया है चारण और बिंग चैटबॉट, Google और Microsoft अभी भी खोज क्वेरी पर सटीक प्रतिक्रिया देने के लिए संघर्ष कर रहे हैं - भले ही सही उत्तर कहीं इंटरनेट पर हो।
एमआईटी के कंप्यूटर साइंस एंड आर्टिफिशियल इंटेलिजेंस लेबोरेटरी में पोस्टडॉक्टरल एसोसिएट होंगयिन लुओ ने कहा, "कोई सोच सकता है कि सर्च इंजन और चैटजीपीटी को जोड़ना एक सही समाधान है, लेकिन खोज परिणामों की सीमित सटीकता के कारण वास्तविकता अधिक चुनौतीपूर्ण है।" रजिस्टर.
लुओ बताते हैं कि खोज इंजन कीवर्ड-आधारित पुनर्प्राप्ति प्रणाली हैं और हमेशा अधिकांश प्रश्नों के सीधे उत्तर प्रदान नहीं करते हैं। साथ ही, अलग-अलग वेब पेजों में असंबद्ध, विरोधाभासी या गलत जानकारी हो सकती है। बिंग ने गलत दावा किया एडॉल्फ हिटलर रेडियोहेड बैंड का सदस्य था उदाहरण के लिए, एक खोज परिणाम में।
netizens अनुमान लगाया क्या त्रुटि किसी कारण से हो सकती है? पृष्ठ विकिडेटा पर रेडियोहेड और एडॉल्फ हिटलर का उल्लेख है।
यदि बार्ड और बिंग को उपयोगी बनाना है, तो डेवलपर्स को यह पता लगाना होगा कि एलएलएम को शोर, भ्रमित करने वाले और असंगत पाठ के समुद्र से सबसे उपयोगी जानकारी कैसे निकाली जाए। एमआईटी और हांगकांग के चीनी विश्वविद्यालय के लुओ और उनके सहयोगियों का मानना है कि मॉडलों को और बेहतर बनाने की आवश्यकता है ताकि वे वेब खोज के लिए प्रतिक्रियाएं उत्पन्न करने के निर्देशों का बेहतर ढंग से पालन कर सकें।
टीम ने मेटा में बदलाव किया लामा, एक सात-बिलियन-पैरामीटर एलएलएम, इसे GPT-52,000 द्वारा उत्पन्न पाठ-आधारित निर्देशों और संबंधित प्रतिक्रियाओं के 4 जोड़े वाले डेटाबेस पर ठीक से ट्यून किया गया है। शोधकर्ताओं ने एक अलग डेटासेट भी बनाया जिसमें प्रत्येक निर्देश से जुड़े शीर्ष पांच वेब पेज शामिल थे, और स्रोतों को रैंकिंग देकर सही प्रतिक्रिया उत्पन्न करने के लिए मॉडल को प्रशिक्षित किया कि वे कितने प्रासंगिक और सही प्रतिक्रिया के साथ निकटता से जुड़े हुए थे।
लुओ ने कहा कि सुव्यवस्थित मॉडल - उपनाम सेल-7बी, जो खोज-संवर्धित निर्देश शिक्षण के लिए है - ध्यान भटकाने वाले या अविश्वसनीय खोज परिणामों को नजरअंदाज करने में बेहतर है और उच्च गुणवत्ता वाले उत्तर उत्पन्न करता है। ब्यौरा दिया गया है प्रकाशित [पीडीएफ] arXiv और मॉडल पर जारी एक पेपर में कोड GitHub पर है. आप इसके साथ भी खेल सकते हैं डेमो हगिंग फेस पर होस्ट किए गए सिस्टम का।
“हमारा मॉडल शोर-शराबे वाले खोज परिणामों से उपयोगी जानकारी ढूंढना और यथासंभव सटीक प्रतिक्रियाएँ उत्पन्न करना सीखता है। परिणामस्वरूप, हमारा मॉडल मूल्यवान जानकारी को बेहतर ढंग से सारांशित कर सकता है और विभिन्न खोज प्रश्नों के लिए बेहतर उत्तर उत्पन्न कर सकता है, तब भी जब खोज इंजन उन्हें बहुत अच्छी तरह से संभाल नहीं सकते हैं, ”लुओ ने कहा।
“हमारे प्रशिक्षण में स्पष्ट रूप से एक चरण शामिल है जो स्पष्ट करता है कि प्रत्येक खोज परिणाम सहायक है या नहीं, और भाषा मॉडल चयनित उपयोगी जानकारी का अनुसरण करता है। यह प्रक्रिया अधिकांश अविश्वसनीय और असंबंधित खोज परिणामों को फ़िल्टर करती है और औसत अनुदेश-पालन प्रदर्शन में सुधार करती है।
प्रारंभिक प्रयोगों से पता चला कि SAIL-7B ने विभिन्न कार्यों में GPT-3.5 और अधिक पैरामीटर वाले अन्य मॉडलों से बेहतर प्रदर्शन किया। प्रयोगों में सामान्य ज्ञान और खुले प्रश्नों के उत्तर देने के साथ-साथ तथ्य की जाँच करने और घृणास्पद भाषण का पता लगाने की उनकी क्षमताओं का आकलन किया गया। उम्मीदवारों की प्रतिक्रियाओं की सूची से सही उत्तर चुनने में मदद करने के लिए मॉडलों को विकिपीडिया से वेब पेज और डकडकगो से खोज परिणाम दिए गए। हालाँकि, GPT-4, SAIL-7B से अभी भी बेहतर था।
“चुनौती यह है कि बड़े मॉडलों में अधिक मजबूत ज्ञान, याद रखने और तर्क करने की क्षमता होती है, इसलिए हमारा मॉडल अभी तक GPT-4 जितना अच्छा नहीं है। हालाँकि, SAIL-7B एक 'छोटे' मॉडल के साथ अवधारणा का प्रमाण है, और हमारा अगला कदम हमारे द्वारा प्रस्तावित रणनीति के साथ एक बड़े मॉडल को प्रशिक्षित करना है," लुओ ने हमें बताया।
हालाँकि, वर्तमान खोज-संवर्धित अनुदेश शिक्षण तकनीक से सुव्यवस्थित मॉडल परिपूर्ण नहीं हैं। शोधकर्ताओं ने कहा कि वे समझा नहीं सकते क्यों कोई खोज परिणाम विश्वसनीय है या नहीं। उन्हें भविष्य में सटीकता और विश्वसनीयता बढ़ाने के लिए एक और रणनीति के साथ आने की उम्मीद है। ®
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- ईवीएम वित्त। विकेंद्रीकृत वित्त के लिए एकीकृत इंटरफ़ेस। यहां पहुंचें।
- क्वांटम मीडिया समूह। आईआर/पीआर प्रवर्धित। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 डेटा इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- स्रोत: https://go.theregister.com/feed/www.theregister.com/2023/06/07/search_engines_make_chatbots_inaccurate/
- :है
- :नहीं
- $यूपी
- 000
- 2021
- 7
- a
- क्षमताओं
- क्षमता
- पहुँच
- अनुसार
- शुद्धता
- सही
- AI
- ए चेट्बोट
- गठबंधन
- भी
- हमेशा
- an
- और
- अन्य
- जवाब
- जवाब
- हैं
- कृत्रिम
- कृत्रिम बुद्धिमत्ता
- AS
- आकलन किया
- सहयोगी
- जुड़े
- At
- औसत
- बैंड
- आधार
- BE
- क्योंकि
- किया गया
- मानना
- बेहतर
- बिंग
- लेकिन
- by
- कर सकते हैं
- उम्मीदवार
- नही सकता
- के कारण होता
- चुनौती
- चुनौतीपूर्ण
- chatbot
- chatbots
- ChatGPT
- जाँच
- चीनी
- ने दावा किया
- निकट से
- CO
- सहयोगियों
- कैसे
- सामान्य
- कंपनियों
- कंप्यूटर
- कम्प्यूटर साइंस
- संकल्पना
- भ्रमित
- कनेक्ट कर रहा है
- शामिल
- सही
- इसी
- सका
- वर्तमान
- डाटाबेस
- साबित
- विवरण
- डेवलपर्स
- विभिन्न
- प्रत्यक्ष
- do
- नहीं करता है
- डॉन
- से प्रत्येक
- इंजन
- इंजन
- त्रुटि
- और भी
- उदाहरण
- प्रयोगों
- समझाना
- बताते हैं
- उद्धरण
- चेहरा
- तथ्य
- असत्य
- फेड
- आकृति
- फ़िल्टर
- खोज
- का पालन करें
- इस प्रकार है
- के लिए
- से
- आगे
- भविष्य
- उत्पन्न
- उत्पन्न
- उत्पन्न करता है
- GitHub
- देते
- अच्छा
- गूगल
- संभालना
- है
- मदद
- सहायक
- उच्चतर
- उसके
- हांग
- हॉगकॉग
- आशा
- मेजबानी
- कैसे
- How To
- तथापि
- HTTPS
- if
- में सुधार
- in
- शामिल
- गलत रूप से
- बढ़ना
- करें-
- निर्देश
- बुद्धि
- बातचीत
- इंटरनेट
- IT
- जेपीजी
- ज्ञान
- Kong
- प्रयोगशाला
- भाषा
- बड़ा
- सीख रहा हूँ
- पसंद
- सीमित
- सूची
- एलएलएम
- बनाना
- मई..
- साधन
- सदस्य
- उल्लेख किया
- मेटा
- माइक्रोसॉफ्ट
- हो सकता है
- एमआईटी
- आदर्श
- मॉडल
- अधिक
- अधिकांश
- बहुत
- आवश्यकता
- नया
- अगला
- विख्यात
- of
- on
- ONE
- or
- अन्य
- हमारी
- आउट
- जोड़े
- काग़ज़
- पैरामीटर
- पीडीएफ
- उत्तम
- प्रदर्शन
- PHP
- चुनना
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- प्ले
- संभव
- प्रक्रिया
- उत्पादन
- प्रमाण
- अवधारणा के सुबूत
- प्रस्तावित
- प्रदान करना
- गुणवत्ता
- प्रश्नों
- प्रशन
- रेंज
- रैंकिंग
- वास्तविकता
- रिहा
- प्रासंगिक
- विश्वसनीयता
- अनुसंधान
- शोधकर्ताओं
- कि
- प्रतिक्रिया
- प्रतिक्रियाएं
- परिणाम
- परिणाम
- सही
- s
- कहा
- विज्ञान
- एसईए
- Search
- search engine
- खोज इंजन
- चयनित
- भावना
- अलग
- सितंबर
- पता चला
- छोटा
- So
- समाधान
- कहीं न कहीं
- सूत्रों का कहना है
- भाषण
- खड़ा
- कदम
- फिर भी
- स्ट्रेटेजी
- मजबूत
- संघर्ष
- संक्षेप में प्रस्तुत करना
- प्रणाली
- सिस्टम
- कार्य
- टीम
- तकनीक
- से
- कि
- RSI
- भविष्य
- लेकिन हाल ही
- उन
- वे
- सोचना
- इसका
- हालांकि?
- सेवा मेरे
- ऊपर का
- प्रशिक्षित
- प्रशिक्षण
- भरोसेमंद
- कोशिश
- विश्वविद्यालय
- जब तक
- आधुनिकतम
- us
- मूल्यवान
- विभिन्न
- बहुत
- था
- we
- वेब
- कुंआ
- थे
- कब
- या
- कौन कौन से
- विकिपीडिया
- मर्जी
- साथ में
- अभी तक
- आप
- जेफिरनेट