การเข้าถึงเครื่องมือค้นหาไม่ได้มีแนวโน้มที่จะปรับปรุงความสามารถของแชทบอท AI ในการสร้างคำตอบที่แม่นยำและทันสมัยสำหรับคำถาม ซึ่งหมายความว่านักพัฒนาจะต้องค้นหาเทคนิคใหม่ ๆ เพื่อทำให้การโต้ตอบมีประโยชน์มากขึ้น ตามการวิจัย
โมเดลภาษาขนาดใหญ่ (LLM) เช่น GPT-3.5 ซึ่งเป็นพื้นฐานสำหรับ ChatGPT ได้รับการฝึกอบรมเกี่ยวกับข้อความที่คัดลอกมาจากอินเทอร์เน็ตจนถึงเดือนกันยายน 2021 บริษัทอย่าง Google และ Microsoft พยายามเสริม LLM ด้วยเครื่องมือค้นหา เพื่อให้พวกเขาเข้าถึงความรู้ในเว็บปัจจุบัน หน้า
ตามที่ตนแสดงไว้ นักประพันธ์เพลง และ Bing chatbots, Google และ Microsoft ยังคงดิ้นรนเพื่อให้ได้คำตอบที่ถูกต้องสำหรับคำค้นหา แม้ว่าคำตอบที่ถูกต้องอาจอยู่บนอินเทอร์เน็ตที่ไหนสักแห่งก็ตาม
“ใครๆ ก็คิดว่าการเชื่อมต่อเครื่องมือค้นหากับ ChatGPT เป็นโซลูชั่นที่สมบูรณ์แบบ แต่ความเป็นจริงกลับเป็นเรื่องที่ท้าทายมากขึ้น เนื่องจากความแม่นยำของผลการค้นหามีจำกัด” หงยิน หลัว นักวิจัยหลังปริญญาเอกจาก Computer Science & Artificial Intelligence Laboratory ของ MIT กล่าว ลงทะเบียน.
Luo อธิบายว่าเครื่องมือค้นหาเป็นระบบค้นหาข้อมูลตามคำหลักและไม่ได้ให้คำตอบโดยตรงสำหรับคำถามส่วนใหญ่เสมอไป นอกจากนี้ หน้าเว็บที่แตกต่างกันอาจมีข้อมูลที่ไม่เกี่ยวข้อง ขัดแย้ง หรือเป็นเท็จ Bing อ้างสิทธิ์อย่างไม่ถูกต้อง อดอล์ฟ ฮิตเลอร์ เคยเป็นสมาชิกของวงเรดิโอเฮด ในผลการค้นหารายการเดียว เป็นต้น
ชาวเน็ต สันนิษฐาน ข้อผิดพลาดอาจเกิดจากก หน้า บน Wikidata ที่กล่าวถึง Radiohead และ Adolf Hitler
หาก Bard และ Bing มีประโยชน์ นักพัฒนาจะต้องหาวิธีทำให้ LLM แยกข้อมูลที่เป็นประโยชน์มากที่สุดจากข้อความที่มีเสียงดัง สับสน และไม่สอดคล้องกัน Luo และเพื่อนร่วมงานของเขาจาก MIT และ Chinese University of Hong Kong เชื่อว่าโมเดลจำเป็นต้องได้รับการปรับแต่งเพิ่มเติม เพื่อให้สามารถทำตามคำแนะนำในการสร้างคำตอบสำหรับการค้นหาเว็บได้ดียิ่งขึ้น
ทีมงานได้ทำการปรับแต่ง Meta's โทรซึ่งเป็น LLM พารามิเตอร์เจ็ดพันล้าน ซึ่งปรับแต่งอย่างละเอียดบนฐานข้อมูลที่มีคำสั่งแบบข้อความ 52,000 คู่ และการตอบกลับที่เกี่ยวข้องที่สร้างโดย GPT-4 นักวิจัยยังได้สร้างชุดข้อมูลแยกต่างหากซึ่งประกอบด้วยหน้าเว็บ XNUMX อันดับแรกที่เกี่ยวข้องกับคำสั่งแต่ละคำสั่ง และฝึกอบรมแบบจำลองเพื่อสร้างการตอบสนองที่ถูกต้องโดยการจัดอันดับแหล่งที่มาว่ามีความเกี่ยวข้องและสอดคล้องอย่างใกล้ชิดกับการตอบสนองที่ถูกต้องเพียงใด
Luo กล่าวว่าโมเดลที่ได้รับการปรับแต่งอย่างดี – มีชื่อเล่นว่า เซล-7Bซึ่งย่อมาจาก Search-Augmented Instruction Learning ดีกว่าในการเพิกเฉยต่อผลการค้นหาที่เสียสมาธิหรือไม่น่าเชื่อถือ และสร้างคำตอบที่มีคุณภาพสูงขึ้น รายละเอียดก็มี การตีพิมพ์ [PDF] ในบทความที่เผยแพร่บน arXiv และโมเดล รหัส อยู่บน GitHub คุณยังสามารถเล่นกับ สาธิต ของระบบที่โฮสต์บน Hugging Face
“แบบจำลองของเราเรียนรู้ที่จะค้นหาข้อมูลที่เป็นประโยชน์จากผลการค้นหาที่มีเสียงดัง และสร้างคำตอบที่แม่นยำที่สุดเท่าที่จะเป็นไปได้ ด้วยเหตุนี้ แบบจำลองของเราจึงสามารถสรุปข้อมูลอันมีค่าได้ดีขึ้น และสร้างคำตอบที่ดีกว่าสำหรับคำค้นหาต่างๆ แม้ว่าเครื่องมือค้นหาจะไม่สามารถจัดการกับคำค้นหาเหล่านั้นได้ดีนักก็ตาม” Luo กล่าว
“การฝึกอบรมของเรามีขั้นตอนที่ชี้แจงอย่างชัดเจนว่าผลการค้นหาแต่ละรายการมีประโยชน์หรือไม่ และโมเดลภาษาจะเป็นไปตามข้อมูลที่เป็นประโยชน์ที่เลือกไว้ กระบวนการนี้จะกรองผลการค้นหาที่ไม่น่าเชื่อถือและไม่เกี่ยวข้องส่วนใหญ่ออกไป และปรับปรุงประสิทธิภาพการปฏิบัติตามคำแนะนำโดยเฉลี่ย”
การทดลองเบื้องต้นแสดงให้เห็นว่า SAIL-7B มีประสิทธิภาพเหนือกว่า GPT-3.5 และรุ่นอื่นๆ ที่มีพารามิเตอร์มากกว่าในช่วงของงาน การทดลองนี้ประเมินความสามารถในการตอบคำถามสามัญสำนึกและคำถามปลายเปิด รวมถึงการตรวจสอบข้อเท็จจริง และการตรวจจับคำพูดแสดงความเกลียดชัง โมเดลดังกล่าวได้รับการป้อนหน้าเว็บจากวิกิพีเดียและผลการค้นหาจาก DuckDuckGo เพื่อช่วยเลือกคำตอบที่ถูกต้องจากรายการคำตอบของผู้สมัคร อย่างไรก็ตาม GPT-4 ยังคงดีกว่า SAIL-7B
“ความท้าทายก็คือโมเดลที่ใหญ่กว่านั้นมีความรู้ การจดจำ และความสามารถในการใช้เหตุผลที่แข็งแกร่งกว่ามาก ดังนั้นโมเดลของเราจึงยังไม่ดีเท่า GPT-4 อย่างไรก็ตาม SAIL-7B เป็นการพิสูจน์แนวคิดด้วยแบบจำลอง 'ขนาดเล็ก' และขั้นตอนต่อไปของเราคือการฝึกแบบจำลองที่ใหญ่กว่าด้วยกลยุทธ์ที่เราเสนอ” Luo กล่าว
อย่างไรก็ตาม โมเดลที่ได้รับการปรับแต่งอย่างละเอียดด้วยเทคนิคการเรียนรู้คำสั่งเสริมการค้นหาในปัจจุบันนั้นยังไม่สมบูรณ์แบบ ผู้วิจัยตั้งข้อสังเกตว่าพวกเขาไม่สามารถอธิบายได้ ทำไม ผลการค้นหาน่าเชื่อถือหรือไม่ พวกเขาหวังว่าจะมีกลยุทธ์อื่นเพื่อเพิ่มความแม่นยำและความน่าเชื่อถือในอนาคต ®
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- การเงิน EVM ส่วนต่อประสานแบบครบวงจรสำหรับการเงินแบบกระจายอำนาจ เข้าถึงได้ที่นี่.
- กลุ่มสื่อควอนตัม IR/PR ขยาย เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. ข้อมูลอัจฉริยะ Web3 ขยายความรู้ เข้าถึงได้ที่นี่.
- ที่มา: https://go.theregister.com/feed/www.theregister.com/2023/06/07/search_engines_make_chatbots_inaccurate/
- :เป็น
- :ไม่
- $ ขึ้น
- 000
- 2021
- 7
- a
- ความสามารถ
- ความสามารถ
- เข้า
- ตาม
- ความถูกต้อง
- ถูกต้อง
- AI
- AI แชทบอท
- ชิด
- ด้วย
- เสมอ
- an
- และ
- อื่น
- คำตอบ
- คำตอบ
- เป็น
- เทียม
- ปัญญาประดิษฐ์
- AS
- การประเมิน
- ภาคี
- ที่เกี่ยวข้อง
- At
- เฉลี่ย
- วงดนตรี
- รากฐาน
- BE
- เพราะ
- รับ
- เชื่อ
- ดีกว่า
- Bing
- แต่
- by
- CAN
- ผู้สมัคร
- ไม่ได้
- ที่เกิดจาก
- ท้าทาย
- ท้าทาย
- chatbot
- chatbots
- ChatGPT
- การตรวจสอบ
- ชาวจีน
- อ้างว่า
- อย่างใกล้ชิด
- CO
- เพื่อนร่วมงาน
- อย่างไร
- ร่วมกัน
- บริษัท
- คอมพิวเตอร์
- วิทยาการคอมพิวเตอร์
- แนวคิด
- ทำให้เกิดความสับสน
- การเชื่อมต่อ
- บรรจุ
- แก้ไข
- ตรงกัน
- ได้
- ปัจจุบัน
- ฐานข้อมูล
- แสดงให้เห็นถึง
- รายละเอียด
- นักพัฒนา
- ต่าง
- โดยตรง
- do
- doesn
- สวม
- แต่ละ
- เครื่องยนต์
- เครื่องยนต์
- ความผิดพลาด
- แม้
- ตัวอย่าง
- การทดลอง
- อธิบาย
- อธิบาย
- สารสกัด
- ใบหน้า
- ความจริง
- เท็จ
- เฟด
- รูป
- ฟิลเตอร์
- หา
- ปฏิบัติตาม
- ดังต่อไปนี้
- สำหรับ
- ราคาเริ่มต้นที่
- ต่อไป
- อนาคต
- สร้าง
- สร้าง
- สร้าง
- GitHub
- ให้
- ดี
- จัดการ
- มี
- ช่วย
- เป็นประโยชน์
- สูงกว่า
- ของเขา
- ฮ่องกง
- ฮ่องกง
- ความหวัง
- เป็นเจ้าภาพ
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- อย่างไรก็ตาม
- HTTPS
- if
- ปรับปรุง
- in
- รวมถึง
- อย่างไม่ถูกต้อง
- เพิ่ม
- ข้อมูล
- คำแนะนำการใช้
- Intelligence
- ปฏิสัมพันธ์
- อินเทอร์เน็ต
- IT
- jpg
- ความรู้
- ฮ่องกง
- ห้องปฏิบัติการ
- ภาษา
- ที่มีขนาดใหญ่
- การเรียนรู้
- กดไลก์
- ถูก จำกัด
- รายการ
- LLM
- ทำ
- อาจ..
- วิธี
- สมาชิก
- กล่าวถึง
- Meta
- ไมโครซอฟท์
- อาจ
- เอ็มไอที
- แบบ
- โมเดล
- ข้อมูลเพิ่มเติม
- มากที่สุด
- มาก
- จำเป็นต้อง
- ใหม่
- ถัดไป
- เด่น
- of
- on
- ONE
- or
- อื่นๆ
- ของเรา
- ออก
- คู่
- กระดาษ
- พารามิเตอร์
- รูปแบบไฟล์ PDF
- สมบูรณ์
- การปฏิบัติ
- PHP
- เลือก
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- เล่น
- เป็นไปได้
- กระบวนการ
- ก่อ
- พิสูจน์
- พิสูจน์แนวคิด
- เสนอ
- ให้
- คุณภาพ
- คำสั่ง
- คำถาม
- พิสัย
- อันดับ
- ความจริง
- การเผยแพร่
- ตรงประเด็น
- ความเชื่อถือได้
- การวิจัย
- นักวิจัย
- ว่า
- คำตอบ
- การตอบสนอง
- ผล
- ผลสอบ
- ขวา
- s
- กล่าวว่า
- วิทยาศาสตร์
- เอเชียตะวันออกเฉียงใต้
- ค้นหา
- เครื่องมือค้นหา
- เครื่องมือค้นหา
- เลือก
- ความรู้สึก
- แยก
- กันยายน
- แสดงให้เห็นว่า
- เล็ก
- So
- ทางออก
- บางแห่ง
- แหล่งที่มา
- การพูด
- ยืน
- ขั้นตอน
- ยังคง
- กลยุทธ์
- แข็งแกร่ง
- การต่อสู้
- สรุป
- ระบบ
- ระบบ
- งาน
- ทีม
- เทคนิค
- กว่า
- ที่
- พื้นที่
- ก้าวสู่อนาคต
- ของพวกเขา
- พวกเขา
- พวกเขา
- คิด
- นี้
- แต่?
- ไปยัง
- ด้านบน
- ผ่านการฝึกอบรม
- การฝึกอบรม
- เชื่อถือได้
- ลอง
- มหาวิทยาลัย
- จนกระทั่ง
- ทันเหตุการณ์
- us
- มีคุณค่า
- ต่างๆ
- มาก
- คือ
- we
- เว็บ
- ดี
- คือ
- เมื่อ
- ว่า
- ที่
- วิกิพีเดีย
- จะ
- กับ
- ยัง
- คุณ
- ลมทะเล