ทีมนักวิชาการ นักวิจัย และวิศวกรในสหรัฐอาหรับเอมิเรตส์ (UAE) เปิดตัวแชทบอท AI เจนเนอเรชั่นใหม่ที่เรียกว่า 'Jais' เพื่อรองรับผู้ที่พูดภาษาอาหรับทั่วโลกโดยเฉพาะ ตามรายงานของ CNN
ทีมงานแย้งว่าอารบิกตัวที่หก พูดมากที่สุด ภาษาในโลกที่มีผู้พูดประมาณ 272 ล้านคนถูก “มีบทบาทน้อยใน AI กระแสหลัก” พวกเขาหวังที่จะยุติการครอบงำของภาษาอังกฤษในการฝึกอบรมระบบ AI ที่เรียกว่าโมเดลภาษาขนาดใหญ่ (LLM)
Jais AI chatbot มุ่งเน้นไปที่ตะวันออกกลาง
ปัญหาภาษาใน AI เป็นปัญหาทั่วโลก ญี่ปุ่นเพิ่งเลิกใช้ภาษาอังกฤษเนื่องจากประเทศนี้สร้าง ChatGPT เวอร์ชันของตัวเอง นักวิจัย กล่าวว่า แม้ว่าแชทบอทของ OpenAI จะเก่งในภาษาอังกฤษ แต่มักจะขาดภาษาญี่ปุ่น “เนื่องจากความแตกต่างในระบบตัวอักษร ข้อมูลที่จำกัด และปัจจัยอื่น ๆ”
Jais ตั้งชื่อตามภูเขาในสหรัฐอาหรับเอมิเรตส์ หรือ CNN รายงาน พูดและสามารถทำงานตามคำสั่งได้ เช่น การเขียนบทกวี เป็นต้น ChatGPT หรือของ Google นักประพันธ์เพลงแต่ในขนาดที่จำกัด AI ได้รับการฝึกฝนเกี่ยวกับพารามิเตอร์ข้อมูล 13 พันล้านพารามิเตอร์ ซึ่งห่างไกลจากพารามิเตอร์เกือบ 3.5 พันล้านพารามิเตอร์ของ ChatGPT 175 ซึ่งเป็นหน่วยวัดขนาดของโมเดลภาษาขนาดใหญ่ แต่ไม่ใช่ความแม่นยำ
มีแผนที่จะขยายชุดข้อมูลของ Jais เป็น 30 หมื่นล้านพารามิเตอร์ และช่วยให้สามารถอ่านรูปภาพและกราฟแทนที่จะเป็นเพียงข้อความ ตามที่ Timothy Baldwin ศาสตราจารย์ด้านการประมวลผลภาษาธรรมชาติของมหาวิทยาลัยปัญญาประดิษฐ์ Mohamed bin Zayed (MBZUAI) แห่งอาบูดาบีกล่าว
มหาวิทยาลัยทำงานร่วมกับ Cerebras Systems and Inception ของ Silicon Valley ซึ่งเป็นบริษัทในเครือของบริษัท AI G42 ในสหรัฐอาหรับเอมิเรตส์ เพื่อสร้าง Jais Baldwin กล่าวว่าในขณะที่ LLM คู่แข่งเช่น LLaMA ของ Meta และ GPT ของ OpenAI สามารถเข้าใจภาษาอาหรับได้ แต่พวกเขาได้รับการฝึกฝนส่วนใหญ่เกี่ยวกับข้อมูลภาษาอังกฤษออนไลน์
สำหรับ Jais การฝึกอบรมเกี่ยวข้องกับชุดข้อมูลทั้งภาษาอังกฤษและอารบิก แต่มุ่งเน้นไปที่เนื้อหาจากตะวันออกกลางซึ่งมีการพูดและเขียนภาษาอาหรับอย่างกว้างขวาง
Baldwin กล่าวว่าการมุ่งเน้นดังกล่าวทำให้แชทบอท AI ก้าวไปไกลกว่า “สิ่งที่ใครๆ ก็สามารถทำได้ในภาษาอาหรับ”
จากข้อมูลของ MBZUAI การฝึกอบรมที่เป็นเอกลักษณ์ของ Jais ช่วยให้แชทบอท 'เข้าใจความแตกต่างทางวัฒนธรรมและภาษาถิ่น' ทำให้มีประโยชน์มากขึ้นสำหรับอุตสาหกรรมต่างๆ ที่หลากหลาย นักพัฒนาได้เผยแพร่โมเดลนี้สู่สาธารณะในรูปแบบโอเพ่นซอร์ส ซึ่งหมายความว่าใครๆ ก็สามารถปรับแต่งโมเดลได้
การสลับระหว่างภาษาถิ่น
Baldwin บอกกับ CNN ว่าการฝึกอบรมด้านข้อมูลที่หลากหลายของ Jais จะช่วยให้สามารถสลับระหว่างภาษาถิ่นของภาษาอาหรับมาตรฐานสมัยใหม่ ซึ่งใช้สำหรับเอกสารราชการและการเขียนอย่างเป็นทางการ กับภาษาท้องถิ่นที่มักใช้ในบล็อกหรือโซเชียลมีเดีย
“ยังมีพื้นที่สำหรับการปรับปรุงอย่างแน่นอน แต่การมุ่งเน้นไปที่ความแข็งแกร่งในแง่ของความสามารถในการเข้าใจหากเรามีข้อมูลที่ไม่เป็นทางการมากขึ้นสำหรับแบบจำลอง” เขากล่าว
เช่นเดียวกับแชทบอท AI ทั่วไปอื่น ๆ Jais ถูกสร้างขึ้นเพื่อต่อต้านการแจ้งเตือนที่สร้าง “เป็นพิษหรือเป็นอันตราย” คำตอบ Baldwin กล่าว และจะไม่ตอบคำถามที่ “นำไปสู่การทำร้ายตนเองหรือเป็นการชี้นำให้ติดยาเสพติด” หัวข้อต่างๆ เช่น การรักร่วมเพศนั้นอยู่นอกขอบเขตซึ่งสอดคล้องกับความเชื่อของชาวมุสลิม
อ่านเพิ่มเติม: การพึ่งพา 'ภาษาอังกฤษ' ของ ChatGPT ทำให้ญี่ปุ่นต้องสร้างแชทบอท AI ของตัวเอง
Mohammed Soliman ผู้อำนวยการฝ่ายเทคโนโลยีเชิงกลยุทธ์และโครงการรักษาความปลอดภัยทางไซเบอร์ที่สถาบันตะวันออกกลางในกรุงวอชิงตัน ดี.ซี. กล่าวว่า ภาษาที่ใช้ตัวอักษรละติน เช่น ภาษาอังกฤษ ครอบงำ อินเทอร์เน็ต หมายความว่าชุดข้อมูลมีขนาดใหญ่ที่สุดในภาษาเหล่านั้น
“การเข้าถึงเครื่องมือ AI สำหรับผู้ที่พูดภาษาใดภาษาหนึ่งโดยเฉพาะสามารถป้องกันไม่ให้กลุ่มผู้ด้อยโอกาสได้รับผลประโยชน์จาก AI” เขากล่าว
“[LLM เหล่านี้] ขาดความตระหนักรู้เกี่ยวกับวัฒนธรรมอื่น ๆ ซึ่งส่งผลเสียต่อประสบการณ์ผู้ใช้สำหรับผู้ที่มีภูมิหลังที่หลากหลาย” Soliman กล่าวเสริม ตามรายงานของ CNN
สหรัฐอาหรับเอมิเรตส์มีความก้าวหน้าครั้งสำคัญในการพัฒนาระบบ AI เชิงสร้างสรรค์ เอมิเรตเป็นประเทศแรกในโลกที่ได้รับการแต่งตั้ง รัฐมนตรีกระทรวงเอไอ ในปี 2017 มีรายงานว่ามีโมเดล AI กำเนิดที่ใหญ่ที่สุดในภูมิภาคอย่าง Falcon ซึ่งเผยแพร่โดยสภาวิจัยเทคโนโลยีขั้นสูงของอาบูดาบีและสถาบันนวัตกรรมเทคโนโลยี (TII) ในเดือนมีนาคม
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://metanews.com/uaes-new-ai-chatbot-jais-caters-to-arabic-speakers-challenging-english-bias/
- :มี
- :เป็น
- :ไม่
- :ที่ไหน
- 13
- 2017
- 30
- 7
- a
- สามารถ
- นักวิชาการ
- เข้า
- ตาม
- ความถูกต้อง
- บรรลุ
- ที่เพิ่ม
- สูง
- เทคโนโลยีขั้นสูง
- ในทางลบ
- น่าสงสาร
- หลังจาก
- AI
- AI แชทบอท
- ระบบ AI
- ช่วยให้
- Alphabet
- ด้วย
- และ
- คำตอบ
- ทุกคน
- อาหรับ
- อาหรับเอมิเรตส์
- ภาษาอาหรับ
- เป็น
- ระบุ
- รอบ
- เทียม
- ปัญญาประดิษฐ์
- AS
- At
- ใช้ได้
- ความตระหนัก
- ภูมิหลัง
- รับ
- กำลัง
- ความเชื่อ
- ประโยชน์ที่ได้รับ
- ระหว่าง
- เกิน
- พันล้าน
- BIN
- Blog
- ภูมิใจ
- ทั้งสอง
- ขอบเขต
- สร้าง
- สร้าง
- แต่
- by
- ที่เรียกว่า
- CAN
- ให้ความบันเทิง
- จัดเลี้ยง
- อย่างแน่นอน
- chatbot
- chatbots
- ChatGPT
- ซีไอเอ
- ซีเอ็นเอ็น
- การผสมผสาน
- เมื่อเทียบกับ
- กังวล
- เนื้อหา
- ได้
- สภา
- ประเทศ
- สร้าง
- ด้านวัฒนธรรม
- ปรับแต่ง
- ไซเบอร์
- การรักษาความปลอดภัยในโลกไซเบอร์
- ข้อมูล
- ชุดข้อมูล
- dc
- การพึ่งพาอาศัยกัน
- นักพัฒนา
- ที่กำลังพัฒนา
- ความแตกต่าง
- ต่าง
- ผู้อำนวยการ
- หลาย
- do
- เอกสาร
- การปกครอง
- ตะวันออก
- อื่น
- เอมิเรต
- เอมิเรต
- ทำให้สามารถ
- ปลาย
- วิศวกร
- ภาษาอังกฤษ
- พิเศษ
- แสดง
- ประสบการณ์
- ปัจจัย
- ฟอลส์
- ไกล
- หนทางไกล
- บริษัท
- ชื่อจริง
- โฟกัส
- มุ่งเน้นไปที่
- สำหรับ
- เป็นทางการ
- ราคาเริ่มต้นที่
- กำเนิด
- กำเนิด AI
- Go
- ของ Google
- กราฟ
- มี
- he
- จะช่วยให้
- จุดสูง
- หวัง
- HTML
- HTTPS
- if
- ภาพ
- การปรับปรุง
- in
- การเริ่ม
- อุตสาหกรรม
- ไม่เป็นทางการ
- นักวิเคราะห์ส่วนบุคคลที่หาโอกาสให้เป็นไปได้มากที่สุด
- ปัจจัยการผลิต
- แทน
- สถาบัน
- Intelligence
- อินเทอร์เน็ต
- ร่วมมือ
- ปัญหา
- IT
- ITS
- ประเทศญี่ปุ่น
- ภาษาญี่ปุ่น
- jpg
- เพียงแค่
- ที่รู้จักกัน
- ไม่มี
- ภาษา
- ภาษา
- ใหญ่
- ใหญ่ที่สุด
- ละติน
- กดไลก์
- ถูก จำกัด
- Line
- ดูรายละเอียด
- ในประเทศ
- ทำ
- หลัก
- การทำ
- มีนาคม
- ความกว้างสูงสุด
- ความหมาย
- วัด
- ภาพบรรยากาศ
- กลาง
- ตะวันออกกลาง
- ล้าน
- แบบ
- โมเดล
- ทันสมัย
- โมฮาเหม็
- มุฮัมมัด
- ข้อมูลเพิ่มเติม
- ภูเขา
- ที่มีชื่อ
- โดยธรรมชาติ
- ประมวลผลภาษาธรรมชาติ
- ธรรมชาติ
- ใกล้
- ใหม่
- ความแตกต่าง
- of
- เป็นทางการ
- มักจะ
- on
- ออนไลน์
- เปิด
- โอเพนซอร์ส
- or
- อื่นๆ
- ออก
- ของตนเอง
- พารามิเตอร์
- คน
- ดำเนินการ
- แผน
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- อย่างเด่น
- ป้องกัน
- การประมวลผล
- ศาสตราจารย์
- โครงการ
- สาธารณะ
- คำสั่ง
- พิสัย
- อ่าน
- การเก็บเกี่ยว
- เมื่อเร็ว ๆ นี้
- การเผยแพร่
- รายงาน
- การวิจัย
- นักวิจัย
- ตอบสนอง
- คู่แข่ง
- ความแข็งแรง
- ห้อง
- s
- กล่าวว่า
- พูดว่า
- ขนาด
- ความปลอดภัย
- สั้น
- สำคัญ
- ซิลิคอน
- ที่หก
- ขนาด
- สังคม
- โซเชียลมีเดีย
- แหล่ง
- พูด
- ลำโพง
- โดยเฉพาะ
- เฉพาะ
- พูด
- มาตรฐาน
- ยุทธศาสตร์
- ความก้าวหน้า
- บริษัท สาขา
- อย่างเช่น
- สวิตซ์
- ระบบ
- ระบบ
- งาน
- ทีม
- เทคโนโลยี
- เทคโนโลยี
- นวัตกรรมเทคโนโลยี
- เงื่อนไขการใช้บริการ
- ข้อความ
- ที่
- พื้นที่
- โลก
- ที่นั่น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- พวกเขา
- เหล่านั้น
- ไปยัง
- บอก
- เครื่องมือ
- หัวข้อ
- ผ่านการฝึกอบรม
- การฝึกอบรม
- ยูเออี
- เข้าใจ
- เป็นเอกลักษณ์
- พร้อมใจกัน
- สหรัฐอาหรับ
- สหรัฐอาหรับเอมิเรตส์
- มหาวิทยาลัย
- เปิดตัว
- มือสอง
- ผู้ใช้งาน
- ประสบการณ์ของผู้ใช้
- มักจะ
- รุ่น
- คือ
- วอชิงตัน
- we
- ที่
- ในขณะที่
- WHO
- กว้าง
- ช่วงกว้าง
- อย่างกว้างขวาง
- จะ
- กับ
- ทำงาน
- โลก
- ทั่วโลก
- การเขียน
- เขียน
- แซด
- ลมทะเล