Databricks แพลตฟอร์มการวิเคราะห์ได้เปิดตัวโมเดลภาษาขนาดใหญ่ที่เป็นรากฐานของโอเพ่นซอร์ส โดยหวังว่าองค์กรต่างๆ จะเลือกใช้เครื่องมือของตนเพื่อก้าวไปสู่กลุ่ม LLM
Biz ซึ่งก่อตั้งขึ้นรอบๆ Apache Spark ได้เผยแพร่เกณฑ์มาตรฐานจำนวนหนึ่งโดยอ้างว่า LLM อเนกประสงค์ซึ่งมีชื่อว่า DBRX เอาชนะคู่แข่งโอเพ่นซอร์สในด้านความเข้าใจภาษา การเขียนโปรแกรม และคณิตศาสตร์ นักพัฒนาซอฟต์แวร์ยังอ้างว่าสามารถเอาชนะ GPT-3.5 ที่เป็นกรรมสิทธิ์ของ OpenAI ได้ด้วยมาตรการเดียวกัน
DBRX ได้รับการพัฒนาโดย Mosaic AI ซึ่ง ได้รับ Databricks แล้ว ในราคา 1.3 พันล้านดอลลาร์ และฝึกฝนบน Nvidia DGX Cloud Databricks อ้างว่าได้ปรับ DBRX ให้มีประสิทธิภาพสูงสุดด้วยสิ่งที่เรียกว่าสถาปัตยกรรมแบบผสมผสานของผู้เชี่ยวชาญ (MoE) ซึ่งเครือข่ายผู้เชี่ยวชาญหรือผู้เรียนหลายรายแบ่งปัญหากัน
Databricks อธิบายว่าโมเดลนี้มีพารามิเตอร์ถึง 132 พันล้านพารามิเตอร์ แต่มีเพียง 36 พันล้านพารามิเตอร์เท่านั้นที่ใช้งานอยู่ในอินพุตใดอินพุตหนึ่ง
Joel Minnick รองประธานฝ่ายการตลาดของ Databricks กล่าว ลงทะเบียน: “นั่นคือเหตุผลสำคัญว่าทำไมโมเดลจึงสามารถทำงานได้อย่างมีประสิทธิภาพ แต่ก็ทำงานเร็วอย่างเห็นได้ชัดเช่นกัน ในทางปฏิบัติ หากคุณใช้แชทบอทหลักๆ ที่มีอยู่ในปัจจุบัน คุณอาจคุ้นเคยกับการรอและดูคำตอบที่เกิดขึ้น ด้วย DBRX มันแทบจะเกิดขึ้นทันที”
แต่ประสิทธิภาพของตัวแบบนั้นไม่ใช่ประเด็นสำหรับ Databricks ธุรกิจคือการทำให้ DBRX พร้อมใช้งาน ฟรีบน GitHub และ กอดหน้า.
Databricks หวังว่าลูกค้าจะใช้โมเดลนี้เป็นพื้นฐานสำหรับ LLM ของตนเอง หากเป็นเช่นนั้น อาจปรับปรุงแชทบอทของลูกค้าหรือการตอบคำถามภายใน ขณะเดียวกันก็แสดงให้เห็นว่า DBRX ถูกสร้างขึ้นโดยใช้เครื่องมือที่เป็นกรรมสิทธิ์ของ Databricks อย่างไร
Databricks รวบรวมชุดข้อมูลที่ DBRX ได้รับการพัฒนาโดยใช้สมุดบันทึก Apache Spark และ Databricks สำหรับการประมวลผลข้อมูล Unity Catalog สำหรับการจัดการข้อมูลและการกำกับดูแล และ MLflow สำหรับการติดตามการทดลอง
Minnick เปิดเผยว่าการลงทุนขององค์กรใน LLM ถูกล่าช้าเนื่องจากความกลัวเรื่องการเป็นเจ้าของและการกำกับดูแลของบุคคลที่สาม “ต้องย้ายข้อมูลออกไปยังบุคคลที่สาม ไม่มีการเป็นเจ้าของน้ำหนักแบบจำลอง ไม่สามารถควบคุมการกำกับดูแลข้อมูลตั้งแต่ต้นทางถึงปลายทางได้อย่างเต็มที่ สิ่งเหล่านี้คือสิ่งที่ทำให้พวกเขาช้าลง” เขาอธิบาย
“สิ่งที่เราตั้งใจจะสร้างคือ…โมเดลที่มีประสิทธิภาพอย่างยิ่ง ซึ่งองค์กรต่างๆ สามารถใช้เพื่อนำไปใช้และนำไปใช้กับแอปพลิเคชันของตนเองสำหรับกรณีการใช้งานเฉพาะของตนเองได้”
Hyoun Park ซีอีโอและหัวหน้านักวิเคราะห์ของ Amalgam Insights ตั้งข้อสังเกตถึงความสำคัญของ DBRX ก็คือ Databricks สามารถแสดงให้เห็นว่าแบบจำลองถูกสร้างขึ้นอย่างไรทีละขั้นตอน ซึ่งเป็นกระบวนการสำหรับองค์กรอื่นๆ ที่จะปฏิบัติตามและปรับแต่ง
“การผสมผสานระหว่างสายเลือด การมองเห็น ความสามารถในการทำซ้ำ และความเป็นเจ้าของโมเดลในการปรับแต่ง การทดสอบ และการปฏิบัติงานแบบ end-to-end เป็นสิ่งสำคัญ”
Park ตั้งข้อสังเกตว่าเขาเข้าใจว่า Databricks ได้สร้างโมเดลแบบกำหนดเองให้กับลูกค้าแล้วมากกว่า 50,000 โมเดล “การผสมผสานระหว่างประสบการณ์การสร้างโมเดลและความสามารถในการดำเนินการในวงกว้างด้วยโมเดลที่มีประสิทธิภาพสูง เทียบเท่ากับความพยายามส่วนตัวและโอเพ่นซอร์สที่ดีที่สุด ซึ่งทำให้การประกาศนี้โดดเด่นสำหรับฉันจากมุมมองด้านไอทีระดับองค์กร”
ข่าว DBRX เล่นกับฉากหลังการแข่งขันที่เปลี่ยนแปลงไปสำหรับ Databricks ธุรกิจนี้มีความร่วมมือเชิงกลยุทธ์ระยะยาวกับ Microsoft ซึ่งส่งผลให้เกิด Azure Databricks ซึ่งผู้ใช้จะได้รับสัญญาว่าจะให้บริการข้อมูลแบบบูรณาการที่เชื่อมโยงอย่างใกล้ชิดกับแพลตฟอร์มคลาวด์ของ Redmond ยักษ์ใหญ่
แต่นับตั้งแต่ข้อเสนอเปิดตัวในปี 2017 Microsoft ได้ย้ายเข้าสู่ตลาด Lakehouse ของ Databricks ซึ่งผู้ใช้จะได้รับคลังข้อมูลและ Data Lake ในสภาพแวดล้อมเดียว และให้คำมั่นสัญญากับผู้ใช้ LLM ระดับองค์กรด้วย มันมีมูลค่า 10 พันล้านดอลลาร์ ความร่วมมือของ OpenAI ในสภาพแวดล้อมของ Fabric ไมโครซอฟต์ยังสามารถนำเสนอ “การมิเรอร์” จากระบบฐานข้อมูลธุรกรรม Azure Cosmos DB และ Azure SQL DB ให้การเข้าถึงบริการการวิเคราะห์โดยไม่ต้องย้ายข้อมูล
คำถามปลายเปิดที่แขวนอยู่เหนือกลยุทธ์ของทั้ง Databricks และ Microsoft คือเมื่อใดที่การลงทุนที่คาดหวังในเทคโนโลยี LLM จำนวนมากจะมาถึง ในเดือนมกราคม การ์ตเนอร์ทำนาย การใช้จ่ายด้านเทคโนโลยีขององค์กรจะไม่เกิดขึ้นในปีนี้ และจะส่งผลกระทบเพียงเล็กน้อยต่อการลงทุนด้านไอทีอื่นๆ
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://go.theregister.com/feed/www.theregister.com/2024/03/28/databricks_dbrx_llm/
- :มี
- :เป็น
- :ไม่
- :ที่ไหน
- $ ขึ้น
- 000
- 2017
- 36
- 50
- 7
- a
- ความสามารถ
- สามารถ
- เข้า
- ข้าม
- คล่องแคล่ว
- หลังจาก
- กับ
- AI
- ทั้งหมด
- แล้ว
- ด้วย
- an
- นักวิเคราะห์
- การวิเคราะห์
- และ
- การประกาศ
- คำตอบ
- ตอบ
- ใด
- อาปาเช่
- การใช้งาน
- สถาปัตยกรรม
- เป็น
- รอบ
- AS
- At
- ใช้ได้
- สีฟ้า
- ฉากหลัง
- รากฐาน
- BE
- ชนะ
- กำลัง
- มาตรฐาน
- ที่ดีที่สุด
- ใหญ่
- พันล้าน
- Biz
- ทั้งสอง
- นำมาซึ่ง
- สร้าง
- การก่อสร้าง
- สร้าง
- แต่
- by
- โทร
- CAN
- กรณี
- แค็ตตาล็อก
- ผู้บริหารสูงสุด
- เปลี่ยนแปลง
- chatbots
- หัวหน้า
- อ้างว่า
- อ้าง
- การเรียกร้อง
- ลูกค้า
- อย่างใกล้ชิด
- เมฆ
- แพลตฟอร์มคลาวด์
- CO
- การผสมผสาน
- มา
- การแข่งขัน
- ควบคุม
- จักรวาล
- ประเพณี
- ลูกค้า
- ลูกค้า
- ข้อมูล
- การจัดการข้อมูล
- การประมวลผล
- ฐานข้อมูล
- ล่าช้า
- พัฒนา
- ผู้พัฒนา
- แบ่ง
- do
- ทำ
- ลง
- ขนานนามว่า
- อย่างมีประสิทธิภาพ
- ที่มีประสิทธิภาพ
- อย่างมีประสิทธิภาพ
- ความพยายาม
- จบสิ้น
- Enterprise
- ระดับองค์กร
- ผู้ประกอบการ
- สิ่งแวดล้อม
- ที่คาดหวัง
- ประสบการณ์
- การทดลอง
- ชำนาญ
- อธิบาย
- อย่างยิ่ง
- ผ้า
- FAST
- ความกลัว
- ปลาย
- น้ำท่วม
- ปฏิบัติตาม
- สำหรับ
- พื้นฐาน
- ก่อตั้งขึ้นเมื่อ
- ราคาเริ่มต้นที่
- อย่างเต็มที่
- จุดประสงค์ทั่วไป
- สร้าง
- ได้รับ
- ยักษ์
- Go
- ไป
- การกำกับดูแล
- มี
- ที่เกิดขึ้น
- มี
- มี
- he
- จุดสูง
- หวัง
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- HTTPS
- if
- ส่งผลกระทบ
- สำคัญ
- ปรับปรุง
- in
- อินพุต
- ข้อมูลเชิงลึก
- แบบบูรณาการ
- ภายใน
- เข้าไป
- การลงทุน
- IT
- ITS
- ตัวเอง
- มกราคม
- jpg
- กระโดด
- ชนิด
- ชล
- ภาษา
- ใหญ่
- เปิดตัว
- ผู้เรียน
- เชื้อสาย
- น้อย
- LLM
- ระยะยาว
- สำคัญ
- ทำให้
- การทำ
- การจัดการ
- ตลาด
- การตลาด
- คณิตศาสตร์
- me
- มาตรการ
- ไมโครซอฟท์
- อาจ
- มิเรอร์
- แบบ
- โมเดล
- ย้าย
- ย้าย
- การย้าย
- หลาย
- ใกล้
- เครือข่าย
- ข่าว
- โดดเด่น
- เด่น
- Nvidia
- of
- เสนอ
- เสนอ
- การเสนอ
- on
- ONE
- เพียง
- เปิด
- โอเพนซอร์ส
- OpenAI
- เลือก
- การปรับให้เหมาะสม
- or
- อื่นๆ
- ออก
- เกิน
- ของตนเอง
- การเป็นเจ้าของ
- พารามิเตอร์
- สวนสาธารณะ
- คู่กรณี
- พาร์ทเนอร์
- การปฏิบัติ
- ที่มีประสิทธิภาพ
- มุมมอง
- เวที
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- เล่น
- จุด
- ครอบครอง
- ประยุกต์
- ประธาน
- ส่วนตัว
- อาจ
- ปัญหา
- กระบวนการ
- การประมวลผล
- การเขียนโปรแกรม
- สัญญา
- สัญญา
- เป็นเจ้าของ
- การตีพิมพ์
- ใส่
- คำถาม
- RE
- เหตุผล
- เปิดเผย
- คู่แข่ง
- วิ่ง
- ทำงาน
- s
- เดียวกัน
- ขนาด
- บริการ
- ชุด
- โชว์
- การแสดง
- ความสำคัญ
- ตั้งแต่
- ช้า
- แหล่ง
- จุดประกาย
- โดยเฉพาะ
- การใช้จ่าย
- ยุทธศาสตร์
- หุ้นส่วนเชิงกลยุทธ์
- กลยุทธ์
- ระบบ
- เทคโนโลยี
- เทคโนโลยี
- เงื่อนไขการใช้บริการ
- การทดสอบ
- ที่
- พื้นที่
- ของพวกเขา
- พวกเขา
- ที่นั่น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- สิ่ง
- ที่สาม
- บุคคลที่สาม
- ของบุคคลที่สาม
- นี้
- ในปีนี้
- ผูก
- ไปยัง
- ในวันนี้
- ร่วมกัน
- บอก
- เครื่องมือ
- การติดตาม
- ผ่านการฝึกอบรม
- ธุรกรรม
- ปรับแต่ง
- จูน
- ความเข้าใจ
- เข้าใจ
- เอกภาพ
- ใช้
- มือสอง
- ผู้ใช้
- การใช้
- รอง
- Vice President
- ความชัดเจน
- ที่รอ
- คือ
- ชม
- we
- อะไร
- เมื่อ
- ที่
- ในขณะที่
- ทำไม
- จะ
- กับ
- ไม่มี
- วอน
- จะ
- ปี
- คุณ
- ลมทะเล