Databricks อ้างว่า LLM โอเพ่นซอร์สของตนเหนือกว่า GPT-3.5

Databricks อ้างว่า LLM โอเพ่นซอร์สของตนเหนือกว่า GPT-3.5

Databricks อ้างว่า LLM โอเพ่นซอร์สของตนเหนือกว่า GPT-3.5 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

Databricks แพลตฟอร์มการวิเคราะห์ได้เปิดตัวโมเดลภาษาขนาดใหญ่ที่เป็นรากฐานของโอเพ่นซอร์ส โดยหวังว่าองค์กรต่างๆ จะเลือกใช้เครื่องมือของตนเพื่อก้าวไปสู่กลุ่ม LLM

Biz ซึ่งก่อตั้งขึ้นรอบๆ Apache Spark ได้เผยแพร่เกณฑ์มาตรฐานจำนวนหนึ่งโดยอ้างว่า LLM อเนกประสงค์ซึ่งมีชื่อว่า DBRX เอาชนะคู่แข่งโอเพ่นซอร์สในด้านความเข้าใจภาษา การเขียนโปรแกรม และคณิตศาสตร์ นักพัฒนาซอฟต์แวร์ยังอ้างว่าสามารถเอาชนะ GPT-3.5 ที่เป็นกรรมสิทธิ์ของ OpenAI ได้ด้วยมาตรการเดียวกัน

DBRX ได้รับการพัฒนาโดย Mosaic AI ซึ่ง ได้รับ Databricks แล้ว ในราคา 1.3 พันล้านดอลลาร์ และฝึกฝนบน Nvidia DGX Cloud Databricks อ้างว่าได้ปรับ DBRX ให้มีประสิทธิภาพสูงสุดด้วยสิ่งที่เรียกว่าสถาปัตยกรรมแบบผสมผสานของผู้เชี่ยวชาญ (MoE) ซึ่งเครือข่ายผู้เชี่ยวชาญหรือผู้เรียนหลายรายแบ่งปัญหากัน

Databricks อธิบายว่าโมเดลนี้มีพารามิเตอร์ถึง 132 พันล้านพารามิเตอร์ แต่มีเพียง 36 พันล้านพารามิเตอร์เท่านั้นที่ใช้งานอยู่ในอินพุตใดอินพุตหนึ่ง

Joel Minnick รองประธานฝ่ายการตลาดของ Databricks กล่าว ลงทะเบียน: “นั่นคือเหตุผลสำคัญว่าทำไมโมเดลจึงสามารถทำงานได้อย่างมีประสิทธิภาพ แต่ก็ทำงานเร็วอย่างเห็นได้ชัดเช่นกัน ในทางปฏิบัติ หากคุณใช้แชทบอทหลักๆ ที่มีอยู่ในปัจจุบัน คุณอาจคุ้นเคยกับการรอและดูคำตอบที่เกิดขึ้น ด้วย DBRX มันแทบจะเกิดขึ้นทันที”

แต่ประสิทธิภาพของตัวแบบนั้นไม่ใช่ประเด็นสำหรับ Databricks ธุรกิจคือการทำให้ DBRX พร้อมใช้งาน ฟรีบน GitHub และ กอดหน้า.

Databricks หวังว่าลูกค้าจะใช้โมเดลนี้เป็นพื้นฐานสำหรับ LLM ของตนเอง หากเป็นเช่นนั้น อาจปรับปรุงแชทบอทของลูกค้าหรือการตอบคำถามภายใน ขณะเดียวกันก็แสดงให้เห็นว่า DBRX ถูกสร้างขึ้นโดยใช้เครื่องมือที่เป็นกรรมสิทธิ์ของ Databricks อย่างไร

Databricks รวบรวมชุดข้อมูลที่ DBRX ได้รับการพัฒนาโดยใช้สมุดบันทึก Apache Spark และ Databricks สำหรับการประมวลผลข้อมูล Unity Catalog สำหรับการจัดการข้อมูลและการกำกับดูแล และ MLflow สำหรับการติดตามการทดลอง

Minnick เปิดเผยว่าการลงทุนขององค์กรใน LLM ถูกล่าช้าเนื่องจากความกลัวเรื่องการเป็นเจ้าของและการกำกับดูแลของบุคคลที่สาม “ต้องย้ายข้อมูลออกไปยังบุคคลที่สาม ไม่มีการเป็นเจ้าของน้ำหนักแบบจำลอง ไม่สามารถควบคุมการกำกับดูแลข้อมูลตั้งแต่ต้นทางถึงปลายทางได้อย่างเต็มที่ สิ่งเหล่านี้คือสิ่งที่ทำให้พวกเขาช้าลง” เขาอธิบาย

“สิ่งที่เราตั้งใจจะสร้างคือ…โมเดลที่มีประสิทธิภาพอย่างยิ่ง ซึ่งองค์กรต่างๆ สามารถใช้เพื่อนำไปใช้และนำไปใช้กับแอปพลิเคชันของตนเองสำหรับกรณีการใช้งานเฉพาะของตนเองได้”

Hyoun Park ซีอีโอและหัวหน้านักวิเคราะห์ของ Amalgam Insights ตั้งข้อสังเกตถึงความสำคัญของ DBRX ก็คือ Databricks สามารถแสดงให้เห็นว่าแบบจำลองถูกสร้างขึ้นอย่างไรทีละขั้นตอน ซึ่งเป็นกระบวนการสำหรับองค์กรอื่นๆ ที่จะปฏิบัติตามและปรับแต่ง

“การผสมผสานระหว่างสายเลือด การมองเห็น ความสามารถในการทำซ้ำ และความเป็นเจ้าของโมเดลในการปรับแต่ง การทดสอบ และการปฏิบัติงานแบบ end-to-end เป็นสิ่งสำคัญ”

Park ตั้งข้อสังเกตว่าเขาเข้าใจว่า Databricks ได้สร้างโมเดลแบบกำหนดเองให้กับลูกค้าแล้วมากกว่า 50,000 โมเดล “การผสมผสานระหว่างประสบการณ์การสร้างโมเดลและความสามารถในการดำเนินการในวงกว้างด้วยโมเดลที่มีประสิทธิภาพสูง เทียบเท่ากับความพยายามส่วนตัวและโอเพ่นซอร์สที่ดีที่สุด ซึ่งทำให้การประกาศนี้โดดเด่นสำหรับฉันจากมุมมองด้านไอทีระดับองค์กร”

ข่าว DBRX เล่นกับฉากหลังการแข่งขันที่เปลี่ยนแปลงไปสำหรับ Databricks ธุรกิจนี้มีความร่วมมือเชิงกลยุทธ์ระยะยาวกับ Microsoft ซึ่งส่งผลให้เกิด Azure Databricks ซึ่งผู้ใช้จะได้รับสัญญาว่าจะให้บริการข้อมูลแบบบูรณาการที่เชื่อมโยงอย่างใกล้ชิดกับแพลตฟอร์มคลาวด์ของ Redmond ยักษ์ใหญ่

แต่นับตั้งแต่ข้อเสนอเปิดตัวในปี 2017 Microsoft ได้ย้ายเข้าสู่ตลาด Lakehouse ของ Databricks ซึ่งผู้ใช้จะได้รับคลังข้อมูลและ Data Lake ในสภาพแวดล้อมเดียว และให้คำมั่นสัญญากับผู้ใช้ LLM ระดับองค์กรด้วย มันมีมูลค่า 10 พันล้านดอลลาร์ ความร่วมมือของ OpenAI ในสภาพแวดล้อมของ Fabric ไมโครซอฟต์ยังสามารถนำเสนอ “การมิเรอร์” จากระบบฐานข้อมูลธุรกรรม Azure Cosmos DB และ Azure SQL DB ให้การเข้าถึงบริการการวิเคราะห์โดยไม่ต้องย้ายข้อมูล

คำถามปลายเปิดที่แขวนอยู่เหนือกลยุทธ์ของทั้ง Databricks และ Microsoft คือเมื่อใดที่การลงทุนที่คาดหวังในเทคโนโลยี LLM จำนวนมากจะมาถึง ในเดือนมกราคม การ์ตเนอร์ทำนาย การใช้จ่ายด้านเทคโนโลยีขององค์กรจะไม่เกิดขึ้นในปีนี้ และจะส่งผลกระทบเพียงเล็กน้อยต่อการลงทุนด้านไอทีอื่นๆ

ประทับเวลา:

เพิ่มเติมจาก ลงทะเบียน