ڈیٹابرکس کا دعویٰ ہے کہ اس کا اوپن سورس LLM GPT-3.5 کو پیچھے چھوڑ دیتا ہے۔

ڈیٹابرکس کا دعویٰ ہے کہ اس کا اوپن سورس LLM GPT-3.5 کو پیچھے چھوڑ دیتا ہے۔

ڈیٹابرکس کا دعویٰ ہے کہ اس کا اوپن سورس LLM GPT-3.5 PlatoBlockchain ڈیٹا انٹیلی جنس کو پیچھے چھوڑ دیتا ہے۔ عمودی تلاش۔ عی

تجزیاتی پلیٹ فارم ڈیٹابرکس نے ایک اوپن سورس فاؤنڈیشنل لارج لینگوئج ماڈل کا آغاز کیا ہے، امید ہے کہ انٹرپرائزز LLM بینڈ ویگن پر کودنے کے لیے اس کے ٹولز کو استعمال کرنے کا انتخاب کریں گے۔

اپاچی اسپارک کے آس پاس قائم کردہ بز نے اپنے عمومی مقصد والے LLM - جسے DBRX ڈب کیا گیا - نے زبان کی تفہیم، پروگرامنگ اور ریاضی پر اوپن سورس حریفوں کو مات دینے کا دعویٰ کرتے ہوئے متعدد بینچ مارکس شائع کیے۔ ڈویلپر نے یہ بھی دعویٰ کیا کہ اس نے OpenAI کی ملکیتی GPT-3.5 کو انہی اقدامات میں شکست دی۔

ڈی بی آر ایکس کو موزیک اے آئی نے تیار کیا تھا۔ ڈیٹا برکس حاصل کیے گئے۔ $1.3 بلین میں، اور Nvidia DGX Cloud پر تربیت یافتہ۔ ڈیٹابرکس کا دعویٰ ہے کہ اس نے ڈی بی آر ایکس کو کارکردگی کے لیے بہتر بنایا جس کو یہ ماہرین کا مرکب (MoE) فن تعمیر کہتے ہیں – جہاں متعدد ماہر نیٹ ورکس یا سیکھنے والے ایک مسئلہ کو تقسیم کرتے ہیں۔

ڈیٹابرکس نے وضاحت کی کہ ماڈل میں 132 بلین پیرامیٹرز ہیں، لیکن کسی ایک ان پٹ پر صرف 36 بلین فعال ہیں۔

ڈیٹابرکس مارکیٹنگ کے نائب صدر جوئل مننک نے بتایا رجسٹر: "یہ ایک بڑی وجہ ہے کہ ماڈل اتنی ہی مؤثر طریقے سے چلانے کے قابل ہے جیسا کہ یہ کرتا ہے، لیکن یہ بھی بہت تیزی سے چلتا ہے۔ عملی اصطلاحات میں، اگر آپ کسی بھی قسم کے بڑے چیٹ بوٹس کا استعمال کرتے ہیں جو آج وہاں موجود ہیں، تو آپ شاید انتظار کرنے اور جواب کو تیار ہوتے دیکھنے کے عادی ہیں۔ DBRX کے ساتھ یہ فوری طور پر قریب ہے۔

لیکن ماڈل کی کارکردگی خود ڈیٹابرکس کے لیے اہم نہیں ہے۔ بِز، بہر حال، DBRX کے لیے دستیاب ہے۔ GitHub پر مفت اور گلے لگانے والا چہرہ.

Databricks امید کر رہا ہے کہ صارفین اس ماڈل کو اپنے LLMs کی بنیاد کے طور پر استعمال کریں۔ اگر ایسا ہوتا ہے تو یہ کسٹمر کے چیٹ بوٹس یا اندرونی سوالوں کے جوابات کو بہتر بنا سکتا ہے، جبکہ یہ بھی دکھاتا ہے کہ ڈیٹابرکس کے ملکیتی ٹولز کا استعمال کرتے ہوئے ڈی بی آر ایکس کیسے بنایا گیا تھا۔

Databricks نے ڈیٹاسیٹ کو اکٹھا کیا جس سے DBRX کو ڈیٹا پروسیسنگ کے لیے Apache Spark اور Databricks نوٹ بکس، ڈیٹا مینجمنٹ اور گورننس کے لیے Unity Catalog، اور MLflow تجرباتی ٹریکنگ کے لیے تیار کیا گیا تھا۔

منک نے انکشاف کیا کہ LLMs میں انٹرپرائز کی سرمایہ کاری تیسرے فریق کی ملکیت اور حکمرانی کے خدشات کی وجہ سے تاخیر کا شکار ہوئی۔ "ڈیٹا کو تھرڈ پارٹیز کو منتقل کرنا، ماڈل کے وزن پر ملکیت نہ ہونا، ڈیٹا کے اینڈ ٹو اینڈ تک گورننس کو مکمل طور پر کنٹرول کرنے کے قابل نہ ہونا - یہ وہ چیزیں ہیں جو انہیں سست کرتی ہیں،" انہوں نے وضاحت کی۔

"ہم نے جس چیز کو بنانے کا ارادہ کیا وہ ایک انتہائی موثر … ماڈل تھا جسے انٹرپرائزز اپنے مخصوص استعمال کے کیسز کے لیے اپنی ایپلی کیشنز پر جانے اور لانے کے لیے استعمال کر سکتے ہیں۔"

املگام انسائٹس کے سی ای او اور چیف تجزیہ کار ہیون پارک نے ڈی بی آر ایکس کی اہمیت کا مشاہدہ کیا کہ ڈیٹابرکس یہ دکھا سکتا ہے کہ ماڈل کو کس طرح بنایا گیا تھا، مرحلہ وار، ایک عمل کے طور پر دوسرے انٹرپرائزز کو اس کی پیروی کرنے اور ٹھیک ٹیون کرنے کے لیے۔

"آخری سے آخر تک ماڈل ٹیوننگ، ٹیسٹنگ، اور آپریشنلائزیشن میں نسب، مرئیت، تکرار کی اہلیت، اور ماڈل کی ملکیت کا وہ امتزاج اہم ہے۔"

پارک نے نوٹ کیا کہ وہ سمجھتا ہے کہ ڈیٹابرکس نے پہلے ہی کلائنٹس کے لیے 50,000 سے زیادہ کسٹم ماڈل بنائے ہیں۔ "یہ ماڈل بنانے کے تجربے اور بہترین پرائیویٹ اور اوپن سورس کوششوں کے برابر اعلیٰ کارکردگی کا مظاہرہ کرنے والے ماڈل کے ساتھ بڑے پیمانے پر کرنے کی صلاحیت کا وہ امتزاج ہے جو اس اعلان کو میرے لیے انٹرپرائز IT کے نقطہ نظر سے قابل ذکر بناتا ہے۔"

DBRX خبریں ڈیٹابرکس کے بدلتے ہوئے مسابقتی پس منظر کے خلاف چلتی ہیں۔ بِز کی مائیکروسافٹ کے ساتھ ایک طویل المدتی تزویراتی شراکت داری ہے، جس کا نتیجہ Azure Databricks کی صورت میں نکلا ہے – جس میں صارفین کو ریڈمنڈ جائنٹ کے کلاؤڈ پلیٹ فارم کے ساتھ مربوط ڈیٹا سروسز کا وعدہ کیا جاتا ہے۔

لیکن 2017 میں شروع ہونے والی پیشکش کے بعد سے، مائیکروسافٹ ڈیٹابرکس کی لیک ہاؤس مارکیٹ میں چلا گیا ہے – جہاں صارفین کو ایک ہی ماحول میں ڈیٹا ویئر ہاؤسنگ اور ڈیٹا لیکس کی پیشکش کی جاتی ہے – اور صارفین کو انٹرپرائز گریڈ ایل ایل ایم کے ساتھ وعدہ کرتا ہے۔ اس کے 10 بلین ڈالر اوپن اے آئی پارٹنرشپ۔ اس کے تانے بانے کے ماحول میں، مائیکروسافٹ بھی پیش کر سکتا ہے۔ اس کے ٹرانزیکشنل ڈیٹا بیس سسٹمز Azure Cosmos DB اور Azure SQL DB سے "عکس"، ڈیٹا منتقل کیے بغیر تجزیاتی خدمات تک رسائی کی پیشکش کرتا ہے۔

ڈیٹابرکس اور مائیکروسافٹ دونوں کی حکمت عملیوں پر ایک کھلا سوال یہ ہے کہ ایل ایل ایم ٹیکنالوجیز میں متوقع سرمایہ کاری کا سیلاب کب آنے والا ہے۔ جنوری میں، گارٹنر نے پیش گوئی کی ٹیکنالوجی پر انٹرپرائز کے اخراجات اس سال نہیں آئیں گے، اور دیگر آئی ٹی سرمایہ کاری پر اس کا بہت کم اثر پڑے گا۔ ®

ٹائم اسٹیمپ:

سے زیادہ رجسٹر