ایپل نے OpenELM جاری کیا، جو قدرے زیادہ درست LLM ہے۔

ایپل نے OpenELM جاری کیا، جو قدرے زیادہ درست LLM ہے۔

ایپل نے OpenELM جاری کیا، جو قدرے زیادہ درست LLM PlatoBlockchain ڈیٹا انٹیلی جنس ہے۔ عمودی تلاش۔ عی

ایپل، جو عام طور پر اپنے کھلے پن کے لیے نہیں جانا جاتا ہے، نے OpenELM نامی ایک تخلیقی AI ماڈل جاری کیا ہے جو بظاہر عوامی ڈیٹا سیٹس پر تربیت یافتہ دیگر زبانوں کے ماڈلز کے ایک سیٹ کو پیچھے چھوڑ دیتا ہے۔

یہ بہت زیادہ نہیں ہے – کے مقابلے میں اولموجس کا آغاز فروری میں ہوا، اوپن ای ایل ایم 2.36x کم پری ٹریننگ ٹوکن استعمال کرتے ہوئے 2 فیصد زیادہ درست ہے۔ لیکن لوگوں کو یہ یاد دلانے کے لیے شاید کافی ہے کہ ایپل اب انڈسٹری AI ریو میں وال فلاور بننے پر راضی نہیں ہے۔

ایپل کا کھلے پن کا دعویٰ اس کے نہ صرف ماڈل بلکہ اس کی تربیت اور تشخیص کے فریم ورک کو جاری کرنے کے فیصلے سے آتا ہے۔

"پہلے طریقوں سے ہٹ کر جو صرف ماڈل وزن اور تخمینہ کوڈ فراہم کرتے ہیں، اور نجی ڈیٹاسیٹس پر پری ٹرین، ہماری ریلیز میں عوامی طور پر دستیاب ڈیٹاسیٹس پر لینگویج ماڈل کی تربیت اور تشخیص کے لیے مکمل فریم ورک شامل ہے، بشمول ٹریننگ لاگ، متعدد چیک پوائنٹس، اور پری -ٹریننگ کنفیگریشنز،" متعلقہ میں ایپل کے گیارہ محققین کی وضاحت کریں۔ تکنیکی کاغذ.

اور تعلیمی مشق سے ہٹ کر، مصنفین کے ای میل پتے درج نہیں ہیں۔ کھلے پن کی ایپل کی تشریح تک اسے چاک کریں، جس کا موازنہ کسی حد تک اوپن اے آئی سے کیا جا سکتا ہے۔

ساتھ والے سافٹ ویئر کی رہائی ایک تسلیم شدہ اوپن سورس لائسنس نہیں ہے۔ یہ غیر ضروری طور پر پابندی نہیں ہے، لیکن یہ واضح کرتا ہے کہ ایپل پیٹنٹ کا دعوی دائر کرنے کا حق محفوظ رکھتا ہے اگر OpenELM پر مبنی کسی بھی مشتق کام کو اس کے حقوق کی خلاف ورزی سمجھا جاتا ہے۔

OpenELM ٹرانسفارمر ماڈل میں پیرامیٹرز کو زیادہ مؤثر طریقے سے مختص کرنے کے لیے پرت وار اسکیلنگ نامی تکنیک کا استعمال کرتا ہے۔ لہذا ہر پرت کے پیرامیٹرز کا ایک ہی سیٹ رکھنے کی بجائے، OpenELM کی ٹرانسفارمر پرتوں میں مختلف کنفیگریشنز اور پیرامیٹرز ہوتے ہیں۔ نتیجہ بہتر ہے۔ درستگی, بینچ مارک ٹیسٹوں میں ماڈل سے درست پیشین گوئیوں کے فیصد میں دکھایا گیا ہے۔

ہمیں بتایا گیا ہے کہ اوپن ای ایل ایم کا استعمال کرتے ہوئے پہلے سے تربیت یافتہ تھا۔ لال پائجامہ GitHub سے ڈیٹاسیٹ، ایک ٹن کتابیں، ویکیپیڈیا، StackExchange پوسٹس، ArXiv پیپرز، اور بہت کچھ، اور بھرے Reddit، Wikibooks، Project Gutenberg، اور مزید سے سیٹ کریں۔ ماڈل کو آپ کی توقع کے مطابق استعمال کیا جا سکتا ہے: آپ اسے ایک اشارہ دیتے ہیں، اور یہ اسے جواب دینے یا اسے خودکار طور پر مکمل کرنے کی کوشش کرتا ہے۔

ریلیز کا ایک قابل ذکر پہلو یہ ہے کہ اس کے ساتھ "ایپل ڈیوائسز پر قیاس اور فائن ٹیوننگ کے لیے ماڈلز کو MLX لائبریری میں تبدیل کرنے کا کوڈ" بھی ہے۔

ایم ایل ایکس ایپل سلیکون پر مشین لرننگ چلانے کے لیے پچھلے سال جاری کردہ ایک فریم ورک ہے۔ نیٹ ورک کے بجائے Apple ڈیوائسز پر مقامی طور پر کام کرنے کی صلاحیت کو OpenELM کو ڈویلپرز کے لیے مزید دلچسپ بنانا چاہیے۔

"ایپل کی اوپن ای ایل ایم ریلیز AI کمیونٹی کے لیے ایک اہم پیشرفت کی نشاندہی کرتی ہے، جو موبائل ایپس اور محدود کمپیوٹنگ پاور کے ساتھ IoT ڈیوائسز کے لیے موثر، آن ڈیوائس AI پروسیسنگ مثالی پیش کرتی ہے،" شہر چن، AI سروس biz Aquant کے سی ای او اور شریک بانی نے بتایا۔ رجسٹر. "یہ سمارٹ فونز سے لے کر سمارٹ ہوم ڈیوائسز تک ہر چیز کے لیے فوری، مقامی فیصلہ سازی کو ضروری بناتا ہے، روزمرہ کی ٹیکنالوجی میں AI کی صلاحیت کو بڑھاتا ہے۔"

ایپل مشین لرننگ کے لیے اپنے آبائی چِپ فن تعمیر کی خوبیوں کو ظاہر کرنے کا خواہاں ہے، خاص طور پر ہارڈ ویئر میں اس وقت سے معاون ہے جب سے Cupertino نے اپنا متعارف کرایا۔ عصبی انجن 2017 میں۔ اس کے باوجود اوپن ای ایل ایم، جبکہ یہ درستگی کے معیارات پر زیادہ اسکور کر سکتا ہے، کارکردگی کے لحاظ سے کم آتا ہے۔

"اسی طرح کے پیرامیٹر کی گنتی کے لئے OpenELM کی اعلی درستگی کے باوجود، ہم دیکھتے ہیں کہ یہ OLMo سے سست ہے،" پیپر وضاحت کرتا ہے، لینکس پر Nvidia's CUDA کے ساتھ ساتھ Apple Silicon پر OpenELM کے MLX ورژن کا استعمال کرتے ہوئے چلائے جانے والے ٹیسٹوں کا حوالہ دیتے ہوئے

ایپل کے بوفنز کا کہنا ہے کہ فاتحانہ کارکردگی سے کم ہونے کی وجہ ان کا "بے ہودہ عمل" ہے۔ RMSNormمشین لرننگ میں ڈیٹا کو معمول پر لانے کی ایک تکنیک۔ مستقبل میں، وہ مزید بہتریاں تلاش کرنے کا ارادہ رکھتے ہیں۔

OpenELM 270 ملین، 450 ملین، 1.1 بلین اور 3 بلین پیرامیٹرز کے ساتھ پہلے سے تربیت یافتہ اور انسٹرکشن ٹیونڈ ماڈلز میں دستیاب ہے۔ اسے استعمال کرنے والوں کو متنبہ کیا جاتا ہے کہ وہ کسی بھی معنی خیز چیز کے لیے ماڈل کو آزمانے سے پہلے مستعدی سے کام لیں۔

"OpenELM ماڈلز کی ریلیز کا مقصد جدید ترین لینگویج ماڈلز تک رسائی فراہم کر کے اوپن ریسرچ کمیونٹی کو بااختیار بنانا اور ان کی افزودگی کرنا ہے،" پیپر کہتا ہے۔ "عوامی طور پر دستیاب ڈیٹا سیٹس پر تربیت یافتہ، یہ ماڈل بغیر کسی حفاظتی ضمانت کے دستیاب کرائے جاتے ہیں۔" ®

ٹائم اسٹیمپ:

سے زیادہ رجسٹر