یہ الٹرا لائٹ اے آئی ماڈل آپ کے فون پر فٹ بیٹھتا ہے اور چیٹ جی پی ٹی کو شکست دے سکتا ہے

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

مائیکروسافٹ آج دعوی کیا کہ اس نے "سب سے زیادہ قابل اور کم لاگت کے چھوٹے لینگویج ماڈلز (SLMs) دستیاب ہیں" جاری کیے ہیں۔ Phi-3- اس کا تیسرا تکرار سمال لینگویج ماڈلز کا فائی فیملی (SLMs) — تقابلی سائز کے ماڈلز اور کچھ بڑے ماڈلز کو پیچھے چھوڑتا ہے۔

ایک چھوٹی زبان کا ماڈل (SLM) AI ماڈل کی ایک قسم ہے جو مخصوص زبان سے متعلق کاموں کو انجام دینے میں انتہائی موثر ہونے کے لیے ڈیزائن کیا گیا ہے۔ بڑے لینگویج ماڈلز (LLMs) کے برعکس، جو عام کاموں کی ایک وسیع رینج کے لیے موزوں ہیں، SLMs کو ایک چھوٹے ڈیٹا سیٹ پر بنایا گیا ہے تاکہ انہیں مخصوص استعمال کے معاملات کے لیے زیادہ موثر اور لاگت سے موثر بنایا جا سکے۔

مائیکروسافٹ نے وضاحت کی کہ Phi-3 مختلف ورژنز میں آتا ہے، جس میں سب سے چھوٹا Phi-3 Mini ہے، 3.8 بلین پیرامیٹر ماڈل 3.3 ٹریلین ٹوکنز پر تربیت یافتہ ہے۔ اس کے نسبتاً چھوٹے سائز کے باوجود—Llama-3 کے کارپس کا وزن زیادہ ہے۔ 15 ٹریلین ڈیٹا کے ٹوکن—Phi-3 Mini اب بھی سیاق و سباق کے 128K ٹوکن ہینڈل کرنے کے قابل ہے۔ یہ اسے GPT-4 سے موازنہ کرتا ہے اور ٹوکن کی گنجائش کے لحاظ سے Llama-3 اور Mistral Large کو مات دیتا ہے۔

دوسرے لفظوں میں، AI behemoths جیسے Llama-3 on Meta.ai اور Mistral Large ایک طویل بات چیت کے بعد ٹوٹ سکتے ہیں یا اس ہلکے وزن والے ماڈل کے جدوجہد شروع ہونے سے پہلے اچھی طرح سے فوری طور پر ٹوٹ سکتے ہیں۔

Phi-3 Mini کے سب سے اہم فوائد میں سے ایک عام اسمارٹ فون پر فٹ ہونے اور چلانے کی صلاحیت ہے۔ مائیکروسافٹ نے آئی فون 14 پر ماڈل کا تجربہ کیا، اور یہ بغیر کسی مسئلے کے چلایا، جس سے فی سیکنڈ 14 ٹوکن پیدا ہوئے۔ Phi-3 Mini چلانے کے لیے صرف 1.8GB VRAM کی ضرورت ہوتی ہے، جو اسے زیادہ توجہ مرکوز کرنے والے صارفین کے لیے ایک ہلکا پھلکا اور موثر متبادل بناتا ہے۔

یہ الٹرا لائٹ AI ماڈل آپ کے فون پر فٹ بیٹھتا ہے اور ChatGPT کو شکست دے سکتا ہے - Decrypt PlatoBlockchain Data Intelligence. عمودی تلاش۔ عی

اگرچہ Phi-3 Mini اعلی درجے کے کوڈرز یا وسیع ضروریات والے لوگوں کے لیے موزوں نہیں ہو سکتا، لیکن یہ مخصوص ضروریات کے حامل صارفین کے لیے ایک مؤثر متبادل ہو سکتا ہے۔ مثال کے طور پر، ایسے سٹارٹ اپ جن کو چیٹ بوٹ کی ضرورت ہوتی ہے یا ڈیٹا کے تجزیہ کے لیے LLM کا فائدہ اٹھانے والے لوگ Phi-3 Mini کو ڈیٹا آرگنائزیشن، معلومات نکالنے، ریاضی کے استدلال کرنے، اور بلڈنگ ایجنٹس جیسے کاموں کے لیے استعمال کر سکتے ہیں۔ اگر ماڈل کو انٹرنیٹ تک رسائی دی جاتی ہے، تو یہ کافی طاقتور بن سکتا ہے، اصل وقت کی معلومات کے ساتھ اس کی صلاحیتوں کی کمی کو پورا کرتا ہے۔

Phi-3 Mini نے اپنے ڈیٹاسیٹ کو ممکنہ حد تک مفید معلومات کے ساتھ تیار کرنے پر مائیکروسافٹ کی توجہ کی وجہ سے اعلیٰ ٹیسٹ اسکور حاصل کیے ہیں۔ وسیع تر Phi خاندان، درحقیقت، ایسے کاموں کے لیے اچھا نہیں ہے جن کے لیے حقائق سے متعلق علم کی ضرورت ہوتی ہے، لیکن اعلیٰ استدلال کی مہارتیں انھیں بڑے حریفوں سے اوپر رکھتی ہیں۔ Phi-3 میڈیم (ایک 14-بلین پیرامیٹر ماڈل) مسلسل طاقتور LLMs جیسے GPT-3.5 کو ہرا دیتا ہے — جو LLM ChatGPT کے مفت ورژن کو طاقت دیتا ہے— اور Mini ورژن زیادہ تر مصنوعی بینچ مارکس میں Mixtral-8x7B جیسے طاقتور ماڈلز کو مات دیتا ہے۔

تاہم، یہ بات قابل توجہ ہے کہ Phi-3 اپنے پیشرو Phi-2 کی طرح اوپن سورس نہیں ہے۔ اس کے بجائے، یہ ایک ہے کھلا ماڈل، یعنی یہ قابل رسائی اور استعمال کے لیے دستیاب ہے، لیکن اس کے پاس Phi-2 جیسا اوپن سورس لائسنس نہیں ہے، جو وسیع تر استعمال اور تجارتی ایپلی کیشنز کی اجازت دیتا ہے۔

آنے والے ہفتوں میں، مائیکروسافٹ نے کہا کہ وہ Phi-3 فیملی میں مزید ماڈلز جاری کرے گا، بشمول Phi-3 سمال (7 بلین پیرامیٹرز) اور مذکورہ بالا Phi-3 میڈیم۔

مائیکروسافٹ نے Phi-3 Mini کو Azure AI Studio، Hugging Face، اور Ollama پر دستیاب کرایا ہے۔ یہ ماڈل ہدایات کے مطابق بنایا گیا ہے اور ONNX رن ٹائم کے لیے Windows DirectML کے ساتھ ساتھ مختلف GPU، CPU، اور یہاں تک کہ موبائل ہارڈ ویئر میں بھی کراس پلیٹ فارم سپورٹ کے لیے موزوں ہے۔