جب چھوٹے AI چیٹ بوٹس کے گروہ چیٹ جی پی ٹی جیسے جنات سے زیادہ کارآمد ہوتے ہیں۔

جب چھوٹے AI چیٹ بوٹس کے گروہ چیٹ جی پی ٹی جیسے جنات سے زیادہ کارآمد ہوتے ہیں۔

When Hordes of Little AI Chatbots Are More Useful Than Giants Like ChatGPT PlatoBlockchain Data Intelligence. Vertical Search. Ai.

AI تیزی سے ترقی کر رہا ہے۔ ChatGPT بن گیا ہے۔ سب سے تیزی سے بڑھتی ہوئی آن لائن سروس تاریخ میں. گوگل اور مائیکروسافٹ جنریٹیو اے آئی کو اپنی مصنوعات میں ضم کر رہے ہیں۔ اور عالمی رہنما جوش و خروش سے AI کو معاشی ترقی کے ایک آلے کے طور پر اپنا رہے ہیں۔

جیسا کہ ہم ChatGPT اور Bard سے آگے بڑھتے ہیں، ہمیں امکان ہے کہ AI چیٹ بوٹس کم عام اور زیادہ ماہر ہوتے ہیں۔ AIs ان اعداد و شمار کے ذریعہ محدود ہیں جن کے سامنے وہ سامنے آتے ہیں تاکہ وہ جو کچھ کرتے ہیں اس میں انہیں بہتر بنایا جاسکے — اس معاملے میں، انسانی تقریر کی نقل کرنا اور صارفین کو مفید جوابات فراہم کرنا۔

تربیت اکثر نیٹ وسیع ڈالتا ہے، کے ساتھ ہزاروں کتابوں اور ویب صفحات کو جذب کرنے والے AI سسٹمز. لیکن تربیتی ڈیٹا کا ایک زیادہ منتخب، فوکسڈ سیٹ AI چیٹ بوٹس کو خاص صنعتوں میں کام کرنے والے یا مخصوص علاقوں میں رہنے والے لوگوں کے لیے اور بھی مفید بنا سکتا ہے۔

ڈیٹا کی قدر

اس ارتقاء کا ایک اہم عنصر اعلی درجے کے بڑے لینگوئج ماڈلز (LLMs) کے لیے تربیتی ڈیٹا اکٹھا کرنے کے بڑھتے ہوئے اخراجات ہوں گے، AI کی قسم جو ChatGPT کو طاقت دیتی ہے۔ کمپنیاں جانتی ہیں کہ ڈیٹا قیمتی ہے: میٹا اور گوگل صارف کے ڈیٹا سے ہدف بنائے گئے اشتہارات بیچ کر اربوں کماتے ہیں۔ لیکن ڈیٹا کی قدر اب ہے۔ تبدیل کرنے. میٹا اور گوگل ڈیٹا "بصیرت" فروخت کرتے ہیں۔ وہ بہت سے ڈیٹا پوائنٹس کو صارفین کے بارے میں پیشین گوئیوں میں تبدیل کرنے کے لیے تجزیات میں سرمایہ کاری کرتے ہیں۔

ڈیٹا بالکل مختلف انداز میں OpenAI — ChatGPT کے ڈویلپر کے لیے قیمتی ہے۔ ایک ٹویٹ کا تصور کریں: "بلی چٹائی پر بیٹھ گئی۔" یہ ٹویٹ ٹارگٹڈ ایڈورٹائزرز کے لیے قابل قدر نہیں ہے۔ یہ صارف یا ان کی دلچسپیوں کے بارے میں بہت کم کہتا ہے۔ ہو سکتا ہے، ایک دھکے پر، یہ بلی کے کھانے اور ڈاکٹر سوس میں دلچسپی کا مشورہ دے سکتا ہے۔

لیکن OpenAI کے لیے، جو انسان جیسی زبان تیار کرنے کے لیے LLMs بنا رہا ہے، یہ ٹویٹ انسانی زبان کے کام کرنے کے طریقے کی ایک مثال کے طور پر قابل قدر ہے۔ ایک ٹویٹ کسی AI کو جملے بنانا نہیں سکھا سکتی، لیکن اربوں ٹویٹس، بلاگ پوسٹس، ویکیپیڈیا اندراجات، اور اسی طرح، یقینی طور پر کر سکتے ہیں۔ مثال کے طور پر، ایڈوانسڈ LLM GPT-4 شاید X (سابقہ ​​ٹویٹر)، Reddit، Wikipedia اور اس سے آگے کے ڈیٹا کو استعمال کرتے ہوئے بنایا گیا تھا۔

AI انقلاب ڈیٹا سے بھرپور تنظیموں کے کاروباری ماڈل کو بدل رہا ہے۔ میٹا اور گوگل جیسی کمپنیاں رہی ہیں۔ AI تحقیق اور ترقی میں سرمایہ کاری کئی سالوں سے جب وہ اپنے ڈیٹا کے وسائل سے فائدہ اٹھانے کی کوشش کرتے ہیں۔

تنظیمات ایکس کی طرح اور اٹ API رسائی کے لیے تیسرے فریق کو چارج کرنا شروع کر دیا ہے، یہ نظام ان ویب سائٹس سے ڈیٹا کو کھرچنے کے لیے استعمال ہوتا ہے۔ ڈیٹا سکریپنگ کی لاگت ایکس پیسہ جیسی کمپنیوں کو ہوتی ہے۔ کمپیوٹنگ پاور پر زیادہ خرچ کرنا چاہیے۔ ڈیٹا کے سوالات کو پورا کرنے کے لیے۔

آگے بڑھتے ہوئے، جیسا کہ OpenAI جیسی تنظیمیں اپنے GPT ماڈلز کے زیادہ طاقتور ورژن بنانے کے خواہاں ہیں، انہیں ڈیٹا کے حصول کے لیے زیادہ اخراجات کا سامنا کرنا پڑے گا۔ اس مسئلے کا ایک حل مصنوعی ڈیٹا ہوسکتا ہے۔

مصنوعی جانا

مصنوعی ڈیٹا ہے۔ AI سسٹمز کے ذریعے شروع سے تخلیق کیا گیا۔ مزید جدید AI سسٹمز کو تربیت دینے کے لیے — تاکہ وہ بہتر ہوں۔ وہ حقیقی تربیتی ڈیٹا کے طور پر ایک ہی کام انجام دینے کے لیے ڈیزائن کیے گئے ہیں لیکن AI کے ذریعے تیار کیے گئے ہیں۔

یہ ایک نیا آئیڈیا ہے لیکن اسے بہت سے مسائل کا سامنا ہے۔ اچھا مصنوعی ڈیٹا ہونا ضروری ہے۔ اصل ڈیٹا سے کافی مختلف اس کی بنیاد ماڈل کو کچھ نیا بتانے کے لیے ہے، جب کہ اسے کچھ درست بتانے کے لیے کافی مماثل ہے۔ یہ حاصل کرنا مشکل ہوسکتا ہے۔ جہاں مصنوعی ڈیٹا ہے۔ صرف قائل کرنے والی کاپیاں حقیقی دنیا کے اعداد و شمار کے مطابق، نتیجے میں AI ماڈلز تخلیقی صلاحیتوں کے ساتھ جدوجہد کر سکتے ہیں، موجودہ تعصبات کو مضبوط کر سکتے ہیں۔

ایک اور مسئلہ ہے۔ "Hapsburg AI" مسئلہ. اس سے پتہ چلتا ہے کہ مصنوعی ڈیٹا پر AI کی تربیت ان نظاموں کی تاثیر میں کمی کا سبب بنے گی- اس لیے ہیپسبرگ شاہی خاندان کی بدنام زمانہ نسل کشی کا استعمال کرتے ہوئے مشابہت۔ کچھ مطالعہ تجویز کریں کہ یہ پہلے ہی ChatGPT جیسے سسٹمز کے ساتھ ہو رہا ہے۔

ChatGPT کے بہت اچھے ہونے کی ایک وجہ یہ ہے کہ یہ استعمال کرتا ہے۔ انسانی رائے کے ساتھ کمک سیکھنے (RLHF)، جہاں لوگ درستگی کے لحاظ سے اس کے نتائج کی درجہ بندی کرتے ہیں۔ اگر AI کے ذریعہ تیار کردہ مصنوعی ڈیٹا میں غلطیاں ہیں، تو اس ڈیٹا پر تربیت یافتہ AI ماڈل خود ہی غلط ہوں گے۔ لہٰذا ان غلطیوں کو درست کرنے کے لیے انسانی رائے کا مطالبہ بڑھنے کا امکان ہے۔

تاہم، جب کہ زیادہ تر لوگ یہ کہہ سکیں گے کہ آیا کوئی جملہ گرامر کے لحاظ سے درست ہے، بہت کم لوگ اس کی حقیقت پر مبنی درستگی پر تبصرہ کرنے کے قابل ہوں گے—خاص طور پر جب آؤٹ پٹ تکنیکی یا خصوصی ہو۔ ماہر موضوعات پر غلط نتائج RLHF کے پکڑے جانے کا امکان کم ہوتا ہے۔ اگر مصنوعی ڈیٹا کا مطلب ہے کہ پکڑنے کے لیے مزید غلطیاں ہیں، تو عام مقصد کے LLMs کا معیار رک سکتا ہے یا گر سکتا ہے یہاں تک کہ یہ ماڈل مزید "سیکھتے" ہیں۔

چھوٹی زبان کے ماڈل

یہ مسائل AI میں کچھ ابھرتے ہوئے رجحانات کی وضاحت میں مدد کرتے ہیں۔ گوگل انجینئرز نے انکشاف کیا ہے کہ تیسرے فریق کو روکنے میں بہت کم ہے۔ LLMs کو دوبارہ بنانا جیسے GPT-3 یا Google کا LaMDA AI۔ بہت سی تنظیمیں اپنے مقاصد کے لیے اپنے مخصوص ڈیٹا کا استعمال کرتے ہوئے اپنے اندرونی AI نظام بنا سکتی ہیں۔ یہ طویل مدت میں ChatGPT کے مقابلے میں ان تنظیموں کے لیے شاید زیادہ قیمتی ہوں گے۔

حال ہی میں، جاپانی حکومت نے نوٹ کیا کہ ترقی پذیر a ChatGPT کا جاپان مرکوز ورژن ان کی AI حکمت عملی کے لیے ممکنہ طور پر قابل قدر ہے، کیونکہ ChatGPT جاپان کا کافی نمائندہ نہیں ہے۔ سافٹ ویئر کمپنی SAP نے حال ہی میں اپنا AI "روڈ میپ" شروع کیا ہے پیشہ ور تنظیموں کو AI کی ترقی کی صلاحیتوں کی پیشکش کرنا۔ اس سے کمپنیوں کے لیے ChatGPT کے اپنے، مرضی کے مطابق ورژن بنانا آسان ہو جائے گا۔

کنسلٹنسی جیسے میکنسی اور KPMG AI ماڈلز کی تربیت کو "مخصوص مقاصد" کے لیے تلاش کر رہے ہیں۔ کس طرح کرنے کے بارے میں رہنمائی کرتا ہے۔ ChatGPT کے نجی، ذاتی ورژن بنائیں آسانی سے آن لائن پایا جا سکتا ہے. اوپن سورس سسٹمز، جیسے GPT4All، پہلے سے موجود ہے.

جیسا کہ ترقی کے چیلنجز - ممکنہ ریگولیٹری رکاوٹوں کے ساتھ مل کر - عام LLMs کے لیے بڑھتے ہیں، یہ ممکن ہے کہ AI کا مستقبل بڑی زبان کے ماڈلز کے بجائے بہت سے مخصوص چھوٹے ہوں گے۔ اگر وہ GPT-4 جیسے سسٹمز کے مقابلے کم ڈیٹا پر تربیت یافتہ ہوں تو چھوٹی زبان کے ماڈلز جدوجہد کر سکتے ہیں۔

لیکن انہیں RLHF کے لحاظ سے بھی فائدہ ہو سکتا ہے، کیونکہ مخصوص مقاصد کے لیے بہت کم زبان کے ماڈل تیار کیے جانے کا امکان ہے۔ جن ملازمین کو اپنی تنظیم اور اس کے مقاصد کے بارے میں ماہرانہ معلومات ہیں وہ ایسے AI سسٹمز کو بہت زیادہ قیمتی فیڈ بیک فراہم کر سکتے ہیں، اس کے مقابلے میں عام AI سسٹم کے لیے عام تاثرات۔ اس سے کم ڈیٹا کے نقصانات پر قابو پایا جا سکتا ہے۔

یہ مضمون شائع کی گئی ہے گفتگو تخلیقی العام لائسنس کے تحت. پڑھو اصل مضمون.

تصویری کریڈٹ: محمد نوحاسی / Unsplash سے

ٹائم اسٹیمپ:

سے زیادہ یکسانیت مرکز