AI تیزی سے ترقی کر رہا ہے۔ ChatGPT بن گیا ہے۔ سب سے تیزی سے بڑھتی ہوئی آن لائن سروس تاریخ میں. گوگل اور مائیکروسافٹ جنریٹیو اے آئی کو اپنی مصنوعات میں ضم کر رہے ہیں۔ اور عالمی رہنما جوش و خروش سے AI کو معاشی ترقی کے ایک آلے کے طور پر اپنا رہے ہیں۔
جیسا کہ ہم ChatGPT اور Bard سے آگے بڑھتے ہیں، ہمیں امکان ہے کہ AI چیٹ بوٹس کم عام اور زیادہ ماہر ہوتے ہیں۔ AIs ان اعداد و شمار کے ذریعہ محدود ہیں جن کے سامنے وہ سامنے آتے ہیں تاکہ وہ جو کچھ کرتے ہیں اس میں انہیں بہتر بنایا جاسکے — اس معاملے میں، انسانی تقریر کی نقل کرنا اور صارفین کو مفید جوابات فراہم کرنا۔
تربیت اکثر نیٹ وسیع ڈالتا ہے، کے ساتھ ہزاروں کتابوں اور ویب صفحات کو جذب کرنے والے AI سسٹمز. لیکن تربیتی ڈیٹا کا ایک زیادہ منتخب، فوکسڈ سیٹ AI چیٹ بوٹس کو خاص صنعتوں میں کام کرنے والے یا مخصوص علاقوں میں رہنے والے لوگوں کے لیے اور بھی مفید بنا سکتا ہے۔
ڈیٹا کی قدر
اس ارتقاء کا ایک اہم عنصر اعلی درجے کے بڑے لینگوئج ماڈلز (LLMs) کے لیے تربیتی ڈیٹا اکٹھا کرنے کے بڑھتے ہوئے اخراجات ہوں گے، AI کی قسم جو ChatGPT کو طاقت دیتی ہے۔ کمپنیاں جانتی ہیں کہ ڈیٹا قیمتی ہے: میٹا اور گوگل صارف کے ڈیٹا سے ہدف بنائے گئے اشتہارات بیچ کر اربوں کماتے ہیں۔ لیکن ڈیٹا کی قدر اب ہے۔ تبدیل کرنے. میٹا اور گوگل ڈیٹا "بصیرت" فروخت کرتے ہیں۔ وہ بہت سے ڈیٹا پوائنٹس کو صارفین کے بارے میں پیشین گوئیوں میں تبدیل کرنے کے لیے تجزیات میں سرمایہ کاری کرتے ہیں۔
ڈیٹا بالکل مختلف انداز میں OpenAI — ChatGPT کے ڈویلپر کے لیے قیمتی ہے۔ ایک ٹویٹ کا تصور کریں: "بلی چٹائی پر بیٹھ گئی۔" یہ ٹویٹ ٹارگٹڈ ایڈورٹائزرز کے لیے قابل قدر نہیں ہے۔ یہ صارف یا ان کی دلچسپیوں کے بارے میں بہت کم کہتا ہے۔ ہو سکتا ہے، ایک دھکے پر، یہ بلی کے کھانے اور ڈاکٹر سوس میں دلچسپی کا مشورہ دے سکتا ہے۔
لیکن OpenAI کے لیے، جو انسان جیسی زبان تیار کرنے کے لیے LLMs بنا رہا ہے، یہ ٹویٹ انسانی زبان کے کام کرنے کے طریقے کی ایک مثال کے طور پر قابل قدر ہے۔ ایک ٹویٹ کسی AI کو جملے بنانا نہیں سکھا سکتی، لیکن اربوں ٹویٹس، بلاگ پوسٹس، ویکیپیڈیا اندراجات، اور اسی طرح، یقینی طور پر کر سکتے ہیں۔ مثال کے طور پر، ایڈوانسڈ LLM GPT-4 شاید X (سابقہ ٹویٹر)، Reddit، Wikipedia اور اس سے آگے کے ڈیٹا کو استعمال کرتے ہوئے بنایا گیا تھا۔
AI انقلاب ڈیٹا سے بھرپور تنظیموں کے کاروباری ماڈل کو بدل رہا ہے۔ میٹا اور گوگل جیسی کمپنیاں رہی ہیں۔ AI تحقیق اور ترقی میں سرمایہ کاری کئی سالوں سے جب وہ اپنے ڈیٹا کے وسائل سے فائدہ اٹھانے کی کوشش کرتے ہیں۔
تنظیمات ایکس کی طرح اور اٹ API رسائی کے لیے تیسرے فریق کو چارج کرنا شروع کر دیا ہے، یہ نظام ان ویب سائٹس سے ڈیٹا کو کھرچنے کے لیے استعمال ہوتا ہے۔ ڈیٹا سکریپنگ کی لاگت ایکس پیسہ جیسی کمپنیوں کو ہوتی ہے۔ کمپیوٹنگ پاور پر زیادہ خرچ کرنا چاہیے۔ ڈیٹا کے سوالات کو پورا کرنے کے لیے۔
آگے بڑھتے ہوئے، جیسا کہ OpenAI جیسی تنظیمیں اپنے GPT ماڈلز کے زیادہ طاقتور ورژن بنانے کے خواہاں ہیں، انہیں ڈیٹا کے حصول کے لیے زیادہ اخراجات کا سامنا کرنا پڑے گا۔ اس مسئلے کا ایک حل مصنوعی ڈیٹا ہوسکتا ہے۔
مصنوعی جانا
مصنوعی ڈیٹا ہے۔ AI سسٹمز کے ذریعے شروع سے تخلیق کیا گیا۔ مزید جدید AI سسٹمز کو تربیت دینے کے لیے — تاکہ وہ بہتر ہوں۔ وہ حقیقی تربیتی ڈیٹا کے طور پر ایک ہی کام انجام دینے کے لیے ڈیزائن کیے گئے ہیں لیکن AI کے ذریعے تیار کیے گئے ہیں۔
یہ ایک نیا آئیڈیا ہے لیکن اسے بہت سے مسائل کا سامنا ہے۔ اچھا مصنوعی ڈیٹا ہونا ضروری ہے۔ اصل ڈیٹا سے کافی مختلف اس کی بنیاد ماڈل کو کچھ نیا بتانے کے لیے ہے، جب کہ اسے کچھ درست بتانے کے لیے کافی مماثل ہے۔ یہ حاصل کرنا مشکل ہوسکتا ہے۔ جہاں مصنوعی ڈیٹا ہے۔ صرف قائل کرنے والی کاپیاں حقیقی دنیا کے اعداد و شمار کے مطابق، نتیجے میں AI ماڈلز تخلیقی صلاحیتوں کے ساتھ جدوجہد کر سکتے ہیں، موجودہ تعصبات کو مضبوط کر سکتے ہیں۔
ایک اور مسئلہ ہے۔ "Hapsburg AI" مسئلہ. اس سے پتہ چلتا ہے کہ مصنوعی ڈیٹا پر AI کی تربیت ان نظاموں کی تاثیر میں کمی کا سبب بنے گی- اس لیے ہیپسبرگ شاہی خاندان کی بدنام زمانہ نسل کشی کا استعمال کرتے ہوئے مشابہت۔ کچھ مطالعہ تجویز کریں کہ یہ پہلے ہی ChatGPT جیسے سسٹمز کے ساتھ ہو رہا ہے۔
ChatGPT کے بہت اچھے ہونے کی ایک وجہ یہ ہے کہ یہ استعمال کرتا ہے۔ انسانی رائے کے ساتھ کمک سیکھنے (RLHF)، جہاں لوگ درستگی کے لحاظ سے اس کے نتائج کی درجہ بندی کرتے ہیں۔ اگر AI کے ذریعہ تیار کردہ مصنوعی ڈیٹا میں غلطیاں ہیں، تو اس ڈیٹا پر تربیت یافتہ AI ماڈل خود ہی غلط ہوں گے۔ لہٰذا ان غلطیوں کو درست کرنے کے لیے انسانی رائے کا مطالبہ بڑھنے کا امکان ہے۔
تاہم، جب کہ زیادہ تر لوگ یہ کہہ سکیں گے کہ آیا کوئی جملہ گرامر کے لحاظ سے درست ہے، بہت کم لوگ اس کی حقیقت پر مبنی درستگی پر تبصرہ کرنے کے قابل ہوں گے—خاص طور پر جب آؤٹ پٹ تکنیکی یا خصوصی ہو۔ ماہر موضوعات پر غلط نتائج RLHF کے پکڑے جانے کا امکان کم ہوتا ہے۔ اگر مصنوعی ڈیٹا کا مطلب ہے کہ پکڑنے کے لیے مزید غلطیاں ہیں، تو عام مقصد کے LLMs کا معیار رک سکتا ہے یا گر سکتا ہے یہاں تک کہ یہ ماڈل مزید "سیکھتے" ہیں۔
چھوٹی زبان کے ماڈل
یہ مسائل AI میں کچھ ابھرتے ہوئے رجحانات کی وضاحت میں مدد کرتے ہیں۔ گوگل انجینئرز نے انکشاف کیا ہے کہ تیسرے فریق کو روکنے میں بہت کم ہے۔ LLMs کو دوبارہ بنانا جیسے GPT-3 یا Google کا LaMDA AI۔ بہت سی تنظیمیں اپنے مقاصد کے لیے اپنے مخصوص ڈیٹا کا استعمال کرتے ہوئے اپنے اندرونی AI نظام بنا سکتی ہیں۔ یہ طویل مدت میں ChatGPT کے مقابلے میں ان تنظیموں کے لیے شاید زیادہ قیمتی ہوں گے۔
حال ہی میں، جاپانی حکومت نے نوٹ کیا کہ ترقی پذیر a ChatGPT کا جاپان مرکوز ورژن ان کی AI حکمت عملی کے لیے ممکنہ طور پر قابل قدر ہے، کیونکہ ChatGPT جاپان کا کافی نمائندہ نہیں ہے۔ سافٹ ویئر کمپنی SAP نے حال ہی میں اپنا AI "روڈ میپ" شروع کیا ہے پیشہ ور تنظیموں کو AI کی ترقی کی صلاحیتوں کی پیشکش کرنا۔ اس سے کمپنیوں کے لیے ChatGPT کے اپنے، مرضی کے مطابق ورژن بنانا آسان ہو جائے گا۔
کنسلٹنسی جیسے میکنسی اور KPMG AI ماڈلز کی تربیت کو "مخصوص مقاصد" کے لیے تلاش کر رہے ہیں۔ کس طرح کرنے کے بارے میں رہنمائی کرتا ہے۔ ChatGPT کے نجی، ذاتی ورژن بنائیں آسانی سے آن لائن پایا جا سکتا ہے. اوپن سورس سسٹمز، جیسے GPT4All، پہلے سے موجود ہے.
جیسا کہ ترقی کے چیلنجز - ممکنہ ریگولیٹری رکاوٹوں کے ساتھ مل کر - عام LLMs کے لیے بڑھتے ہیں، یہ ممکن ہے کہ AI کا مستقبل بڑی زبان کے ماڈلز کے بجائے بہت سے مخصوص چھوٹے ہوں گے۔ اگر وہ GPT-4 جیسے سسٹمز کے مقابلے کم ڈیٹا پر تربیت یافتہ ہوں تو چھوٹی زبان کے ماڈلز جدوجہد کر سکتے ہیں۔
لیکن انہیں RLHF کے لحاظ سے بھی فائدہ ہو سکتا ہے، کیونکہ مخصوص مقاصد کے لیے بہت کم زبان کے ماڈل تیار کیے جانے کا امکان ہے۔ جن ملازمین کو اپنی تنظیم اور اس کے مقاصد کے بارے میں ماہرانہ معلومات ہیں وہ ایسے AI سسٹمز کو بہت زیادہ قیمتی فیڈ بیک فراہم کر سکتے ہیں، اس کے مقابلے میں عام AI سسٹم کے لیے عام تاثرات۔ اس سے کم ڈیٹا کے نقصانات پر قابو پایا جا سکتا ہے۔
یہ مضمون شائع کی گئی ہے گفتگو تخلیقی العام لائسنس کے تحت. پڑھو اصل مضمون.
تصویری کریڈٹ: محمد نوحاسی / Unsplash سے
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://singularityhub.com/2023/10/01/why-well-see-fewer-generic-ai-chatbots-like-chatgpt-in-the-future/
- : ہے
- : ہے
- : نہیں
- :کہاں
- a
- قابلیت
- ہمارے بارے میں
- اوپر
- AC
- تک رسائی حاصل
- درستگی
- درست
- حاصل
- حاصل کرنا
- اعلی درجے کی
- فائدہ
- میں اشتہار
- کے بعد
- AI
- اے آئی ماڈلز
- عی تحقیق
- اے آئی کی حکمت عملی
- اے آئی سسٹمز
- پہلے ہی
- بھی
- جمع کرنا
- an
- تجزیاتی
- اور
- جواب
- کوئی بھی
- اے پی آئی
- API تک رسائی
- کیا
- علاقوں
- مضمون
- AS
- At
- Axios
- کی بنیاد پر
- BE
- کیونکہ
- بن
- رہا
- شروع
- نیچے
- bespoke
- بہتر
- سے پرے
- باضابطہ
- اربوں
- کتب
- تعمیر
- عمارت
- تعمیر
- کاروبار
- بزنس ماڈل
- لیکن
- بٹن
- by
- کر سکتے ہیں
- نہیں کر سکتے ہیں
- صلاحیتوں
- کیس
- CAT
- پکڑو
- پکڑے
- کیونکہ
- کچھ
- یقینی طور پر
- تبدیل کرنے
- چارج
- چیٹ بٹس
- چیٹ جی پی ٹی
- کلک کریں
- CNBC
- CO
- کوڈ
- جمع
- COM
- تبصرہ
- عمومی
- کمپنیاں
- کمپنی کے
- مقابلے میں
- کمپیوٹنگ
- تعمیر
- بات چیت
- درست
- اخراجات
- سکتا ہے
- مقابلہ
- تخلیقی
- تخلیقی
- کریڈٹ
- اعداد و شمار
- ڈیٹا پوائنٹس
- کو رد
- ڈیمانڈ
- ڈیزائن
- ترقی یافتہ
- ڈیولپر
- ترقی
- ترقی
- مختلف
- مشکل
- do
- کرتا
- ڈان
- dr
- آسان
- اقتصادی
- اقتصادی ترقی
- تاثیر
- منحصر ہے
- کرنڈ
- ملازمین
- آخر
- انجینئرز
- کافی
- بھی
- ارتقاء
- مثال کے طور پر
- وجود
- موجودہ
- ماہر
- وضاحت
- دھماکہ
- ایکسپلور
- ظاہر
- چہرہ
- چہرے
- عنصر
- خاندان
- آراء
- کم
- توجہ مرکوز
- کھانا
- کے لئے
- فوربس
- پہلے
- آگے
- ملا
- سے
- FT
- پورا کریں
- مستقبل
- عام مقصد
- پیدا
- پیداواری
- پیداواری AI۔
- حاصل
- جنات
- اچھا
- گوگل
- گوگل
- حکومت
- زیادہ سے زیادہ
- بڑھتے ہوئے
- ترقی
- ہدایات
- ہو رہا ہے۔
- ہے
- مدد
- تاریخ
- کس طرح
- کیسے
- HTML
- HTTPS
- انسانی
- خیال
- if
- تصور
- اہم
- کو بہتر بنانے کے
- in
- غلط
- اضافہ
- صنعتوں
- بدنام
- معلومات
- مثال کے طور پر
- انضمام کرنا
- دلچسپی
- مفادات
- اندرونی
- میں
- سرمایہ کاری
- IT
- میں
- جاپان
- جاپانی
- جاپانی حکومت
- جان
- علم
- زبان
- بڑے
- شروع
- رہنماؤں
- سیکھنے
- کم
- لائسنس
- کی طرح
- امکان
- لمیٹڈ
- تھوڑا
- رہ
- ایل ایل ایم
- لانگ
- دیکھو
- بنا
- بہت سے
- مئی..
- شاید
- میکنسی
- کا مطلب ہے کہ
- میٹا
- مائیکروسافٹ
- شاید
- ایم ائی ٹی
- ماڈل
- ماڈل
- قیمت
- زیادہ
- سب سے زیادہ
- منتقل
- بہت
- ضروریات
- خالص
- نئی
- کا کہنا
- اب
- مقاصد
- of
- پیش کرتے ہیں
- اکثر
- on
- ایک
- آن لائن
- کھول
- اوپن سورس
- اوپنائی
- or
- حکم
- تنظیم
- تنظیمیں
- اصل
- پیداوار
- پر قابو پانے
- خود
- صفحہ
- خاص طور پر
- جماعتوں
- لوگ
- انجام دیں
- ذاتی
- ذاتی مواد
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- مہربانی کرکے
- پوائنٹس
- ممکن
- ممکنہ
- ممکنہ طور پر
- طاقتور
- اختیارات
- پیشن گوئی
- کی روک تھام
- نجی
- شاید
- مسئلہ
- مسائل
- پیدا
- حاصل
- پیشہ ورانہ
- فراہم
- فراہم کرنے
- مقاصد
- پش
- معیار
- سوالات
- میں تیزی سے
- شرح
- پڑھیں
- آسانی سے
- اصلی
- حقیقی دنیا
- وجہ
- حال ہی میں
- اٹ
- ریگولیٹری
- ہٹا
- نمائندے
- تحقیق
- وسائل
- نتیجے
- انکشاف
- انقلاب
- شاہی
- شاہی خاندان
- رن
- s
- اسی
- SAP
- کا کہنا ہے کہ
- کا کہنا ہے کہ
- فیرنا
- دیکھنا
- فروخت
- فروخت
- سزا
- مقرر
- کئی
- اسی طرح
- ایک
- So
- سافٹ ویئر کی
- حل
- کچھ
- کچھ
- ماخذ
- ماہر
- خصوصی
- مخصوص
- تقریر
- خرچ
- حکمت عملی
- جدوجہد
- اس طرح
- مشورہ
- پتہ چلتا ہے
- مصنوعی
- مصنوعی ڈیٹا
- کے نظام
- سسٹمز
- TAG
- ھدف بنائے گئے
- ٹاسک
- ٹیکنیکل
- بتا
- شرائط
- سے
- کہ
- ۔
- مستقبل
- ان
- ان
- خود
- وہاں.
- یہ
- وہ
- تھرڈ
- تیسرے فریقوں
- اس
- ہزاروں
- کرنے کے لئے
- کے آلے
- موضوعات
- ٹرین
- تربیت یافتہ
- ٹریننگ
- تبدیل
- رجحانات
- کوشش
- پیغامات
- ٹویٹس
- ٹویٹر
- قسم
- کے تحت
- استعمال کیا جاتا ہے
- رکن کا
- صارفین
- استعمال
- کا استعمال کرتے ہوئے
- قیمتی
- قیمت
- ورژن
- ورژن
- تھا
- راستہ..
- we
- ویب
- ویب سائٹ
- کیا
- جب
- چاہے
- جس
- جبکہ
- ڈبلیو
- وسیع
- وکیپیڈیا
- گے
- ساتھ
- کام کر
- کام کرتا ہے
- دنیا
- قابل قدر
- گا
- X
- سال
- تم
- زیفیرنیٹ