کس طرح جنریٹو IA موجودہ دہائی میں ہر چیز میں خلل ڈالے گا۔

بہت سے لوگ حیران ہوں گے۔

مستحکم بازی کے ساتھ مصنف کی تصویر

In حالیہ مہینوں میں، AI سسٹمز جیسے Midjourney، DALL-E، Stable Diffusion، LaMDA، اور PaLM نے ڈومینز میں بظاہر تصویر اور ٹیکسٹ جنریشن کی طرح متنوع ترقی کی ہے۔ ان سسٹمز کی صلاحیتیں متاثر کن ہیں: وہ انتہائی مشورے والی تصاویر تیار کرتے ہیں، اشتہارات کے لیے موثر فروخت ہونے والی کاپی بناتے ہیں، اور بہت کچھ، سب کچھ صرف "اشارہ" سے ہوتا ہے جو بیان کرتا ہے کہ صارف کیا حاصل کرنا چاہتا ہے۔

یہ سب جنریٹو اے آئی کے ساتھ کیا جاتا ہے۔

"جنریٹو AI" سے مراد ایسے نظام ہیں جن کے ذریعے طاقت ہے۔ گہرے عصبی نیٹ ورک کہ لاگو بڑے زبان کے ماڈل (LLM) کرنے کے لیے تخلیق کسی قسم کا مواد۔ یہاں میں کہتا ہوں "تخلیق" کا مطلب ہے کہ یہ پہلے سے موجود کسی چیز کی نقل نہیں ہے، فلسفیانہ معنوں میں نہیں (بہرحال "تخلیق" کیا ہے؟)۔

اس بہادر نئی دنیا میں بڑی نئی کمپنیاں ابھر رہی ہیں، جیسے یشب، جو اشتہارات کے لیے فروخت ہونے والی کاپی اور تصاویر دونوں کی نسل پیش کرتا ہے: Jasper کی اب ایک بلین ڈالر سے زیادہ کی قیمت ہے، جو راتوں رات ایک تنگاوالا بن جاتا ہے۔

واقعی ڈینٹ بنانے والا پہلا جنریٹو AI پلیٹ فارم GPT-3 تھا - جو ابھی چند سال قبل جاری کیا گیا تھا! اس کے بعد، میدان میں کئی کھلاڑیوں (اوپن اے آئی، گوگل، اسٹیبل ڈیفیوژن، گوگل، ڈیپ مائنڈ، اور دیگر) کی جانب سے یکے بعد دیگرے ریلیز کی جانے والی ریلیز ایک تیز رفتاری سے نمودار ہوئی ہے، اس قدر کہ موجودہ رہنا مشکل ہے۔

لیکن ہمارے اشارے سے تصاویر بنانے کے لیے مڈجرنی کے ساتھ کچھ وقت گزارنا کتنا مزہ اور لاجواب ہے، بہت سے ٹیک شائقین اس جنریٹو آئی اے لہر کو سمجھنے کے لیے جدوجہد کرتے ہیں۔

کیا جنریٹو آئی اے ایک ٹھوس رجحان ہے، یا یہ صرف ایک جنون ہے؟

میں جاؤں گا"ٹھوس رجحانکیونکہ یہ اس دہائی کے دائرہ کار میں ہزاروں پیشہ ورانہ اور تفریحی سرگرمیوں کو بدل دے گا۔ مجھے ایک مثال کے ساتھ شروع کرنے دو.

میں ٹینس کا بہت بڑا پرستار ہوں (کم از کم ٹی وی کے لحاظ سے)۔ لیکن لائیو ٹینس میچوں کو ختم ہونے میں گھنٹے لگتے ہیں، اور میری دوسری سرگرمیاں اور دلچسپیاں ہیں، اس لیے میں عام طور پر ری پلے دیکھنے کا سہارا لیتا ہوں یا صرف ایک میچ کے 4 منٹ یا اس سے زیادہ دل لگی والی ویڈیوز کو ہائی لائٹ کرتا ہوں۔

لیکن کیا ہوگا اگر 4 منٹ کی ویڈیو کے بجائے، مجھے 10 یا 15 منٹ کی ویڈیو چاہیے؟ یا اگر میں ٹائی بریک میں ہر پوائنٹ کو شامل کرنا چاہتا ہوں؟ میں فی الحال قسمت سے باہر ہوں۔

اب اپنی جنریٹو-آئی اے ٹوپی کو کام پر لگائیں: ایک جنریٹو آئی اے اسپورٹس ویڈیو جنریٹر ایک ویڈیو بنائے گا۔ صرف تمہارے لیے تصریحات کے مطابق جو آپ غیر رسمی طور پر ٹیکسٹ پرامپٹ میں درج ذیل کی طرح ڈالتے ہیں:

"پیرس برسی 15 میں رافا نڈال بمقابلہ ٹومی پال میچ کے انتہائی دلچسپ پوائنٹس کے ساتھ تقریباً 2022 منٹ کی ویڈیو، بشمول مکمل ٹائی بریک اگر کوئی ہو، نیز ہر بریک پوائنٹ میں تبدیل"

یہی ہے. آپ کو اپنی ذاتی نوعیت کی ویڈیو کے ساتھ ایک لنک ملتا ہے، جو دنیا میں کسی اور کے ذریعے دیکھے گئے ویڈیو سے مختلف ہوتا ہے۔ اور یہ ویڈیو سروس DALL-E اور Midjourney کی طرح معاشی طور پر قابل عمل ہوگی۔

تحقیق جدت سے مختلف ہے۔ پہلے کا تعلق شائع شدہ اصل نتائج سے ہے، اور مؤخر الذکر کا ان نتائج سے کاروبار بنانے کا طریقہ تلاش کرنے کے ساتھ بہت کچھ کرنا ہے: جدت اصلیت کی پرواہ نہیں کرتی بلکہ ترقی، دفاع، سرمایہ کاری کی واپسی وغیرہ کے بارے میں ہے۔

اکثر چیزیں الجھ جاتی ہیں کیونکہ تحقیق گوگل جیسی کمپنیاں کرتی ہیں، جو اصولی طور پر منافع کمانے کے لیے ہوتی ہیں - لیکن وہ سمجھتے ہیں کہ ان کا کاروبار ہائی ٹیک ہے، اور تحقیق کے بغیر ٹیکنالوجی اعلیٰ نہیں ہے۔. لہذا وہ تحقیق کی مالی اعانت کے ساتھ ساتھ اکیڈمی کے قریب ہونے میں شامل ہو جاتے ہیں - ان کے بہت سے اعلی محققین کو اکیڈمیا سے رکھا گیا تھا۔ خود ایک محقق کے طور پر، مجھے کچھ سال پہلے ماؤنٹین ویو میں ان کے ہیڈ کوارٹر میں ایک فیکلٹی سمٹ میں مدعو کیا گیا تھا، اور انہوں نے مجھے فور سیزنز ہوٹل کے ایک سویٹ میں رکھا تھا – جو کچھ بھی ہو تعلیمی برادری پر اچھا تاثر بنانے کے لیے!

لیکن یہاں تک کہ اگر تحقیق اور اختراع کے درمیان واضح کٹ لگانا مشکل - اور مصنوعی بھی - ہو سکتا ہے، فرق یہاں بہت اہم ہے کیونکہ، جنریٹو AI کے معاملے میں، دونوں مختلف اداکاروں کے ذریعہ تیار کیے جائیں گے، اور وہ منسلک ہوں گے۔ سافٹ ویئر اسٹیک میں دو مختلف پرتوں کے ساتھ -as J. Currier کی طرف سے اشارہ کیا:

  1. نیچے سافٹ ویئر کی پرت ہے گہری سیکھنے کا ماڈل, Large Language Models (LLM) یا مساوی داخلی نمائندگی کے نفاذ کے ارد گرد بنایا گیا ہے۔ ماڈل بیس بلڈنگ بلاک فراہم کرتے ہیں جہاں سے ایپلی کیشنز تیار کی جا سکتی ہیں۔
  2. سب سے اوپر سافٹ ویئر کی پرت ہے درخواست ایک، جو کسی مخصوص کام کو پورا کرنے کے لیے ڈیپ لرننگ ماڈل کے سب سے اوپر بناتا ہے، مثال کے طور پر، ٹیکسٹ پرامپٹ سے تصویر کو آؤٹ پٹ کرنے کے لیے۔

یہ دو پرتوں والا فن تعمیر تیز رفتار جدت کے ایک نئے دور کو ہوا دے گا کیونکہ ایک بار جب نچلی پرت کو گوگل، اوپن اے آئی، اور دیگر جیسی بڑی کمپنیوں کے ذریعے تیار کیا جاتا ہے، تو چھوٹی کمپنیاں ایپلیکیشن کی پرت فراہم کریں گی - یقیناً، ان کے منافع میں کمی۔ نیچے کی پرت فراہم کرنے والے کو۔

فی الحال، نچلی پرت کو تیزی سے بہتر کیا گیا ہے - اور اکثر، اسے اوپر کی درخواست کے ساتھ تقسیم کیا جاتا ہے۔ مثال کے طور پر، LaMDA اور PaLM ڈائیلاگ کی صلاحیتوں کو باکس سے باہر پیش کرتے ہیں، جبکہ DALL-E اور Midjourney پرامپٹ ٹو امیج خدمات پیش کرتے ہیں۔ لیکن جلد ہی، نچلی پرت کے لیے اوپن سورس متبادل کے پھیلاؤ سے صرف اوپری ایپلیکیشن لیئر کو تیار کرنا اور اسے پہلے سے دستیاب نیچے کی پرت میں پلگ کرنا ممکن ہو جائے گا۔ کام کرنے سے کہیں زیادہ آسان کہا، یقیناً، لیکن حقیقت یہ ہے کہ نیچے کی تہہ اوپر والے سے زیادہ پیچیدہ ہے۔

میں بحث کروں گا کہ جنریٹو آئی اے تقریباً ہر ایک علمی کام اور تفریحی سرگرمی میں پھیل جائے گی۔ کیونکہ یہ پہلے کی مشکل سرگرمیوں سے پیچیدگی کو دور کرنے کے لیے ٹولز فراہم کرے گا اور اس لیے کہ یہ پرسنلائزیشن کی ایک بالکل نئی سطح فراہم کر سکتا ہے جسے میں "جنریٹیو پرسنلائزیشن" کہوں گا۔

آپ اوپر دی گئی اسپورٹس ویڈیو مثال سے دیکھ سکتے ہیں کہ "جنریٹیو پرسنلائزیشن" کیا ہے: ہر صارف کو صرف دو یا تین اختیارات کے درمیان انتخاب کے بجائے بالکل نئی اور منفرد ہائی لائٹس ویڈیو دی جاتی ہے۔

تمام جنریٹو آئی اے ایپلی کیشنز کے مجموعی اثرات کو بڑھا چڑھا کر بیان کرنا مشکل ہے:

  1. آسان گرافک تخلیق پہلے سے ہی DALL-E، Midjourney، اور Stable Diffusion جیسے ٹولز کے ساتھ غیر پیشہ ور افراد کی پہنچ میں ہے، کم از کم اس پوسٹ کے لیے ہیڈر امیج حاصل کرنے جیسے آسان مفید مقاصد کے لیے۔ اس سال سے پہلے، میں اپنی تصاویر بنانے میں مکمل طور پر قاصر تھا، اور بلاگ کے ماہرین نے آپ کی اپنی کہانیوں کے لیے گرافک ڈیزائن پر وقت ضائع کرنے کے خلاف مشورہ دیا۔
  2. فوٹو ایڈیٹنگ کرنے والے صارفین کو فوٹوشاپ یا ایفینیٹی فوٹو کے ٹولز کے پیچیدہ سیٹ میں مہارت حاصل کرنے کے لیے سیکھنے کے سخت وکر کو برداشت کرنے کی ضرورت نہیں ہوگی (میں بعد میں استعمال کرتا ہوں، اور یہ اتنا پیچیدہ ہے کہ مجھے زیادہ تر ایڈجسٹمنٹ کرنے کا طریقہ سیکھنے کے لیے YouTube ٹیوٹوریلز سے مشورہ کرنا پڑتا ہے)۔ جنریٹو اے آئی کے ساتھ، صارفین صرف سافٹ ویئر سے ایک دی گئی تبدیلی کو انجام دینے کے لیے کہیں گے، اور آواز! تصویر ٹھیک ہو جائے گی۔ اگر Adobe اپنے ٹولز کے ساتھ جنریٹو AI فراہم کرنے میں ناکام ہو جاتا ہے، تو وہ نئے سٹارٹ اپس کی پیشکش سے متاثر ہو جائیں گے اور بلاک بسٹر کی راہ پر گامزن ہو جائیں گے۔
  3. پاورپوائنٹ جیسے پریزنٹیشن ٹولز، صرف ٹیمپلیٹس فراہم کرنے کے بجائے، جیسا کہ وہ ابھی کرتے ہیں، آؤٹ لائن آئیڈیاز سے پیشہ ورانہ سطح کی پوری پریزنٹیشنز تیار کریں گے اور ان کو ٹھیک کریں گے۔ فی الحال، پیشہ ورانہ اور شوقیہ پریزنٹیشنز کے درمیان فرق بہت بڑا ہے - اب ایسا نہیں ہوگا۔
  4. ٹیکسٹ رائٹنگ ایک ایسا عمل ہو گا جسے جنریٹو اے آئی ٹولز کے ذریعے بہت بہتر بنایا گیا ہے۔ تحریر کی بہت سی شکلیں پہلے ہی گرامرلی جیسے جدید ترین ٹولز سے مدد حاصل کر رہی ہیں، لیکن جنریٹیو AI مصنفین کو ایک نئے معیار کی مدد فراہم کرے گا، مثال کے طور پر، بلاگ کا ایک مکمل پہلا ورژن تیار کر کے۔ لکھنا انسانوں اور AI ٹول کے درمیان ایک باہمی تعاون پر مبنی عمل ہوگا۔
  5. حتمی صارف کے لیے بنائے گئے کسی بھی سافٹ ویئر کو متن یا آواز کے اشارے کے ساتھ استعمال کرنا آسان ہونا چاہیے۔ یوزر مینوئل اور انسٹرکشنل ویڈیوز ماضی کی بات ہو جائیں گی، اور جیسے ہی صارفین سافٹ ویئر استعمال کرنے کے نئے آسان طریقے کے عادی ہو جائیں گے، ہر چیز کو متعلقہ رہنے کے لیے اسے پیش کرنا ہو گا۔
  6. زبان سیکھنے کا کام بنیادی طور پر صوتی معاونین کی مدد سے کیا جائے گا، جو کہ آپ نے درست اندازہ لگایا ہے- جنریٹو AI کے ذریعے چلایا جائے گا۔ صوتی معاونین، جو ذاتی زبان کے کوچز کی طرح کام کریں گے، اپنی حیرت انگیز قدرتی زبان کے مکالمے کی صلاحیتوں کا استعمال کریں گے، جو پہلے گوگل کے LaMDA جیسے سسٹمز میں نظر آتے ہیں، انسانی زبان سیکھنے والے کی الفاظ اور تاثرات حاصل کرنے، تلفظ کو بہتر بنانے وغیرہ کے لیے رہنمائی کے لیے۔ وائس اسسٹنٹس کوئی مستقبل کی فنتاسی نہیں ہے - یہ ابھی معاشی معنی رکھتا ہے۔
  7. یہاں تک کہ ہارڈویئر پروڈکٹس (جیسے کاریں) میں جنریٹو اے آئی ڈائیلاگ پر مبنی مدد کے نظام ہوں گے۔ کیا آپ نے جدید کاروں میں ڈسپلے کو ایڈجسٹ کرنے جیسا پیچیدہ آپریشن کرنے کی کوشش کی ہے؟ آسان نہیں، میں آپ کو بتا سکتا ہوں۔ پیچیدہ دستورالعمل میں کھودنے کے بجائے، آپ صرف صوتی معاون سے ہدایات حاصل کرنے یا براہ راست ایڈجسٹمنٹ کروانے کے لیے کہیں گے۔

بہت سے پیشے پہچان سے باہر ہو جائیں گے۔ گرافک ڈیزائنرز پہلے ہی اس رکاوٹ کو محسوس کر رہے ہیں۔ تمام پیشے ختم ہو جائیں گے، اور دوسرے پیدا ہو جائیں گے۔ طاقتور کمپنیاں دیوالیہ ہو جائیں گی، اور نئی کمپنیاں غالب ہو جائیں گی، اس بات پر منحصر ہے کہ وہ جنریٹو اے آئی کے ذریعے آنے والی تکنیکی رکاوٹ کو کتنی اچھی طرح سے ہینڈل کرتی ہیں۔

اور یہ سب کچھ اس دہائی میں ہو جائے گا۔

میں غلط ہو سکتا ہوں، لیکن مجھے لگتا ہے کہ یہ مشکل تھا، یہاں تک کہ تجربہ کار ٹیک پنڈتوں کے لیے بھی، موجودہ امیج اور ٹیکسٹ جنریٹرز کی بے پناہ صلاحیتوں کی پیش گوئی کرنا: چند سال پہلے یہ واضح نہیں تھا کہ بہت بڑے ماڈلز اور ٹریننگ سیٹ معیار کے لحاظ سے مختلف صلاحیتوں کا باعث بنتا ہے۔

میں یہاں تک کہوں گا کہ یہ ایک خوش قسمتی تھی، تقریباً بے ترتیب تلاش۔ لیکن اب جب کہ ہمارے پاس جنریٹو ٹولز موجود ہیں، دروازے نئی کمپنیوں کے لیے کھلے ہیں جو درخواست کے بعد ایپلی کیشن کو تیز رفتاری سے تیار کریں گی: یہ زیادہ تر یہ جاننے کی بات ہے کہ کس چیز کو بنیادی طور پر بہتر کیا جا سکتا ہے اور کاروبار کرنے کے لیے مناسب کاروباری ماڈل تلاش کرنا ہے۔ ایک تخلیقی IA خیال۔

کچھ سال پہلے، ایسا لگتا تھا کہ دیگر ٹیک رجحانات، جیسے سیلف ڈرائیونگ کاریں، وی آر، یا بلاک چین، جلد ہی اپنی جگہ لے لیں گے، لیکن سیلف ڈرائیونگ ٹیکنالوجی قانون سازی کی رکاوٹوں کی وجہ سے محدود ہو گئی ہے، بلاک چین معاشی بدحالی کا شکار ہو گیا، اور وی آر ہارڈ ویئر کے اعلی اخراجات کی وجہ سے اپنانا محدود ہے۔ اس کے بجائے، جنریٹو AI ابھی تک قانون سازی کے ذریعے محدود نہیں ہے (ارے، پاورپوائنٹ پریزنٹیشن کو چمکانا یا کھیلوں کی ویڈیو بنانا زندگی یا موت کا معاملہ نہیں ہے) اور اسے صارف کے ذریعے خریدنے کے لیے مہنگے ہارڈ ویئر کی ضرورت نہیں ہے۔

اور ہم نے سوچا بھی نہیں تھا کہ تخلیقی سرگرمیاں اتنی جلدی متاثر ہونے والی ہیں۔ لیکن وہ تھے۔

ہم نئے اور بعض اوقات عجیب و غریب دور میں داخل ہو رہے ہیں، جہاں انسانی تخلیقی صلاحیتیں مشینوں کی نئی صلاحیتوں کے ساتھ اس حد تک گھل مل جاتی ہیں کہ ان کے درمیان فرق کرنا مشکل ہے۔ جیسا کہ جے کرئیر نشاندھی کرنا:

"آج اور اگلے چند سالوں کے لیے، یہ حیران کن اور بہت سے طریقوں سے خوفناک محسوس ہوگا۔ کیونکہ وہ تخلیقی لمحات جہاں آپ صفر سے لے کر ابتدائی خیالات تک جاتے ہیں ہمیشہ انسان کو بہت منفرد محسوس کرتے ہیں کیونکہ یہ بہت پراسرار رہا ہے۔

کس طرح جنریٹو IA موجودہ دہائی میں ہر چیز میں خلل ڈالے گا ماخذ سے دوبارہ شائع کیا گیا https://towardsdatascience.com/how-generative-ia-will-disrupt-everything-in-the-current-decade-b4e8ce7dd4f1?source=rss—-7f60cf5620c9— 4 بذریعہ https://towardsdatascience.com/feed

<!–

->

ٹائم اسٹیمپ:

سے زیادہ بلاکچین کنسلٹنٹس