پلاٹو بلاکچین ڈیٹا انٹیلی جنس کو دیکھنے، سننے اور تخلیق کرنے میں ہماری مدد کرنے کے لیے AI دماغ کی ماڈلنگ کر رہا ہے۔ عمودی تلاش۔ عی

AI ہمیں دیکھنے، سننے اور تخلیق کرنے میں مدد کرنے کے لیے دماغ کی ماڈلنگ کر رہا ہے۔

یہ اس پوسٹ کا ترمیم شدہ ورژن ہے جو اصل میں چلائی گئی تھی۔ یہاں.


نیورو سائنس اور اے آئی کی ایک لمبی، باہم جڑی ہوئی تاریخ ہے۔ مصنوعی ذہانت کے علمبردار دماغ کی تنظیم کے اصولوں کو ذہین مشینیں بنانے کی تحریک کے طور پر دیکھتے تھے۔ حیرت انگیز طور پر الٹ پلٹ کرتے ہوئے، AI اب ہماری مدد کر رہا ہے کہ اس کے بہت ہی الہام کا ذریعہ ہے: انسانی دماغ۔ دماغ کے ماڈلز بنانے کے لیے AI کے استعمال کے اس انداز کو نیورو اے آئی کہا جاتا ہے۔ اگلی دہائی کے دوران، ہم مزید درست بنائیں گے۔ سلیکو میں دماغی ماڈل، خاص طور پر ہمارے دو سب سے نمایاں حواس، بصارت اور سماعت کے ماڈل۔ نتیجے کے طور پر، ہم حسی ماڈلز کو، مانگ کے مطابق، اسی سہولت کے ساتھ ڈاؤن لوڈ اور استعمال کرنے کے قابل ہو جائیں گے جس سے ہم آبجیکٹ کی شناخت یا قدرتی زبان کی پروسیسنگ کر سکتے ہیں۔

بہت سے نیورو سائنس دان اور مصنوعی ذہانت کے محققین ہیں – قابل فہم! - اس کے بارے میں بہت پرجوش: مانگ پر دماغ! دریافت کرنا کہ دیکھنے، محسوس کرنے، انسان ہونے کا کیا مطلب ہے! کم اچھی طرح سے تسلیم کیا جاتا ہے کہ صنعت میں وسیع عملی ایپلی کیشنز موجود ہیں. میں طویل عرصے سے اس شعبے میں ایک محقق رہا ہوں، اس بات پر کام کر چکا ہوں کہ پی ایچ ڈی کے بعد سے دماغ کس طرح وژن کو معنی میں تبدیل کرتا ہے۔ میں نے اس کے آغاز سے ہی فیلڈ کی ترقی دیکھی ہے، اور میرے خیال میں اب وقت آگیا ہے کہ کس طرح نیورو اے آئی مزید تخلیقی صلاحیتوں کو آگے بڑھا سکتا ہے اور ہماری صحت کو بہتر بنا سکتا ہے۔ 

میں پیش گوئی کرتا ہوں کہ نیورو اے آئی سب سے پہلے آرٹ اور ایڈورٹائزنگ میں بڑے پیمانے پر استعمال پائے گا، خاص طور پر جب GPT-3 اور DALL-E جیسے نئے جنریٹیو AI ماڈلز سے منسلک ہوں۔ اگرچہ موجودہ تخلیقی AI ماڈلز تخلیقی آرٹ اور میڈیا تیار کر سکتے ہیں، لیکن وہ آپ کو یہ نہیں بتا سکتے کہ آیا وہ میڈیا بالآخر مطلوبہ سامعین تک کوئی پیغام پہنچائے گا - لیکن نیورو اے آئی کر سکتا ہے۔. مثال کے طور پر، ہم فوکس گروپس اور A/B ٹیسٹوں کے ٹرائل اور ایرر کو بدل سکتے ہیں اور براہ راست میڈیا بنا سکتے ہیں جو بالکل وہی بات کرتا ہے جو ہم چاہتے ہیں۔ اس ایپلی کیشن کے ارد گرد مارکیٹ کا زبردست دباؤ ایک نیک سائیکل بنائے گا جو نیورو اے آئی ماڈلز کو بہتر بناتا ہے۔ 

اس کے نتیجے میں بہتر ماڈلز طب میں صحت میں ایپلی کیشنز کو قابل بنائیں گے، اعصابی مسائل میں مبتلا لوگوں کی مدد سے لے کر کنویں کی صلاحیتوں کو بڑھانے تک۔ LASIK سرجری کے بعد یا بالترتیب کوکلیئر امپلانٹ کروانے کے بعد کسی شخص کی بینائی یا سماعت کو زیادہ تیزی سے بحال کرنے میں مدد کے لیے صحیح تصاویر اور آوازیں بنانے کا تصور کریں۔ 

ان ایجادات کو پائپ کے نیچے آنے والی دیگر ٹیکنالوجیز کے ذریعے کہیں زیادہ طاقتور بنایا جائے گا: بڑھا ہوا حقیقت اور دماغی کمپیوٹر انٹرفیس۔ تاہم، آن ڈیمانڈ ڈاؤن لوڈ کے قابل حسی نظام کی ممکنہ افادیت کو مکمل طور پر محسوس کرنے کے لیے ہمیں ٹولنگ، ٹیلنٹ اور فنڈنگ ​​میں موجودہ خلا کو پر کرنے کی ضرورت ہوگی۔

اس ٹکڑے میں میں وضاحت کروں گا کہ نیورو اے آئی کیا ہے، یہ کیسے تیار ہونا شروع کر سکتا ہے اور ہماری زندگیوں کو متاثر کرنا شروع کر سکتا ہے، یہ دوسری اختراعات اور ٹیکنالوجیز کی تکمیل کیسے کرتا ہے، اور اسے آگے بڑھانے کے لیے کیا ضروری ہے۔  

نیورو اے آئی کیا ہے؟

نیورو اے آئی ایک ابھرتا ہوا ڈسپلن ہے جو 1) بہتر مصنوعی ذہانت بنانے کا طریقہ سیکھنے کے لیے دماغ کا مطالعہ کرتا ہے اور 2) دماغ کو بہتر طور پر سمجھنے کے لیے مصنوعی ذہانت کا استعمال کرتا ہے۔ نیورو اے آئی کے بنیادی ٹولز میں سے ایک مخصوص دماغی افعال کے کمپیوٹر ماڈل بنانے کے لیے مصنوعی نیورل نیٹ کا استعمال کر رہا ہے۔ یہ نقطہ نظر 2014 میں شروع کیا گیا تھا، جب محققین نے ایم ائی ٹی اور کولمبیا ظاہر ہوا کہ گہرے مصنوعی عصبی جال دماغ کے اس حصے میں ردعمل کی وضاحت کر سکتے ہیں جو آبجیکٹ کی شناخت کرتا ہے: inferotemporal cortex (IT)۔ انہوں نے مصنوعی اعصابی جال کا دماغ سے موازنہ کرنے کا ایک بنیادی نسخہ پیش کیا۔ اس نسخے کا استعمال کرتے ہوئے اور دماغی عملوں میں تکراری جانچ کو دہرانا - شکل کی شناخت، حرکت پروسیسنگ، اسپیچ پروسیسنگ، بازو کا کنٹرول، مقامی میموری - سائنس دان دماغ کے لیے کمپیوٹر ماڈلز کا ایک پیچ ورک بنا رہے ہیں۔ 

دماغ کا مشینوں سے موازنہ کرنے کا نسخہ

تو آپ NeuroAI ماڈل کیسے بناتے ہیں؟ 2014 میں اپنے آغاز کے بعد سے، فیلڈ نے ایک ہی بنیادی ترکیب کی پیروی کی ہے:

1. کسی کام کو حل کرنے کے لیے سلیکو میں مصنوعی نیورل نیٹ ورکس کو تربیت دیں، مثال کے طور پر آبجیکٹ کی شناخت کے لیے۔ نتیجے میں آنے والے نیٹ ورک کو ٹاسک آپٹمائزڈ کہا جاتا ہے۔ اہم بات یہ ہے کہ اس میں عام طور پر صرف تصاویر، فلموں اور آوازوں کی تربیت شامل ہوتی ہے نہ کہ دماغی ڈیٹا۔

2. تربیت یافتہ مصنوعی اعصابی نیٹ ورکس کی انٹرمیڈیٹ ایکٹیویشن کا حقیقی دماغی ریکارڈنگ سے موازنہ کریں۔ موازنہ شماریاتی تکنیکوں کا استعمال کرتے ہوئے کیا جاتا ہے جیسے لکیری رجعت یا نمائندگی کی مماثلت کا تجزیہ۔

3. دماغ کے ان علاقوں کے موجودہ بہترین ماڈل کے طور پر بہترین کارکردگی کا مظاہرہ کرنے والے ماڈل کو منتخب کریں۔

یہ نسخہ دماغ کے اندر اکٹھے کیے گئے ڈیٹا کے ساتھ سنگل نیوران یا غیر جارحانہ تکنیکوں جیسے میگنیٹو انسیفالوگرافی (MEG) یا فنکشنل میگنیٹک ریزوننس امیجنگ (fMRI) سے لاگو کیا جا سکتا ہے۔

دماغ کے حصے کے نیورو اے آئی ماڈل میں دو اہم خصوصیات ہیں۔ یہ کمپیوٹیبل ہے: ہم اس کمپیوٹر ماڈل کو ایک محرک فراہم کر سکتے ہیں اور یہ ہمیں بتائے گا کہ دماغی علاقہ کس طرح کا رد عمل ظاہر کرے گا۔ یہ فرق بھی ہے: یہ ایک گہرا اعصابی جال ہے جسے ہم اسی طرح بہتر بنا سکتے ہیں جس طرح ہم بصری شناخت اور قدرتی زبان کی پروسیسنگ کو حل کرنے والے ماڈلز کو بہتر بناتے ہیں۔ اس کا مطلب ہے کہ نیورو سائنسدانوں کو تمام طاقتور ٹولنگ تک رسائی حاصل ہوتی ہے جس نے گہری سیکھنے کے انقلاب کو تقویت بخشی ہے، بشمول ٹینسر الجبرا سسٹم جیسے PyTorch اور TensorFlow۔ 

اس کا کیا مطلب ہے؟ ہم دماغ کے بڑے حصوں کو نہ سمجھنے سے ایک دہائی سے بھی کم عرصے میں اس کے اچھے ماڈل ڈاؤن لوڈ کرنے کے قابل ہو گئے۔ صحیح سرمایہ کاری کے ساتھ، ہمارے پاس جلد ہی دماغ کے بڑے حصوں کے بہترین ماڈل ہوں گے۔ بصری نظام کو سب سے پہلے ماڈل بنایا گیا تھا۔ سمعی نظام بھی پیچھے نہیں تھا۔; اور دوسرے علاقے یقیناً ڈومینوز کی طرح گریں گے کیونکہ نڈر نیورو سائنسدان دماغ کے اسرار کو حل کرنے کے لیے دوڑتے ہیں۔ ہمارے فکری تجسس کی تسکین کے علاوہ – سائنسدانوں کے لیے ایک بڑا محرک!– یہ اختراع کسی بھی پروگرامر کو دماغ کے اچھے ماڈلز ڈاؤن لوڈ کرنے اور بے شمار ایپلی کیشنز کو غیر مقفل کرنے کی اجازت دے گی۔

درخواست علاقوں

آرٹ اور ایڈورٹائزنگ

آئیے اس سادہ بنیاد کے ساتھ شروع کریں: 99% میڈیا جس کا ہم تجربہ کرتے ہیں وہ ہماری آنکھوں اور کانوں سے ہوتا ہے۔ ایسی پوری صنعتیں ہیں جن کو ان حواس میں صحیح پکسلز اور ٹونز فراہم کرنے کے لیے ابالا جا سکتا ہے: بصری فن، ڈیزائن، فلمیں، گیمز، موسیقی اور اشتہارات ان میں سے چند ہیں۔ اب، یہ ہماری آنکھیں اور کان خود نہیں ہیں جو ان تجربات کی ترجمانی کرتے ہیں، کیونکہ وہ محض سینسر ہیں: یہ ہمارا دماغ ہے جو اس معلومات کو سمجھتا ہے۔ میڈیا کو مطلع کرنے، تفریح ​​​​کرنے، مطلوبہ جذبات کو جنم دینے کے لیے بنایا گیا ہے۔ لیکن اس بات کا تعین کرنا کہ آیا کسی پینٹنگ، پروفیشنل ہیڈ شاٹ یا اشتہار میں پیغام کو مطلوبہ طور پر موصول ہوا ہے، آزمائش اور غلطی میں ایک مایوس کن مشق ہے: انسانوں کو اس بات کا تعین کرنے کے لیے لوپ میں رہنا ہوگا کہ آیا پیغام ہٹ جاتا ہے، جو مہنگا اور وقت ہے۔ استعمال

بڑے پیمانے پر آن لائن سروسز نے ٹرائل اور ایرر: A/B ٹیسٹ کو خودکار بنا کر اس کے ارد گرد کے طریقے تلاش کیے ہیں۔ گوگل مشہور طور پر تلاش کے انجن کے نتائج کے صفحہ پر لنکس کے لیے نیلے رنگ کے 50 شیڈز میں سے کون سا استعمال کرنا ہے۔ دی گارڈین کے مطابق، بہترین انتخاب کی وجہ سے 200 میں 2009M$ کی بیس لائن پر، یا تقریباً آمدنی میں بہتری آئی اس وقت Google کی آمدنی کا 1%. Netflix تھمب نیلز کو اپنی مرضی کے مطابق بناتا ہے۔ اپنے صارف کے تجربے کو بہتر بنانے کے لیے ناظرین کو۔ یہ طریقے بڑے پیمانے پر ٹریفک والے آن لائن جنات کے لیے دستیاب ہیں، جو لوگوں کے رویے میں موجود شور پر قابو پا سکتے ہیں۔

کیا ہوگا اگر ہم یہ اندازہ لگا سکیں کہ کوئی ڈیٹا حاصل کرنے سے پہلے لوگ میڈیا پر کیا ردعمل ظاہر کریں گے؟ اس سے چھوٹے کاروباروں کے لیے پہلے سے موجود کم کرشن ہونے کے باوجود اپنے تحریری مواد اور ویب سائٹس کو بہتر بنانا ممکن ہو جائے گا۔ NeuroAI یہ اندازہ لگانے کے قابل ہونے کے قریب سے قریب تر ہوتا جا رہا ہے کہ لوگ بصری مواد پر کیا ردعمل ظاہر کریں گے۔ مثال کے طور پر، محققین Adobe میں ٹولز پر کام کر رہے ہیں۔ پیشین گوئی اور عکاسیوں میں بصری توجہ کی ہدایت کرنے کے لیے۔

محققین نے انہیں بنانے کے لیے تصاویر میں ترمیم کرنے کا بھی مظاہرہ کیا ہے۔ زیادہ ضعف یادگار یا جمالیاتی لحاظ سے خوش کن مثال کے طور پر، اس کا استعمال خود بخود ایک پیشہ ور ہیڈ شاٹ کو منتخب کرنے کے لیے کیا جا سکتا ہے جو سب سے زیادہ اس تصویر کے ساتھ منسلک ہوتا ہے جسے لوگ خود پیش کرنا چاہتے ہیں – پیشہ ورانہ، سنجیدہ، یا تخلیقی۔ مصنوعی عصبی نیٹ ورک حقیقت پسندانہ تصاویر سے زیادہ مؤثر طریقے سے پیغامات پہنچانے کے طریقے بھی تلاش کر سکتے ہیں۔ OpenAI کی CLIP کو ایسی تصاویر تلاش کرنے کے لیے جانچا جا سکتا ہے جو جذبات سے منسلک ہوں۔ جھٹکے کے تصور کے ساتھ بہترین طور پر منسلک تصویر Munch's Scream کے آگے جگہ سے باہر نہیں ہوگی۔

OpenAI CLIP جھٹکے کے تصور کے لیے زیادہ سے زیادہ تصویر۔ OpenAI مائکروسکوپ کے ذریعے، CC-BY 4.0 کے تحت جاری کیا گیا۔

پچھلے سال کے دوران، OpenAI اور Google نے متن کے اشارے سے فوٹو ریئلسٹک امیجز بنانے کی متاثر کن صلاحیت کے ساتھ تخلیقی آرٹ نیٹ ورکس کا مظاہرہ کیا ہے۔ ہم نے موسیقی کے لیے اس لمحے کو کافی حد تک متاثر نہیں کیا، لیکن جنریٹیو ماڈلز میں ترقی کی رفتار کے ساتھ، یہ اگلے چند سالوں میں ضرور ہوگا۔ ایسی مشینیں بنا کر جو انسانوں کی طرح سن سکیں، ہم موسیقی کی پیداوار کو جمہوری بنانے کے قابل ہو سکتے ہیں، کسی کو بھی وہ کام کرنے کی صلاحیت فراہم کر سکتے ہیں جو انتہائی ہنر مند میوزک پروڈیوسرز کر سکتے ہیں: کورس کے دوران صحیح جذبات کا اظہار کرنا، خواہ اداسی ہو یا خوشی؛ ایک راگ کی ایک کان کیڑا بنانے کے لئے؛ یا کسی ٹکڑے کو ناقابل تلافی رقص کے قابل بنانا۔

آڈیو ویژول میڈیا، ویب سائٹس، اور خاص طور پر اشتہارات کو بہتر بنانے کے لیے مارکیٹ کے زبردست دباؤ ہیں، اور ہم پہلے ہی اس عمل میں نیورو اے آئی اور الگورتھمک آرٹ کو مربوط کر رہے ہیں۔ یہ دباؤ ایک نیکی کے چکر کی طرف لے جائے گا جہاں نیورو اے آئی بہتر اور زیادہ مفید ہو جائے گا کیونکہ عملی ایپلی کیشنز میں مزید وسائل ڈالے جائیں گے۔ اس کا ایک ضمنی اثر یہ ہے کہ ہمیں دماغ کے بہت اچھے ماڈل ملیں گے جو اشتہارات سے باہر بھی کارآمد ہوں گے۔ 

رسائی اور الگورتھمک ڈیزائن

نیورو اے آئی کی سب سے دلچسپ ایپلی کیشنز میں سے ایک قابل رسائی ہے۔ زیادہ تر میڈیا "اوسط" فرد کے لیے ڈیزائن کیا گیا ہے، پھر بھی ہم سب بصری اور سمعی معلومات پر مختلف طریقے سے کارروائی کرتے ہیں۔ 8% مرد، اور 0.5% خواتین سرخ سبز رنگ کے نابینا ہیں، اور میڈیا کی ایک بڑی مقدار ان کی ضروریات کے مطابق نہیں ہے۔ آج کل کلر بلائنڈنس کی نقل کرنے والی بہت سی پروڈکٹس ہیں، لیکن نتائج کی تشریح کرنے اور ضروری تبدیلیاں کرنے کے لیے نارمل رنگ بصارت والے شخص کی ضرورت ہوتی ہے۔ جامد رنگ کی ری میپنگ ان ضروریات کے لیے بھی کام نہیں کرتی ہے، کیونکہ کچھ مواد کلر ری میپنگ کے ساتھ اپنے سیمنٹکس کو محفوظ نہیں کرتے ہیں (مثلاً گراف جو پڑھنا مشکل ہو جاتے ہیں)۔ ہم نیورو اے آئی طریقوں کے ذریعے رنگین اندھے پن سے محفوظ مواد اور ویب سائٹس کی نسل کو خودکار کر سکتے ہیں جو موجودہ گرافکس کے سیمنٹکس کو برقرار رکھتے ہیں۔

ایک اور مثال سیکھنے کی معذوری کے شکار لوگوں کی مدد کرنا ہے، جیسے ڈسلیکسیا، جو دنیا بھر میں 10% لوگوں کو متاثر کرتی ہے۔ dyslexia میں بنیادی مسائل میں سے ایک ہے بھیڑ کے لئے حساسیتجو کہ اسی طرح کی بنیادی خصوصیات کے ساتھ شکلوں کو پہچاننے میں دشواری ہے، بشمول آئینے کے متوازی حروف جیسے p اور q۔ ایم آئی ٹی میں این ہیرنگٹن اور آرٹورو ڈیزا نیورو اے آئی ماڈلز پر کام کر رہے ہیں۔ کہ ماڈل اس اثر اور کچھ بہت امید افزا نتائج حاصل کرنا۔ ایسے فونٹس کو ڈیزائن کرنے کے لیے dyslexic بصری نظام کے ماڈلز لینے کا تصور کریں جو جمالیاتی لحاظ سے خوشگوار اور پڑھنے میں آسان ہوں۔ ایک مخصوص شخص کے بصری نظام کے بارے میں صحیح ڈیٹا کے ساتھ، ہم بھی کر سکتے ہیں۔ فونٹ کو کسی مخصوص فرد کے لیے ذاتی بنائیں، جس نے پڑھنے کی کارکردگی کو بہتر بنانے کا وعدہ دکھایا ہے۔ یہ یہاں منتظر زندگی کے معیار میں ممکنہ طور پر بڑی بہتری ہیں۔

صحت

بہت سے نیورو سائنسدان اس امید کے ساتھ میدان میں داخل ہوتے ہیں کہ ان کی تحقیق انسانی صحت پر مثبت اثر ڈالے گی، خاص طور پر ان لوگوں کے لیے جو اعصابی عوارض یا دماغی صحت کے مسائل میں مبتلا ہیں۔ مجھے پوری امید ہے کہ نیورو اے آئی نئے علاج کو کھول دے گا: دماغ کے اچھے ماڈل کے ساتھ، ہم صحیح محرکات تیار کر سکتے ہیں تاکہ صحیح پیغام اس تک پہنچ جائے، جیسے ایک چابی تالے میں فٹ بیٹھتی ہے۔ اس لحاظ سے، نیورو اے آئی کو الگورتھمک ڈرگ ڈیزائن پر اسی طرح لاگو کیا جا سکتا ہے، لیکن چھوٹے مالیکیولز کے بجائے، ہم تصاویر اور آوازیں فراہم کرتے ہیں۔ 

سب سے زیادہ قابل رسائی مسائل میں آنکھوں اور کانوں کے رسیپٹرز شامل ہیں، جو پہلے سے ہی اچھی طرح سے خصوصیات ہیں. لاکھوں لوگوں نے کوکلیئر امپلانٹس، نیورو پروسٹیٹکس حاصل کیے ہیں جو کان کے کوکلیا کو برقی طور پر متحرک کرتے ہیں، جس سے بہرے یا سننے سے محروم افراد دوبارہ سن سکتے ہیں۔ یہ امپلانٹس، جن میں چند درجن الیکٹروڈ ہوتے ہیں، ایک سے زیادہ اسپیکر کے ساتھ شور والے ماحول میں استعمال کرنا مشکل ہو سکتا ہے۔ دماغی ماڈل کر سکتا ہے۔ امپلانٹ کے محرک پیٹرن کو بہتر بنائیں تقریر کو بڑھانے کے لئے. قابل ذکر بات یہ ہے کہ امپلانٹس والے لوگوں کے لیے تیار کی گئی اس ٹیکنالوجی کو ریئل ٹائم میں آوازوں میں ترمیم کرکے تقریر کو بہتر طریقے سے سمجھنے میں مدد کرنے کے لیے استعمال کیا جا سکتا ہے، چاہے انہیں سمعی پروسیسنگ کی خرابی ہو یا وہ اکثر اونچی آواز میں ہوں۔

بہت سے لوگ اپنی زندگی بھر اپنے حسی نظام میں تبدیلیوں کا تجربہ کرتے ہیں، چاہے وہ موتیا کی سرجری سے صحت یاب ہو رہا ہو یا عمر کے ساتھ قریب سے نظر آنے والا ہو۔ ہم جانتے ہیں کہ اس طرح کی تبدیلی کے بعد، لوگ دہرانے کے ذریعے دنیا کی درست تشریح کرنا سیکھ سکتے ہیں، ایک ایسا رجحان جسے ادراک سیکھنا کہا جاتا ہے۔ ہم اس ادراک سیکھنے کو زیادہ سے زیادہ کرنے کے قابل ہو سکتے ہیں تاکہ لوگ تیزی سے اور زیادہ مؤثر طریقے سے اپنی صلاحیتوں کو دوبارہ حاصل کر سکیں۔ اسی طرح کا خیال ان لوگوں کی مدد کرسکتا ہے جو فالج کے بعد اپنے اعضاء کو روانی سے حرکت دینے کی صلاحیت کھو چکے ہیں۔ اگر ہم دماغ کو بہتر طریقے سے مضبوط کرنے کے لیے حرکات کی صحیح ترتیب تلاش کر سکتے ہیں، تو ہم فالج سے بچ جانے والوں کو مزید کام کرنے میں مدد کر سکتے ہیں، جیسے زیادہ روانی سے چلنا یا بغیر چھلکے کافی کا کپ پکڑنا۔ لوگوں کو کھوئے ہوئے جسمانی افعال کو بحال کرنے میں مدد کرنے کے علاوہ، یہی خیال صحت مند لوگوں کو اعلیٰ حسی کارکردگی تک پہنچنے میں مدد دے سکتا ہے – چاہے وہ بیس بال کے کھلاڑی ہوں، تیرانداز ہوں یا پیتھالوجسٹ ہوں۔

آخر میں، ہم ان خیالات کو موڈ کی خرابیوں کے علاج پر لاگو ہوتے دیکھ سکتے ہیں۔ میں وبائی امراض کے دوران اپنی بوریت کو دور کرنے کے لیے بہت سے بصری آرٹ شوز میں گیا، اور اس سے میرا موڈ بہت بلند ہوا۔ بصری فن اور موسیقی ہماری روحوں کو بلند کر سکتے ہیں، اور یہ اس تصور کا ثبوت ہے کہ ہم حواس کے ذریعے موڈ کی خرابیوں کا علاج فراہم کرنے کے قابل۔ ہم جانتے ہیں کہ برقی محرک کے ساتھ دماغ کے مخصوص حصوں کی سرگرمی کو کنٹرول کرنے سے علاج کے خلاف مزاحمتی ڈپریشن سے نجات مل سکتی ہے۔ شاید دماغ کی سرگرمیوں کو بالواسطہ طور پر حواس کے ذریعے کنٹرول کرنا بھی اسی طرح کے اثرات دکھا سکتا ہے۔ سادہ ماڈلز - کم لٹکنے والے پھل - جو دماغ کے اچھی طرح سے سمجھے جانے والے حصوں کو متاثر کرتے ہیں، کی تعیناتی سے، ہم مزید پیچیدہ ماڈلز بنانے پر گیند ڈالیں گے جو انسانی صحت کی مدد کر سکتے ہیں۔ 

ٹیکنالوجی کے رجحانات کو فعال کرنا

نیورو اے آئی کو ایپلی کیشنز میں قابو پانے اور تعینات کرنے میں کئی سال لگیں گے، اور یہ ٹیکنالوجی کے دیگر ابھرتے ہوئے رجحانات کو روک دے گا۔ یہاں میں خاص طور پر دو رجحانات کو نمایاں کرتا ہوں جو نیورو اے آئی کو کہیں زیادہ طاقتور بنائیں گے: اگمینٹڈ رئیلٹی (اے آر)، جو محرکات کو درست طریقے سے فراہم کر سکتا ہے۔ اور دماغی کمپیوٹر انٹرفیس (BCI)، جو دماغی سرگرمی کی پیمائش کر سکتے ہیں تاکہ اس بات کی تصدیق کی جا سکے کہ محرکات متوقع طریقے سے کام کرتے ہیں۔  

فروزاں حقیقت

ایک رجحان جو نیورو اے آئی ایپلی کیشنز کو کہیں زیادہ طاقتور بنائے گا وہ ہے اگمینٹڈ ریئلٹی گلاسز کو اپنانا۔ Augmented reality (AR) میں ایک ہر جگہ کمپیوٹنگ پلیٹ فارم بننے کی صلاحیت ہے، کیونکہ AR روزمرہ کی زندگی میں ضم ہو جاتا ہے۔

میٹا ریئلٹی لیبز کے چیف سائنس دان مائیکل ابرش کا مفروضہ یہ ہے کہ اگر آپ کافی قابل AR شیشے بناتے ہیں تو ہر کوئی انہیں چاہے گا۔ یعنی عمارت دنیا سے آگاہ شیشے جو مسلسل دنیا میں بند ورچوئل اشیاء بنا سکتے ہیں۔; ہلکے اور فیشن کے فریم, Ray-Bans کی ایک جوڑی کی طرح؛ اور آپ کو حقیقی زندگی کی سپر پاور دینا، جیسے قابل ہونا فاصلے سے قطع نظر لوگوں کے ساتھ قدرتی طور پر بات چیت کریں۔ اور آپ کی سماعت میں اضافہ. اگر آپ ان کو بنا سکتے ہیں – ایک بہت بڑا تکنیکی چیلنج – اے آر شیشے آئی فون جیسی رفتار کی پیروی کر سکتے ہیں، اس طرح کہ لانچ کے 5 سال بعد ہر ایک کے پاس ایک (یا دستک) ہوگا۔

اس کو حقیقت بنانے کے لیے، میٹا نے خرچ کیا۔ میٹاورس کے لیے R&D پر پچھلے سال 10 بلین ڈالر. اگرچہ ہم یقینی طور پر نہیں جانتے کہ ایپل کیا ہے، وہاں موجود ہیں۔ مضبوط نشانیاں کہ وہ اے آر شیشوں پر کام کر رہے ہیں۔. لہذا AR کو انجام دینے کے لئے سپلائی کی طرف ایک زبردست دھکا بھی ہے۔

یہ ایک ڈسپلے ڈیوائس کو وسیع پیمانے پر دستیاب کرے گا جو آج کی جامد اسکرینوں سے کہیں زیادہ طاقتور ہے۔ اگر یہ VR کی رفتار کی پیروی کرتا ہے۔، اس میں آخر کار آنکھوں سے باخبر رہنے کا انٹیگریٹڈ ہوگا۔ اس کا مطلب یہ ہوگا کہ محرکات کو پیش کرنے کا ایک وسیع پیمانے پر دستیاب طریقہ جو اس وقت ممکن ہے سے کہیں زیادہ کنٹرول شدہ ہے، نیورو سائنسدانوں کے لیے ایک خواب۔ اور ان آلات میں صحت سے متعلق بہت دور رس ایپلی کیشنز ہونے کا امکان ہے، جیسا کہ مائیکل ابرش نے 2017 میں بتایا تھا۔جیسے کم روشنی والی بصارت کو بڑھانا، یا میکولر انحطاط کے باوجود لوگوں کو نارمل زندگی گزارنے کے قابل بنانا۔

نیورو اے آئی کی اہمیت واضح ہے: ہم روزمرہ کی زندگی میں مسلسل بنیادوں پر انتہائی کنٹرول شدہ طریقے سے صحیح محرک فراہم کر سکتے ہیں۔ یہ بصارت کے لیے درست ہے، اور شاید کم واضح طور پر سماعت کے لیے، کیونکہ ہم مقامی آڈیو فراہم کر سکتے ہیں۔ اس کا مطلب یہ ہے کہ نیورولوجیکل مسائل والے لوگوں کے لیے نیورو اے آئی کے علاج یا رسائی میں بہتری لانے کے لیے ہمارے ٹولز کہیں زیادہ طاقتور ہو جائیں گے۔

BCI

ایک زبردست ڈسپلے اور سپیکرز کے ساتھ، ہم دماغ میں آنے والے اہم ان پٹس کو ٹھیک ٹھیک کنٹرول کر سکتے ہیں۔ حواس کے ذریعے محرکات فراہم کرنے کا اگلا، زیادہ طاقتور مرحلہ اس بات کی تصدیق کرنا ہے کہ دماغ صرف پڑھنے کے لیے دماغ کمپیوٹر انٹرفیس (BCI) کے ذریعے متوقع طریقے سے رد عمل ظاہر کر رہا ہے۔ اس طرح، ہم دماغ پر محرکات کے اثرات کی پیمائش کر سکتے ہیں، اور اگر وہ توقع کے مطابق نہیں ہیں، تو ہم اس کے مطابق ایڈجسٹ کر سکتے ہیں جسے بند لوپ کنٹرول کہا جاتا ہے۔ 

واضح کرنے کے لیے، یہاں میں BCI طریقوں کے بارے میں بات نہیں کر رہا ہوں جیسے نیورالنک کی چپ یا گہری دماغی محرکات جو کھوپڑی کے اندر جاتے ہیں۔ ان مقاصد کے لیے کھوپڑی سے باہر دماغی سرگرمی کی پیمائش کرنا کافی ہے۔ دماغ کو براہ راست متحرک کرنے کی بھی ضرورت نہیں: دماغ کے زیادہ تر ان پٹ کو کنٹرول کرنے کے لیے آپ کو صرف شیشے اور ہیڈ فون کی ضرورت ہے۔

بہت سے غیر حملہ آور صرف پڑھنے کے لیے BCIs ہیں جو آج کمرشلائز کیے گئے ہیں یا پائپ لائن میں ہیں جنہیں بند لوپ کنٹرول کے لیے استعمال کیا جا سکتا ہے۔ کچھ مثالوں میں شامل ہیں:

  • ای ای جی۔ Electroencephalography کھوپڑی کے باہر دماغ کی برقی سرگرمی کی پیمائش کرتی ہے۔ چونکہ کھوپڑی ایک حجم کنڈکٹر کے طور پر کام کرتی ہے، اس لیے ای ای جی میں وقتی ریزولوشن زیادہ ہے لیکن مقامی ریزولوشن کم ہے۔ جبکہ اس میں مراقبہ کی مصنوعات تک صارفین کی درخواست محدود ہے (چنتن) اور niche neuromarketing ایپلی کیشنز، میں بند لوپ کنٹرول کے تناظر میں اس کے کچھ استعمالات پر خوش ہوں۔ جب محرک پر کسی کا کنٹرول ہوتا ہے تو EEG بہت زیادہ طاقتور ہو سکتا ہے، کیونکہ پیش کردہ محرک کو EEG سگنل کے ساتھ جوڑنا اور ڈی کوڈ کرنا ممکن ہے کہ کوئی شخص کس چیز پر توجہ دے رہا ہے (ممکنہ طریقوں کو جنم دیا)۔ درحقیقت، نیکسٹ مائنڈ، جس نے ای ای جی کی بنیاد پر "مائنڈ کلک" کو پیدا کیا تھا، کو حاصل کیا گیا تھا۔ سنیپ کی طرف سے، جو اب اے آر مصنوعات بنا رہا ہے۔ اوپن بی سی آئی ہے۔ منصوبہ بندی ایک ہیڈ سیٹ جاری کرنے کے لیے جو اپنے EEG سینسر کو Varjo کے ہائی اینڈ ایرو ہیڈسیٹ کے ساتھ مربوط کرتا ہے۔ میں ای ای جی کو شمار نہیں کروں گا۔
  • ایف ایم آر آئی فنکشنل مقناطیسی گونج امیجنگ عصبی سرگرمی سے وابستہ خون کی آکسیجن میں چھوٹی تبدیلیوں کی پیمائش کرتی ہے۔ یہ سست ہے، یہ پورٹیبل نہیں ہے، اسے اپنا کمرہ درکار ہے اور یہ بہت مہنگا ہے۔ تاہم، fMRI وہ واحد ٹیکنالوجی ہے جو دماغ کی گہرائی میں ہونے والی سرگرمی کو غیر جارحانہ طور پر درست طریقے سے پڑھ سکتی ہے۔ دو نمونے ہیں جو کافی حد تک پختہ ہیں اور بند لوپ نیورل کنٹرول کے لیے متعلقہ ہیں۔ پہلا ایف ایم آر آئی پر مبنی بائیو فیڈ بیک ہے۔ ایف ایم آر آئی کا ایک ذیلی فیلڈ اس سے پتہ چلتا ہے کہ لوگ اپنی دماغی سرگرمی کو اسکرین یا ہیڈ فون پر بصری طور پر پیش کر کے اسے تبدیل کر سکتے ہیں۔ دوسرا کارٹیکل میپنگ ہے، بشمول آبادی کو قبول کرنے والے شعبوں جیسے نقطہ نظر اور مووی کلپس کے ساتھ ووکسیل سلیکٹیوٹی کا اندازہ لگانا یا پوڈ کاسٹ، جو کسی کو اندازہ لگانے کی اجازت دیتے ہیں کہ دماغ کے مختلف حصے مختلف بصری اور سمعی محرکات کا کیا جواب دیتے ہیں۔ یہ دو طریقے اشارہ کرتے ہیں کہ یہ اندازہ لگانا ممکن ہونا چاہیے کہ نیورو اے آئی کی مداخلت دماغ پر کس طرح اثر انداز ہوتی ہے اور اسے زیادہ موثر بنانے کے لیے آگے بڑھاتی ہے۔
  • fNIRS. فنکشنل نزد انفراریڈ سپیکٹروسکوپی ٹرانسمیٹر اور رسیپٹر کے درمیان دماغی خون کے حجم کا اندازہ لگانے کے لیے پھیلی ہوئی روشنی کا استعمال کرتی ہے۔ یہ اس حقیقت پر انحصار کرتا ہے کہ خون مبہم ہے اور اعصابی سرگرمی میں اضافہ دماغی حجم میں تاخیر سے خون کی آمد کا باعث بنتا ہے (ایف ایم آر آئی جیسا اصول)۔ روایتی NIRS میں مقامی ریزولوشن کم ہے، لیکن ٹائم گیٹنگ (TD-NIRS) اور بڑے پیمانے پر اوور سیمپلنگ (ڈففیوز آپٹیکل ٹوموگرافی) کے ساتھ، مقامی ریزولوشن کہیں بہتر ہے۔ تعلیمی محاذ پر، WUSTL میں جو کلور کا گروپ بصری پرانتستا سے فلموں کی ضابطہ کشائی کا مظاہرہ کیا ہے۔ تجارتی محاذ پر، کرنل اب ہے۔ TD-NIRS ہیڈسیٹ بنانا اور بھیجنا جو انجینئرنگ کے متاثر کن کارنامے ہیں۔ اور یہ ایک ایسا علاقہ ہے جہاں لوگ آگے بڑھتے رہتے ہیں اور ترقی تیزی سے ہوتی ہے۔ میٹا میں میرے پرانے گروپ نے متعلقہ تکنیک میں سگنل ٹو شور کے تناسب میں 32 گنا بہتری کا مظاہرہ کیا (جسے> 300 تک بڑھایا جا سکتا ہے).
  • ایم ای جی Magnetoencephalography مقناطیسی شعبوں میں چھوٹی تبدیلیوں کی پیمائش کرتا ہے، اس طرح دماغ کی سرگرمی کو مقامی بنانا۔ MEG EEG کی طرح ہے کہ یہ برقی مقناطیسی میدان میں تبدیلیوں کی پیمائش کرتا ہے، لیکن یہ حجم کی ترسیل سے متاثر نہیں ہوتا ہے اور اس وجہ سے بہتر مقامی ریزولوشن ہوتا ہے۔ پورٹ ایبل ایم ای جی جس کو ریفریجریشن کی ضرورت نہیں ہوتی ہے وہ نان ویوزیو بی سی آئی کے لیے گیم چینجر ہوگا۔ لوگ آپٹیکلی پمپ والے میگنیٹومیٹر کے ساتھ ترقی کر رہے ہیں، اور یہ ممکن ہے کہ اوپن مارکیٹ میں انفرادی OPM سینسرز کو مینوفیکچررز جیسے QuSpin سے خریدیں۔

ان معروف تکنیکوں کے علاوہ، کچھ ڈارک ہارس ٹیکنالوجیز جیسے ڈیجیٹل ہولوگرافی، فوٹو اکوسٹک ٹوموگرافی، اور فنکشنل الٹراساؤنڈ اس جگہ میں تیزی سے پیراڈیم شفٹ کا باعث بن سکتی ہیں۔

جب کہ صارف کے درجے کا غیر حملہ آور BCI ابھی ابتدائی دور میں ہے، AR کے استعمال کے معاملات کے ارد گرد مارکیٹ کے بہت سے دباؤ ہیں جو پائی کو بڑا بنا دیں گے۔ درحقیقت، اے آر کے لیے ایک اہم مسئلہ ڈیوائس کو کنٹرول کرنا ہے: اگر آپ اس سے بچ سکتے ہیں تو آپ کو کنٹرولر کے ساتھ گھومنا یا اپنے شیشوں پر بڑبڑانا نہیں پڑے گا۔ کمپنیاں اس مسئلے کو حل کرنے میں کافی سنجیدہ ہیں، جیسا کہ فیس بک کی جانب سے CTRL+Labs خریدنا اس کا ثبوت ہے۔ 2019 میں، نیکسٹ مائنڈ حاصل کرنے کا سنیپ، اور والو اوپن بی سی آئی کے ساتھ مل کر کام کر رہا ہے۔ اس طرح، ہم کم جہتی BCIs کو تیزی سے تیار ہوتے دیکھ سکتے ہیں۔ اعلی جہتی BCIs اسی رفتار کی پیروی کر سکتے ہیں اگر انہیں AR جیسی قاتل ایپ ملتی ہے۔ یہ ممکن ہے کہ میں یہاں جس قسم کی نیورو اے آئی ایپلی کیشنز کی وکالت کرتا ہوں اس ٹیکنالوجی کے لیے بالکل درست استعمال کا معاملہ ہو۔

اگر ہم آنکھوں اور کانوں کے ان پٹ کو کنٹرول کرنے کے ساتھ ساتھ دماغ کی حالتوں کی درست پیمائش کر سکتے ہیں، تو ہم زیادہ سے زیادہ افادیت کے لیے نیورو اے آئی پر مبنی علاج فراہم کر سکتے ہیں۔

میدان سے کیا غائب ہے۔

NeuroAI ایپلی کیشنز کے پیچھے بنیادی سائنس تیزی سے پختہ ہو رہی ہے، اور بہت سے مثبت رجحانات ہیں جو اس کے عمومی اطلاق میں اضافہ کریں گے۔ تو نیورو اے آئی ایپلی کیشنز کو مارکیٹ میں لانے میں کیا کمی ہے؟

  1. ٹولنگ۔ AI کے اندر دیگر ذیلی فیلڈز نے ٹول باکسز سے زبردست فائدہ اٹھایا ہے جو تیزی سے پیشرفت اور نتائج کے اشتراک کو قابل بناتے ہیں۔ اس میں ٹینسر الجبرا لائبریریاں جیسے ٹینسر فلو اور پائ ٹارچ، اوپن اے آئی جم جیسے تربیتی ماحول اور ڈیٹا شیئر کرنے کے لیے ماحولیاتی نظام اور 🤗 HuggingFace جیسے ماڈلز شامل ہیں۔ ماڈلز اور طریقوں کا ایک مرکزی ذخیرہ، نیز ایویلیویشن سویٹس، ممکنہ طور پر وافر نقلی ڈیٹا کا فائدہ اٹھاتے ہوئے، فیلڈ کو آگے بڑھائے گا۔ اوپن سورس نیورو سائنس تنظیموں کی پہلے سے ہی ایک مضبوط کمیونٹی موجود ہے، اور وہ ان کوششوں کے لیے قدرتی میزبان کے طور پر کام کر سکتی ہیں۔
  2. ٹیلنٹ بہت کم تعداد میں ایسی جگہیں ہیں جہاں نیورو سائنس اور اے آئی کے چوراہے پر تحقیق اور ترقی کی جاتی ہے۔ بے ایریا، اسٹینفورڈ اور برکلے میں لیبز کے ساتھ، اور MIT اور ہارورڈ کی متعدد لیبز کے ساتھ بوسٹن میٹرو کے علاقے میں ممکنہ طور پر پہلے سے موجود وینچر کیپیٹل ایکو سسٹم سے زیادہ تر سرمایہ کاری دیکھنے کو ملے گی۔ تیسرا ممکنہ مرکز مونٹریال، کینیڈا ہے، جسے میک گل اور یونیورسیٹ ڈی مونٹریال میں نیورو سائنس کے بڑے محکموں نے اٹھایا، جو کہ مصنوعی ذہانت کے ادارے میلا کے ساتھ مل کر، جو AI کے علمبردار یوشوا بینجیو نے قائم کیا تھا۔ ہمارا فیلڈ خصوصی پی ایچ ڈی پروگراموں اور نیورو اے آئی میں سنٹرز آف ایکسی لینس سے فائدہ اٹھائے گا تاکہ کمرشلائزیشن کا آغاز کیا جا سکے۔
  3. طبی ایپلی کیشنز کے لیے نئے فنڈنگ ​​اور کمرشلائزیشن ماڈل۔ طبی ایپلی کیشنز کو کمرشلائزیشن کے لیے ایک طویل راستہ ہے، اور ٹیکنالوجی میں سرمایہ کاری کو خطرے سے بچانے کے لیے فنڈز حاصل کرنے کے لیے محفوظ دانشورانہ املاک عام طور پر ایک شرط ہے۔ AI پر مبنی اختراعات کو پیٹنٹ کرنا بدنام زمانہ مشکل ہے، اور سافٹ ویئر-as-a-medical-device (SaMD) صرف مارکیٹ میں آنا شروع ہو رہا ہے، جس سے کمرشلائزیشن کا راستہ غیر یقینی ہو گیا ہے۔ ہمیں فنڈز کی ضرورت ہوگی جو اس نوزائیدہ شعبے کی پرورش کے لیے AI اور طبی ٹیکنالوجی کی مہارت کو اکٹھا کرنے پر مرکوز ہوں۔ 

آئیے نیورو اے آئی بنائیں

سائنس دانوں اور فلسفیوں نے اس بات پر حیرانی کا اظہار کیا ہے کہ زمانہ قدیم سے دماغ کیسے کام کرتا ہے۔ ٹشو کی ایک پتلی چادر، ایک مربع فٹ رقبہ، ہمیں دیکھنے، سننے، محسوس کرنے اور سوچنے کے قابل کیسے بناتی ہے؟ NeuroAI کمپیوٹرز میں اعصابی نظام کے ماڈل بنا کر ان گہرے سوالات کو حل کرنے میں ہماری مدد کر رہا ہے۔ علم کی اس بنیادی پیاس کو پورا کرنے سے – انسان ہونے کا کیا مطلب ہے؟ - نیورو سائنسدان ایسے اوزار بھی بنا رہے ہیں جو لاکھوں لوگوں کو امیر زندگی گزارنے میں مدد کر سکتے ہیں۔

4 اگست 2022 کو پوسٹ کیا گیا۔

ٹیکنالوجی، اختراع، اور مستقبل، جیسا کہ اسے بنانے والوں نے بتایا ہے۔

سائن اپ کرنے کا شکریہ۔

استقبالیہ نوٹ کے لیے اپنا ان باکس چیک کریں۔

ٹائم اسٹیمپ:

سے زیادہ اندیسن Horowitz