AI چپ پہننے کے قابل، ڈرون پلیٹو بلاکچین ڈیٹا انٹیلی جنس میں استعمال کے لیے مزاحم ریم میں مصنوعی نیوران شامل کرتی ہے۔ عمودی تلاش۔ عی

AI چپ پہننے کے قابل، ڈرونز میں استعمال کے لیے مزاحم RAM میں مصنوعی نیوران شامل کرتی ہے

ایک نئے شائع شدہ تحقیقی مقالے میں ایک کمپیوٹ ان میموری (CIM) چپ کی وضاحت کی گئی ہے جو مصنوعی نیوران کو مزاحم RAM (RRAM) کے ساتھ جوڑتی ہے تاکہ AI ماڈل کے وزن کو اسی چپ پر ذخیرہ اور پروسیس کیا جاسکے۔

مزاحم بے ترتیب رسائی میموری پر مبنی ایک کمپیوٹ ان میموری چپ (بڑھانے کے لیے کلک کریں)۔ تصویر: وان وغیرہ

ڈیزائن کے پیچھے محققین کا دعویٰ ہے کہ یہ ایج ایپلی کیشنز کے لیے زیادہ موثر ہوگا کیونکہ یہ علیحدہ کمپیوٹ اور میموری بلاکس کے درمیان ڈیٹا کی نقل و حرکت کو ختم کرتا ہے۔

ایج کمپیوٹنگ اور مصنوعی ذہانت دونوں مستقبل قریب میں موسمیاتی ترقی کے راستے پر ہیں، کم از کم تجزیہ کار کمپنی IDC کے مطابق. کچھ منظرنامے ان کو ایک ساتھ جوڑ دیتے ہیں کیونکہ کنارے کی تعیناتی طاقت اور کنیکٹیویٹی پر مجبور ہوسکتی ہے، پھر بھی ڈیٹا کی اہم مقداروں کا تجزیہ کرنے اور واقعات کے لیے قریب قریب حقیقی وقت میں جواب دینے کی ضرورت ہے، جس سے ڈیوائس میں AI ماڈل "رہنے" کا بہترین حل ہے۔ .

اس کی روشنی میں، محققین کے ایک گروپ نے ایک چپ تیار کی ہے جسے NeuRRAM کہتے ہیں، کیونکہ یہ مصنوعی نیوران کو RRAM کے ساتھ ایک نئے فن تعمیر میں جوڑتا ہے۔ پروجیکٹ کا مقصد ایک ایسا ڈیزائن فراہم کرنا تھا جو بیک وقت اعلی توانائی کی کارکردگی کے ساتھ ساتھ مختلف AI ماڈلز کو سپورٹ کرنے کے لیے استعداد اور سافٹ ویئر میں ایک ہی ماڈل کو چلانے کے لیے موازنہ درستگی فراہم کر سکے۔

یہ پروجیکٹ ابتدائی طور پر نیچر سائنس فاؤنڈیشن کے ایک پروجیکٹ کے حصے کے طور پر شروع ہوا جسے "کمپیوٹنگ میں مہمات" کہا جاتا ہے۔ اس پروجیکٹ نے مختلف پس منظر کے حامل مختلف اداروں کے محققین کے ایک گروپ کو اکٹھا کیا، جن میں کچھ اسٹینفورڈ اور یو سی ایس ڈی کے ساتھ ساتھ چین کی سنگھوا یونیورسٹی کے محققین بھی شامل ہیں جو RRAM ڈیوائس فیبریکیشن کے ماہر ہیں۔

توانائی کی کارکردگی: بیٹری سے چلنے والے گیزمو پر AI کا اندازہ لگایا گیا ہے۔

سٹینفورڈ یونیورسٹی کے گریجویٹ محقق وئیر وان کے مطابق اور ان میں سے ایک کاغذ کے مصنفیننیچر میں کل شائع ہوا، نیو آر آر اے ایم کو ایک AI چپ کے طور پر تیار کیا گیا ہے جو AI تخمینہ کی توانائی کی کارکردگی کو بہت بہتر بناتا ہے، اس طرح پیچیدہ AI افعال کو براہ راست بیٹری سے چلنے والے ایج ڈیوائسز، جیسے کہ سمارٹ وئیر ایبلز، ڈرونز، اور صنعتی IoT سینسر کے اندر محسوس کیا جا سکتا ہے۔ .

"آج کے AI چپس میں، ڈیٹا پروسیسنگ اور ڈیٹا اسٹوریج الگ الگ جگہوں پر ہوتا ہے - کمپیوٹنگ یونٹ اور میموری یونٹ۔ ان یونٹس کے درمیان بار بار ڈیٹا کی نقل و حرکت سب سے زیادہ توانائی خرچ کرتی ہے اور ایج ڈیوائسز کے لیے کم طاقت والے AI پروسیسرز کو سمجھنے میں رکاوٹ بن جاتی ہے۔

اس کو حل کرنے کے لیے، NeuRRAM چپ ایک "کمپیوٹ-ان-میموری" ماڈل کو نافذ کرتی ہے، جہاں پروسیسنگ براہ راست میموری کے اندر ہوتی ہے۔ یہ مزاحمتی RAM (RRAM) کا بھی استعمال کرتا ہے، ایک میموری قسم جو جامد RAM کی طرح تیز ہے لیکن غیر اتار چڑھاؤ ہے، جس سے یہ AI ماڈل کے وزن کو ذخیرہ کرنے کی اجازت دیتا ہے۔ RRAM سیلز کی ایک اہم خصوصیت یہ ہے کہ عصبی وزن کو میموری سیلز میں مختلف کنڈکٹنس لیولز کے طور پر ذخیرہ کیا جا سکتا ہے، ڈیجیٹل ٹو اینالاگ کنورٹرز (DACs) کے ذریعے انکوڈ کیا جاتا ہے اور میموری سرنی کو کھلایا جاتا ہے۔

یہ سافٹ ویئر کا تخروپن نہیں ہے، یہ ہارڈ ویئر ہے۔

سی آئی ایم آرکیٹیکچرز کے بارے میں پچھلے مطالعات ہو چکے ہیں، لیکن یہ سافٹ ویئر سمولیشن کی بجائے ہارڈ ویئر میں اے آئی ایپلی کیشنز کی ایک وسیع رینج کا مظاہرہ کرنے والا پہلا واقعہ ہے، جب کہ زیادہ توانائی کی بچت اور الگورتھم کو درست طریقے سے چلانے کے قابل ہونے کی وجہ سے، پچھلے مطالعات میں سے کوئی بھی ایسا نہیں تھا۔ وان کے مطابق، بیک وقت دکھانے کے قابل تھے۔

NeuRRAM 48 CIM cores پر مشتمل ہے جس میں کل 3 ملین RRAM سیل ہیں۔ ہر کور کو ٹرانسپوز ایبل نیوروسینپٹک ارے (TNSA) کے طور پر بیان کیا گیا ہے جس میں 256 × 256 RRAM سیلز اور 256 CMOS مصنوعی نیوران سرکٹس شامل ہیں جو اینالاگ ٹو ڈیجیٹل کنورٹرز (ADCs) اور ایکٹیویشن فنکشنز کو نافذ کرتے ہیں۔

مقالے کے مطابق، TNSA فن تعمیر کو ڈیٹا فلو کی سمت پر لچکدار کنٹرول پیش کرنے کے لیے ڈیزائن کیا گیا ہے، جو کہ مختلف ڈیٹا فلو پیٹرن کے ساتھ AI ماڈلز کی متنوع رینج کو سپورٹ کرنے کے لیے اہم ہے۔

مثال کے طور پر، convolutional عصبی نیٹ ورکس (CNNs) میں جو وژن سے متعلق کاموں میں عام ہیں، ڈیٹا مختلف تجریدی سطحوں پر ڈیٹا کی نمائندگی پیدا کرنے کے لیے تہوں کے ذریعے ایک ہی سمت میں بہتا ہے، جب کہ کچھ دوسرے ماڈلز میں پرابیلسٹک سیمپلنگ تہوں کے درمیان آگے پیچھے کی جاتی ہے۔ جب تک کہ نیٹ ورک ایک اعلی امکان والی حالت میں تبدیل نہ ہو جائے۔

تاہم، دوسرے ڈیزائن جنہوں نے CIM کو RRAM کے ساتھ ملایا ہے وہ ایک ہی سمت میں کام کرنے تک محدود تھے، عام طور پر RRAM کراس بار سرنی کی ہارڈ وائرنگ قطاروں اور کالموں کو ان پٹ چلانے اور آؤٹ پٹس کی پیمائش کرنے کے لیے پیریفری پر وقف سرکٹس کے ذریعے، کاغذ کا کہنا ہے۔

یہ کیسے کام کرتا ہے

NeuRRAM کی دوبارہ ترتیب دینے کا راز یہ ہے کہ یہ CMOS نیوران سرکٹس کو RRAM خلیوں میں تقسیم کرتا ہے، اور انہیں قطاروں اور کالموں کی لمبائی کے ساتھ جوڑتا ہے۔

ویئر وان

تصویر: وان وغیرہ

ہر TNSA کو کئی کورلیٹس میں تقسیم کیا جاتا ہے، جن میں سے ہر ایک 16 × 16 RRAM خلیات اور ایک نیوران سرکٹ پر مشتمل ہوتا ہے۔ کورلیٹس افقی سمت کے ساتھ مشترکہ بٹ لائنز (BLs) اور ورڈ لائنز (WLs) اور عمودی سمت کے ساتھ سورس لائنز (SLs) کے ذریعے جڑے ہوئے ہیں۔

نیورون سرکٹ سوئچ کے ذریعے ایک BL اور ایک SL سے جڑتا ہے جو کہ کورلیٹ سے گزرتا ہے ہر ایک میں سے 16 میں سے، اور اسی BL یا SL سے جڑنے والے تمام 256 RRAMs سے ان پٹ کو مربوط کرنے کا ذمہ دار ہے۔

ہر نیوران سرکٹ ان پٹ اور آؤٹ پٹ کے لیے اپنے BL اور SL سوئچ استعمال کر سکتا ہے۔ اس کا مطلب یہ ہے کہ یہ سوئچز کے ذریعے BL یا SL سے آنے والے RRAM سیل سے اینالاگ میٹرکس-ویکٹر ضرب (MVM) حاصل کر سکتا ہے، لیکن تبدیل شدہ ڈیجیٹل نتائج کو اسی سوئچ کے ذریعے پیریفرل رجسٹر میں بھی بھیج سکتا ہے۔

اس ترتیب کا مطلب ہے کہ ڈیٹا فلو کی مختلف سمتوں کو یہ ترتیب دے کر لاگو کیا جا سکتا ہے کہ ہر نیورون سرکٹ کے ان پٹ اور آؤٹ پٹ مراحل کے دوران کون سا سوئچ استعمال کرنا ہے۔

(یہ فن تعمیر ہمیں کسی حد تک ذہن میں بھی رکھتا ہے۔ SambaNova کی AI پروسیسر چپ، جسے کمپیوٹ یونٹس اور میموری یونٹس کے گرڈ کے طور پر لاگو کیا جاتا ہے، ایک آن چپ کمیونیکیشن فیبرک سے منسلک ہوتا ہے جو ڈیٹا فلو کو کنٹرول کرتا ہے۔)

نیو آر آر اے ایم میں 48 سی آئی ایم کورز کا استعمال کرتے ہوئے AI انفرنس کی کارکردگی کو زیادہ سے زیادہ کرنے کے لیے، کاغذ کے مطابق، مختلف وزن کی نقشہ سازی کی حکمت عملیوں کو لاگو کرنا ممکن ہے جو ماڈل کی ہم آہنگی اور ڈیٹا کی ہم آہنگی دونوں کا استحصال کرتی ہیں۔

CNN کے معاملے میں، حکمت عملی یہ ہو سکتی ہے کہ متوازی انفرنسنگ کے لیے ابتدائی، سب سے زیادہ کمپیوٹیشنل انٹینسی لیئرز کے وزن کو ایک سے زیادہ CIM cores میں ڈپلیکیٹ کیا جائے۔ کاغذ دستیاب وزن کی نقشہ سازی کی حکمت عملیوں کی مزید تفصیلی وضاحت فراہم کرتا ہے۔

یہ کاغذ AI کاموں کی ایک رینج کے لیے چپ کا استعمال کرتے ہوئے ہارڈویئر سے ماپنے والے نتائج کی رپورٹ کرتا ہے جس میں CIFAR-10 اور MNIST ڈیٹاسیٹس کا استعمال کرتے ہوئے تصویری درجہ بندی، Google اسپیچ کمانڈ کی شناخت اور MNIST امیج ریکوری، مختلف AI ماڈلز کے ساتھ لاگو کیا جاتا ہے۔

ان تمام بینچ مارک کاموں میں 4 بٹ وزن کے ساتھ تربیت یافتہ سافٹ ویئر ماڈلز کے مقابلے میں انفرنس کی درستگی حاصل کرنے کا دعویٰ کیا جاتا ہے۔ مثال کے طور پر، یہ 0.98-پرت CNN کا استعمال کرتے ہوئے MNIST ہاتھ سے لکھے ہوئے ہندسوں کی شناخت پر 7 فیصد غلطی کی شرح، ResNet-14.34 کا استعمال کرتے ہوئے CIFAR-10 آبجیکٹ کی درجہ بندی پر 20 فیصد غلطی کی شرح اور گوگل اسپیچ کمانڈ ریکگنیشن پر 15.34 فیصد ایرر ریٹ حاصل کرتا ہے۔ 4-سیل LSTM (طویل مدتی میموری)۔

NeuRRAM چپ کے بارے میں یہ بھی دعویٰ کیا جاتا ہے کہ اس میں توانائی کی کارکردگی ہے جو کہ RRAM کا استعمال کرتے ہوئے پہلے CIM چپ ڈیزائنوں سے دو گنا بہتر ہے، مختلف کمپیوٹیشنل بٹ پریزیشنز میں۔ تاہم، کاغذ میں توانائی کی کھپت کا اس شکل میں حوالہ نہیں دیا گیا ہے جس کا بازار میں تجارتی آلات کے ساتھ موازنہ کرنا آسان ہے، اور ذیل میں دکھایا گیا اعداد و شمار فیمٹوجولز (fJ) میں ماپا جانے والے مختلف بٹ درستگیوں میں فی آپریشن توانائی کی کھپت کو واضح کرتا ہے۔

وان وغیرہ

پر وسعت کے لئے کلک کریں

تاہم، وان نے ہمیں بتایا کہ ایک عام ریئل ٹائم کی ورڈ اسپاٹنگ ٹاسک کے لیے جو آج کل بہت سے سمارٹ ہوم ڈیوائسز پر چلتا ہے (جیسے کہ کسی سمارٹ اسپیکر کو لائٹ آن کرنے کے لیے کہنا)، NeuRRAM کا تخمینہ 2 مائیکرو واٹ سے کم بجلی استعمال کرنے کا ہے۔

"اس کا مطلب ہے کہ ایک چھوٹے سکے کی بیٹری پر بھی، یہ 10 سال سے زیادہ چل سکتی ہے (سسٹم کے دیگر اجزاء کے ذریعے استعمال ہونے والی بجلی پر غور نہیں کرنا)،" انہوں نے کہا۔

کاغذ کے مطابق، چپ کو 130nm CMOS ٹیکنالوجی کا استعمال کرتے ہوئے من گھڑت بنایا گیا ہے، اور امید کی جاتی ہے کہ ٹیکنالوجی کی پیمائش کے ساتھ توانائی کی کارکردگی میں بہتری آئے گی، جیسا کہ دیگر سیمی کنڈکٹر مصنوعات کا معاملہ ہے۔

پروڈکٹائزیشن ابھی سال دور ہے۔

تو کیا ہم اس ٹیکنالوجی پر مبنی شپنگ کمرشل ڈیوائس دیکھیں گے؟ وان کا کہنا ہے کہ اس میں کمرشلائز ہونے کی بڑی صلاحیت ہے، اور وہ ذاتی طور پر اسے خود پروڈکٹ کرنے پر غور کر رہا ہے۔

"سب سے زیادہ مناسب ابتدائی استعمال کیس انتہائی کنارے / IoT میں بہت امکان ہے،" اس نے ہمیں بتایا۔

NeuRRAM چپ پر مبنی پروڈکٹ کو دوسرے ایکسلریٹر کی طرح سی پی یو والے سسٹم میں جوڑا جا سکتا ہے، لیکن یہ ہر ایپلیکیشن کے لیے ضروری نہیں ہے۔

وان نے کہا، "حال ہی میں سی پی یو یا اضافی میموری سے گزرے بغیر سینسرز سے ڈیٹا کو براہ راست AI پروسیسرز کو فیڈ کیا جا رہا ہے،" وان نے کہا، لیکن انہوں نے مزید کہا کہ زیادہ تر حقیقی دنیا کی تعیناتی کے معاملات میں، ایسے AI ایکسلریٹر ایک شریک پروسیسر کے طور پر کام کرتے ہیں۔ سی پی یو کے لیے، جہاں سی پی یو دوسرے کاموں کا انتظام کرتا ہے۔

NeuRRAM چپ کا مقصد صرف کام کا اندازہ لگانے کے لیے ہے، بڑی حد تک اس لیے کہ RRAM ٹیکنالوجی اپنی موجودہ شکل میں تربیت کے لیے زیادہ موزوں نہیں ہے کیونکہ تربیت کے عمل میں میموری کو بار بار اپ ڈیٹ کرنے کی ضرورت ہوتی ہے، اور یہ "RRAM پر ایک بہت مہنگا آپریشن ہے" وان نے کہا۔

"فی الحال بہت سے تجارتی فاؤنڈریز میں پہلے سے ہی RRAM ڈیوائسز بنانے کی صلاحیت موجود ہے، لیکن زیادہ تر ایمبیڈڈ میموری کے استعمال کے بجائے کمپیوٹ ان میموری کے لیے۔ ایک بار جب RRAM کا عمل IC ڈیزائنرز کے لیے زیادہ وسیع پیمانے پر دستیاب ہو جاتا ہے، ایک NeuRRAM پروڈکٹ ہو سکتا ہے۔

اس کے ہونے کی صحیح ٹائم لائن کی پیش گوئی کرنا مشکل ہے، تاہم، اور وان نے کہا کہ اگلے دو سے تین سالوں میں، یا اس سے کہیں زیادہ عرصہ ہو سکتا ہے۔ ®

ٹائم اسٹیمپ:

سے زیادہ رجسٹر