مصنوعی ذہانت (AI) اور مشین لرننگ کا شعبہ مسلسل ترقی کر رہا ہے، جس میں Vision Mamba (Vim) AI وژن کے دائرے میں ایک اہم منصوبے کے طور پر ابھر رہا ہے۔ حال ہی میں، تعلیمی کاغذ "Vision Mamba- Efficient Visual Representation Learning with Bidirectional" مشین لرننگ کے دائرے میں اس نقطہ نظر کو متعارف کراتا ہے۔ ریاستی خلائی ماڈلز (SSMs) کا استعمال کرتے ہوئے ہارڈ ویئر سے آگاہی کے موثر ڈیزائن کے ساتھ تیار کیا گیا، Vim بصری نمائندگی کی تعلیم میں ایک اہم چھلانگ کی نمائندگی کرتا ہے۔
Vim بصری ڈیٹا کی مؤثر طریقے سے نمائندگی کرنے کے اہم چیلنج سے نمٹتا ہے، ایک ایسا کام جو روایتی طور پر ویژن ٹرانسفارمرز (ViTs) کے اندر خود توجہ دینے کے طریقہ کار پر منحصر ہے۔ ViTs، اپنی کامیابی کے باوجود، رفتار اور میموری کے استعمال میں رکاوٹوں کی وجہ سے ہائی ریزولوشن امیجز پر کارروائی کرنے میں محدودیت کا سامنا کرتے ہیں۔ Vim، اس کے برعکس، دو طرفہ Mamba بلاکس کا استعمال کرتا ہے جو نہ صرف ڈیٹا پر منحصر عالمی بصری سیاق و سباق فراہم کرتا ہے بلکہ زیادہ باریک، مقام سے آگاہ بصری تفہیم کے لیے پوزیشن ایمبیڈنگز کو بھی شامل کرتا ہے۔ یہ نقطہ نظر Vim کو کلیدی کاموں جیسے امیج نیٹ کی درجہ بندی، COCO آبجیکٹ کا پتہ لگانے، اور ADE20K سیمنٹک سیگمنٹیشن پر اعلیٰ کارکردگی کو حاصل کرنے کے قابل بناتا ہے، جیسا کہ DeiT۔
ImageNet-1K ڈیٹاسیٹ پر Vim کے ساتھ کیے گئے تجربات، جس میں 1.28 زمروں میں 1000 ملین تربیتی تصاویر شامل ہیں، کمپیوٹیشنل اور میموری کی کارکردگی کے لحاظ سے اس کی برتری کو ظاہر کرتی ہیں۔ خاص طور پر، Vim کو DeiT کے مقابلے میں 2.8 گنا تیز بتایا جاتا ہے، جس سے ہائی ریزولوشن امیجز کے لیے بیچ کے تخمینے کے دوران 86.8% GPU میموری کی بچت ہوتی ہے۔ ADE20K ڈیٹاسیٹ پر سیمنٹک سیگمنٹیشن کے کاموں میں، Vim مستقل طور پر مختلف پیمانے پر DeiT کو پیچھے چھوڑتا ہے، تقریباً نصف پیرامیٹرز کے ساتھ ResNet-101 بیک بون کے برابر کارکردگی حاصل کرتا ہے۔
مزید برآں، COCO 2017 ڈیٹاسیٹ پر آبجیکٹ کا پتہ لگانے اور مثال کے طور پر الگ کرنے کے کاموں میں، Vim نے DeiT کو نمایاں مارجن کے ساتھ پیچھے چھوڑ دیا، جو اس کی طویل فاصلے تک سیاق و سباق سیکھنے کی بہتر صلاحیت کا مظاہرہ کرتا ہے۔ یہ کارکردگی خاص طور پر قابل ذکر ہے کیونکہ Vim اپنی ریڑھ کی ہڈی میں 2D priors کی ضرورت کے بغیر، خالص ترتیب ماڈلنگ کے انداز میں کام کرتا ہے، جو روایتی ٹرانسفارمر پر مبنی نقطہ نظر میں ایک عام ضرورت ہے۔
Vim کی دو طرفہ ریاستی خلائی ماڈلنگ اور ہارڈویئر سے آگاہی ڈیزائن نہ صرف اس کی کمپیوٹیشنل کارکردگی کو بڑھاتا ہے بلکہ مختلف ہائی ریزولوشن ویژن کاموں میں اس کے اطلاق کے لیے نئے امکانات بھی کھولتا ہے۔ Vim کے مستقبل کے امکانات میں اس کا اطلاق غیر زیر نگرانی کاموں جیسے ماسک امیج ماڈلنگ پری ٹریننگ، ملٹی موڈل ٹاسک جیسے CLIP طرز کی پری ٹریننگ، اور ہائی ریزولوشن میڈیکل امیجز، ریموٹ سینسنگ امیجز، اور لمبی ویڈیوز کا تجزیہ شامل ہے۔
آخر میں، Vision Mamba کا اختراعی نقطہ نظر AI وژن ٹیکنالوجی میں ایک اہم پیشرفت کی نشاندہی کرتا ہے۔ روایتی وژن ٹرانسفارمرز کی حدود پر قابو پا کر، Vim وژن پر مبنی AI ایپلی کیشنز کی وسیع رینج کے لیے اگلی نسل کی ریڑھ کی ہڈی بننے کے لیے تیار ہے۔
تصویری ماخذ: شٹر اسٹاک
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://Blockchain.News/analysis/vision-mamba-a-new-paradigm-in-ai-vision-with-bidirectional-state-space-models
- : ہے
- : ہے
- : نہیں
- $UP
- 1
- 2017
- 28
- 2D
- 8
- a
- تعلیمی
- حاصل
- حصول
- کے پار
- پتے
- ترقی
- AI
- بھی
- تجزیہ
- اور
- درخواست
- ایپلی کیشنز
- نقطہ نظر
- نقطہ نظر
- مصنوعی
- مصنوعی ذہانت
- مصنوعی انٹیلی جنس (AI)
- AS
- ریڑھ کی ہڈی
- BE
- بن
- رہا
- بہتر
- blockchain
- بلاکس
- لیکن
- by
- اقسام
- چیلنج
- درجہ بندی
- کوکو
- کامن
- مقابلے میں
- کمپیوٹیشنل
- اختتام
- منعقد
- مسلسل
- پر مشتمل ہے
- سیاق و سباق
- جاری ہے
- اس کے برعکس
- اہم
- اعداد و شمار
- مظاہرہ
- مظاہرین
- انحصار
- ڈیزائن
- ڈیزائن
- کے باوجود
- کھوج
- مختلف
- دو
- کے دوران
- کارکردگی
- ہنر
- مؤثر طریقے سے
- کرنڈ
- ملازمت کرتا ہے
- کے قابل بناتا ہے
- بڑھانے کے
- قائم
- تیار
- تجربات
- چہرہ
- تیز تر
- میدان
- کے لئے
- مستقبل
- گلوبل
- GPU
- جھنڈا
- نصف
- بهترین ریزولوشن
- اعلی
- HTTPS
- تصویر
- تصاویر
- in
- شامل
- شامل
- جدید
- مثال کے طور پر
- مثال سیگمنٹیشن
- انٹیلی جنس
- متعارف کرواتا ہے
- میں
- فوٹو
- کلیدی
- لیپ
- سیکھنے
- کی طرح
- حدود
- لانگ
- مشین
- مشین لرننگ
- انداز
- مارجن
- ماسک
- نظام
- طبی
- یاد داشت
- دس لاکھ
- ماڈلنگ
- ماڈل
- زیادہ
- تقریبا
- ضرورت ہے
- نئی
- خبر
- اگلی نسل
- قابل ذکر
- اعتراض
- آبجیکٹ کا پتہ لگانا
- of
- on
- صرف
- کھول
- چل رہا ہے
- Outperforms
- پر قابو پانے
- پیرا میٹر
- خاص طور پر
- کارکردگی
- اہم
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- تیار
- پوزیشن
- امکانات
- پروسیسنگ
- منصوبے
- امکانات
- فراہم
- رینج
- دائرے میں
- حال ہی میں
- ریموٹ
- اطلاع دی
- نمائندگی
- نمائندگی
- کی نمائندگی کرتا ہے
- ضرورت
- s
- بچت
- ترازو
- انقطاع
- معنوی
- تسلسل
- اہم
- اسی طرح
- ماخذ
- خلا
- خاص طور پر
- تیزی
- کھڑا ہے
- حالت
- کامیابی
- اس طرح
- حد تک
- ٹاسک
- کاموں
- ٹیکنالوجی
- شرائط
- سے
- کہ
- ۔
- ان
- اس
- اوقات
- کرنے کے لئے
- روایتی
- روایتی طور پر
- ٹریننگ
- ٹرانسفارمرز
- افہام و تفہیم
- استعمال
- کا استعمال کرتے ہوئے
- مختلف
- نقطہ نظر
- بصری
- جس
- وسیع
- وسیع رینج
- ساتھ
- کے اندر
- بغیر
- زیفیرنیٹ