ParallelDots پر ڈیٹا سائنس ٹیم - سال کے اختتام کی رپورٹ

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

ParallelDots پر ڈیٹا سائنس ٹیم - سال کے آخر میں پلیٹو بلاکچین ڈیٹا انٹیلی جنس کی رپورٹ۔ عمودی تلاش۔ عی

2020 [اور 2021 کا پہلا نصف] ایک سیاہ ہنس تھا۔ خاندانوں، معاشروں اور کمپنیوں کو ایسی چیزوں کا سامنا کرنا پڑا جن کا وہ تصور بھی نہیں کر سکتے تھے۔ اس پوسٹ میں، میں اس بات کو اجاگر کرنے کی کوشش کروں گا کہ ParallelDots AI ٹیم اس عرصے میں کس طرح ڈھال رہی ہے اور ہمارے ریٹیل AI سلوشنز کی اگلی نسل کے لیے تعمیر کر رہی ہے۔

ParallelDots فروری 2020 میں مکمل ریموٹ ورک موڈ میں چلا گیا اور اس کے بعد سے ٹیم ایک دن کے لیے جسمانی طور پر نہیں ملی۔ اس سے پہلے ہم ہمیشہ سے بہت مضبوطی سے بنے ہوئے یونٹ تھے اور اس طرح پہلے چند ہفتے دور دراز کے کام کرنے والے کلچر کی تعمیر میں مکمل طور پر صرف ہوئے تھے۔ ہمیں بہتر مواصلات اور ایک بہت ہی مختلف ملکیت کے ڈھانچے کے بارے میں سوچنا تھا۔ یہ دیکھتے ہوئے کہ کمپنی کاروباری جھٹکے سے بھی نمٹ رہی تھی، یہ ہفتے مشکل تھے۔ مجھے ذاتی طور پر اس بات پر فخر ہے کہ جس طرح ہماری ٹیم نے دباؤ کو ہینڈل کیا اور نہ صرف ایڈجسٹ کیا بلکہ سب سے اوپر کی ٹیکنالوجی چرننگ مشین بننے کے لیے تیار کیا جو ہمیشہ سے رہی ہے۔ صرف چند ہفتوں کے موافقت اور ہم واپس بہت اچھے تھے۔

AI ٹیم کے لیے چیلنجز [سرکا مارچ 2020]

[آپ کو مختلف AI الگورتھم اور سسٹمز کی 'کیوں' معلوم ہو سکتی ہے جو ہم بورنگ کے طور پر بنا رہے ہیں، میں جانتا ہوں کیونکہ میرے پاس 😉 ہوگا، اگر آپ صرف 'کیسے'، یا تمام نئے ٹھنڈے ٹیک اور الگورتھم سیکشن میں دلچسپی رکھتے ہیں، سیکشن 'نئے نظام اور الگورتھم' پر نیچے جائیں]

ParallelDots AI ٹیم کا کردار مختلف مسائل کو حل کر رہا ہے جو ParallelDots پر ہماری AI تربیت اور تعیناتی کے بنیادی ڈھانچے میں رکاوٹ ہیں۔ آپ ان چیلنجوں کو ان میں تقسیم کر سکتے ہیں: A. AI ٹریننگ اور درستگی کی رکاوٹیں [یا تحقیقی رکاوٹیں] اور B. تعیناتی/انفرنس بوٹلنیکس [یا MLOPS Bottlenecks جیسا کہ ہم انہیں کہتے ہیں]۔ 2020 کے آغاز میں، جب کہ ہماری AI ٹیکنالوجی پہلے سے ہی ہر ماہ ایک ملین سے زیادہ تصاویر پر کارروائی کر رہی تھی، کچھ چیلنجز جن کے حل کرنے کی ہم سے توقع کی جا رہی تھی کہ اس کو بڑھانے کے لیے یہ تھے:

ایک انفرنس انفراسٹرکچر کی تعیناتی جو خود بخود بڑھ سکتی ہے۔ اگر بہت زیادہ ریٹیل امیجز پر کارروائی کی جائے تاکہ ہمارے SLAs کو محفوظ رکھا جا سکے جبکہ اس بات کو یقینی بناتے ہوئے کہ چھوٹے کام کے بوجھ کے لیے تعیناتی کو کم کیا جائے۔ GPUs مہنگی مشینیں ہیں اور ایک مستحکم [یا آف دی شیلف یا مینوئل ڈیوپس] انفراسٹرکچر کا ہونا SLAs کو پورا کرنے اور زیادہ اخراجات سے بچنے کے درمیان ایک تنگی ہے۔
ہمارے ریٹیل کمپیوٹر ویژن الگورتھم کو فون پر چلانا۔ ہم نے ہمیشہ ایک نئی پروڈکٹ کے بارے میں سوچا تھا جہاں بلنگ/GRN/انوینٹری مینجمنٹ کے لیے سست انٹرنیٹ کنیکشن کے ساتھ چھوٹے ریٹیل آؤٹ لیٹس پر فون میں آن ایج AI استعمال کیا جا سکتا ہے۔ صرف یہی نہیں، ہمارے کچھ ممکنہ شیلف واچ کلائنٹس ایسی تعیناتی چاہتے ہیں جو تصویر کے اپ لوڈ اور عمل کے انتظار کے بغیر فوری اندازہ لگانے کے لیے دکانوں کے اندر استعمال ہو سکیں۔ ہم اس بات سے واقف تھے کہ اگر ہم اپنے ریٹیل AI الگورتھم کو فون پر چلا سکتے ہیں، تو اس سے ہمیں اپنے خوابوں کی دوسری مصنوعات بنانے میں مدد ملے گی بلکہ ہماری موجودہ مصنوعات کو نئے کلائنٹس حاصل کرنے میں بھی مدد ملے گی۔ مذکورہ بالا دونوں چیلنجز MLOPS چیلنجز ہیں جیسا کہ ہم انہیں کہتے ہیں۔
تصاویر میں مصنوعات کے سائز کی مختلف حالتوں کا پتہ لگانا۔ ایک اور چیلنج ریٹیل امیجز میں کسی پروڈکٹ کے لیے سائز کی سطح کی مختلف حالتوں کا پتہ لگانا تھا۔ مثال کے طور پر، ہم کہتے ہیں کہ آپ کے پاس چپس کے شیلف کے لیے تصویر ہے اور آپ کو AI کا استعمال کرتے ہوئے نہ صرف Lay's Magic Masala کی گنتی کا پتہ لگانا ہے، بلکہ Lay's Magic Masala کے 10 INR/20 INR/30 INR پیکٹوں کے درمیان تقسیم بھی کرنا ہے۔ آپ کے تجزیہ میں. ان لوگوں کے لیے جنہوں نے کمپیوٹر ویژن میں کام نہیں کیا ہے، یہ ایک واضح اور آسان اگلا مسئلہ لگتا ہے جس کو حل کرنا ہے کیونکہ AI شیلف پر پروڈکٹ کا پتہ لگا سکتا ہے اور انہیں بہت زیادہ درستگی کے ساتھ برانڈز کے طور پر درجہ بندی کر سکتا ہے۔ لیکن آپ مشہور XKCD #1425 کو جانتے ہیں [ہر چیز کے لیے ہمیشہ ایک متعلقہ XKCD ہوتا ہے 😉]۔ متعلقہ XKCD
پوائنٹ آف سیل میٹریلز کے حصوں کی تصدیق کرنا۔ شیلف پر مصنوعات کا پتہ لگانے اور شناخت کرنے کے علاوہ شیلف امیجز کا تجزیہ کرنے کا ایک اور حصہ شیلف پر مختلف پوائنٹ آف سیل میٹریلز کی موجودگی کی تصدیق کرنا ہے۔ یہ پوائنٹ آف سیل میٹریل وہ چیزیں ہیں جو آپ اکثر اپنے ارد گرد کسی ریٹیل یا کرانہ اسٹور میں دیکھیں گے جیسے شیلف سٹرپس، کٹ آؤٹ، پوسٹرز، گینڈولاس اور ڈیمو ریک۔ ہم نے اس طرح کے میچوں کے لیے ڈیپ کی پوائنٹ میچنگ کا استعمال بہت طویل عرصے تک کیا اور یہ اچھی طرح کام کرتا تھا۔ تاہم، وقت گزرنے کے ساتھ ساتھ صارفین نے ہم سے نہ صرف شیلف امیجز میں POSM کی تصدیق کرنے کے لیے کہا تھا بلکہ ان گمشدہ ٹکڑوں کی نشاندہی کرنے کے لیے بھی کہا تھا جو ایک مرچنڈائزر نے POSM میں کھوئے ہوں گے۔ مثال کے طور پر، ہو سکتا ہے کہ ایک مرچنڈائزر نے ڈیمو ریک پر پوسٹر لگانا چھوڑ دیا ہو یا کسی حادثے کی وجہ سے اسے دکان سے ہٹا دیا گیا ہو۔ تصویر کی درجہ بندی جس سطح پر کام کرتی ہے اسے بالکل درست طریقے سے کرنے کے لیے، ہمیں ایک الگورتھم کی ضرورت ہے جو بغیر تربیت کے ہر جگہ کام کرے کیونکہ POSMs ہفتوں/مہینوں میں تبدیل ہو جاتے ہیں۔
زیادہ درست شیلف پروڈکٹ ڈیٹیکٹر کی تربیت۔ ریٹیل شیلف کمپیوٹر وژن پہلے مرحلے میں عام شیلف آبجیکٹ ڈیٹیکٹر رکھنے کی ٹیکنالوجی کی طرف منتقل ہو گیا ہے [کسی بھی شیلف آبجیکٹ کو اس کی درجہ بندی کیے بغیر نکالیں] اور پھر مصنوعات کی درجہ بندی کرنے کے بعد دوسرے مرحلے میں نکالے گئے مسائل سے بچنے کے لیے One step detectors + classifiers تخلیق کریں [شیلفوں پر بڑے پیمانے پر مصنوعات کی خرابی پیدا کرنا / فی پراجیکٹ کے بہت سارے ڈیٹا پر تربیت اور AI سے کوئی اضافی فائدہ نہیں جو پچھلے پروجیکٹس سے بہتر ہو رہا ہے اور اسی طرح]۔ ہمارے پاس 2019 میں دوسرے مرحلے میں عام شیلف آبجیکٹ ڈیٹیکٹر اور اسٹیٹ آف دی آرٹ کلاسیفائر کا ایسا نظام پہلے سے موجود تھا، لیکن شیلف آبجیکٹ ڈیٹیکٹر کے آؤٹ پٹ باکس کی شکلیں بہتر ہو سکتی تھیں۔
درجہ بندی کرنے والوں کو بہتر اور تیز تر تربیت دینے کے لیے ماضی کی AI تربیت اور غلطیوں کی اصلاح کا استعمال۔ ہم بہت سارے درجہ بندی کرنے والوں کو تربیت دیتے ہیں [ماڈل جو مرحلہ 1 الگورتھم کے ذریعے نکالے گئے شیلف اشیاء کو پروڈکٹ برانڈز میں سے ایک میں درجہ بندی کرتے ہیں جن کی ہمیں ضرورت ہے]۔ کیا ہمارے پاس جمع کردہ تمام تربیتی ڈیٹا کو استعمال کرنے کا کوئی طریقہ ہے، جس میں ایک الگورتھم بنانے کے لیے ماضی کے درجہ بندی کرنے والوں کی غلطیاں بھی شامل ہیں جو نئے درجہ بندی کرنے والوں کو تیز اور زیادہ درست طریقے سے تربیت دینے میں مدد کر سکتا ہے، یہ ایک سوال ہے جو ہمیشہ موجود رہتا ہے۔ چار تحقیقی مسائل [3-6] جو آپ نے ہمارے شیلف واچ پروڈکٹ [3,4] کی نئی ضروریات کو ظاہر کرتے ہوئے اور موجودہ اسٹیک [5,6] کو بہتر بناتے ہوئے پایا ہے۔ اب ہمارے NLP APIs اسٹیک سے تحقیقی مسائل کا ایک مجموعہ بھی تھا۔
ایک زیادہ عام جذباتی تجزیہ API۔ ہمارے پاس آن لائن جو Sentiment Analysis API تھا اسے اندرون خانہ تشریح شدہ ٹویٹس پر تربیت دی گئی تھی اور اس طرح بڑی درستگی کے باوجود مزید ڈومین مخصوص چیزوں جیسے کہ سیاسی یا مالیاتی مضامین میں ناکام ہو سکتا ہے۔ ٹویٹس کے برعکس اس طرح کے مختلف ڈومین مضامین کو ان لوگوں کے ذریعہ بیان کرنا مشکل ہے جو ڈیٹاسیٹ کے ڈومین میں تجربہ نہیں رکھتے ہیں۔ درجہ بندی کرنے والوں کو تربیت دینے کے لیے بہت سارے غیر تشریح شدہ ڈیٹا کا استعمال کرنا جو پورے ڈومین میں کام کر سکتا ہے ایک ہمیشہ سے موجود چیلنج رہا ہے۔
ایک نیا ھدف شدہ جذبات API۔ پہلو پر مبنی جذبات کا تجزیہ کچھ عرصے سے جاری ہے۔ آخر کار ہمارے پاس اس طرح کے تجزیے کے لیے اندرون خانہ تشریح شدہ ڈیٹاسیٹ تھا، لیکن ہمارا مقصد کچھ زیادہ مخصوص تھا۔ ہم ایک API بنانا چاہتے تھے جہاں آپ ایک جملہ دیتے ہیں "سیب مزیدار نہیں تھا لیکن اورینج واقعی یم تھا۔" جب "Apple" کے لیے تجزیہ کیا جائے تو منفی آؤٹ پٹ دے گا یا نارنجی کے لیے تجزیہ کرنے پر مثبت۔ اس طرح ہم ایک جدید ترین پہلو پر مبنی جذباتی تجزیہ الگورتھم بنانے کا ہدف بنا رہے تھے۔

اب جب کہ میں آپ کو ان چیلنجوں کی تفصیلات سے بور کر چکا ہوں جنہیں ہم حل کرنے کی کوشش کر رہے تھے، آئیے دلچسپ حصے کی طرف آتے ہیں۔ ہمارے نئے MLOPS پلیٹ فارمز اور الگورتھم۔

نئے سسٹمز اور الگورتھم

آئیے میں آپ کو اپنے نئے دوستوں، کچھ زبردست ٹیکنالوجی سسٹمز اور AI الگورتھم سے متعارف کرواتا ہوں جو ہم نے رکاوٹوں سے نمٹنے کے لیے پچھلی بار تیار کیے ہیں اور تعینات کیے ہیں۔

موبائل پروڈکٹ ریکگنیشن AI یا موبائل شیلف ریکگنیشن AI

ParallelDots Oogashop کا تعارف - لنک

(LinkedIn Feed and Video)

ہم نے موبائل آلات پر ایک نہیں بلکہ دو مختلف قسم کے AI الگورتھم بنائے اور لگائے ہیں۔ آپ نے کچھ دن پہلے ہماری انتہائی وائرل پوسٹس دیکھی ہوں گی جہاں ہم نے موبائل فون بلنگ کو ڈیمو کیا تھا اور آف لائن شیلف آڈٹ کے بارے میں بات کی تھی۔

شیلف واچ کی آن ڈیوائس امیج ریکگنیشن فیچر (ODIN) کا لنک یہ ہے۔ لنک

(مضمون)

بنیادی طور پر، یہ AI ماڈلز ان ماڈلز کے ورژنز کو چھوٹا کیا جاتا ہے جنہیں ہم کلاؤڈ پر تعینات کرتے ہیں۔ درستگی میں کچھ نقصان کے ساتھ، یہ ماڈل اب اتنے چھوٹے ہیں کہ فون GPU پر چل سکتے ہیں [جو کہ ایک سرو GPU سے بہت چھوٹا ہے]۔ Tensorflow کا نیا موبائل تعیناتی فریم ورک وہی ہے جو ہم بالترتیب اپنی OOGASHOP اور ShelfWatch ایپ میں ان ماڈلز کو تعینات کرنے کے لیے استعمال کرتے ہیں۔

(کاغذ) موبائل کی تعیناتی کے لیے کومپیکٹ ریٹیل شیلف سیگمنٹیشن – لنک

پرتیوش کمار، مکتبھ میانک سریواستو

آٹو اسکیلنگ کلاؤڈ AI کا اندازہ

جب دکانیں صبح 11 بجے کے قریب کھلتی ہیں [11AMs مختلف ٹائم زونز کے لیے، یعنی دنیا میں جہاں کہیں بھی ہمارے کلائنٹس کی سیلز فورس یا مرچنڈائزرز ہیں]، ہمارے سرورز کو ہمارے کلاؤڈ پر فوٹو اپ لوڈ کرنے والے مرچنڈائزرز کے ایک پاگل بوجھ کا سامنا کرنا پڑتا ہے تاکہ وہ پروسیسنگ اور انہیں اپنے بارے میں بتا سکیں۔ خوردہ عملدرآمد سکور. اور پھر رات 11 بجے کے بعد جب ریٹیل اسٹورز بند ہو جاتے ہیں، ہمارے پاس شاید ہی کافی AI تخمینہ کام کا بوجھ ہوتا ہے۔ جبکہ Lambda جیسے آٹو اسکیلنگ کو بہت سے فراہم کنندگان نے متعارف کرایا ہے، ہم اپنے AI انفرنس انفراسٹرکچر کے لیے کلاؤڈ سے آزاد آٹو اسکیلنگ تکنیک چاہتے تھے۔ جب ہماری پروسیسنگ قطار میں مزید تصاویر ہوتی ہیں، تو ہمیں ان کو کچلنے کے لیے مزید GPUs کی ضرورت ہوتی ہے، ورنہ صرف ایک یا شاید کوئی نہیں۔ ایسا کرنے کے لیے، پوری AI انفرنس لیئر کو Docker، Kubernetes اور KEDA پر مبنی فن تعمیر میں منتقل کر دیا گیا جہاں کام کے بوجھ کی بنیاد پر نئے GPUs کی من مانی تعداد پیدا کی جا سکتی ہے۔ کمپنی کے ایس ایل اے کو منظم کرنے کی کوشش کرنے اور GPU مشینوں کو چلانے کے لئے مہنگے پر $$ کی بچت کرنے کی اب کوئی مشکل نہیں ہے۔

شیلف آبجیکٹ کا پتہ لگانے کے الگورتھم کو بہتر بنانا

(کاغذ) گھنے آبجیکٹ کی کھوج کے لیے گاوسی نقشے سیکھنا – لنک

سونال کانت

ہم پہلے شیلف آبجیکٹ نکالنے کے لیے تربیت یافتہ آسان تیز RCNN استعمال کر رہے تھے: سادہ آبجیکٹ ڈیٹیکشن بیس لائن پیپر . اس نے بہت سے استعمال کے معاملات میں اچھی طرح سے کام کیا۔ لیکن ہمیں آرٹ کے مزید جدید طریقوں کی ضرورت تھی۔ 2020 میں ہماری ٹیم نے جدید ترین نتائج حاصل کرنے کے لیے Gaussian Maps کو استعمال کرنے کا ایک نیا طریقہ دریافت کیا۔ یہ کام [بعد میں BMVC میں شائع ہوا، کمپیوٹر ویژن کانفرنسوں میں سے ایک BMVC ویب سائٹ ] نے نہ صرف تسلی بخش بلکہ شیلف آبجیکٹ کا پتہ لگانے پر بہترین ممکنہ نتائج حاصل کرنے میں ہماری مدد کی۔

گھنے آبجیکٹ کی کھوج کے لیے گاؤشیائی نقشے سیکھنا

چال بنیادی طور پر گاوسی نقشوں کی تربیت کو آبجیکٹ کا پتہ لگانے میں معاون نقصان کے طور پر استعمال کرنا ہے۔ اس سے مختلف مصنوعات کے بکس بہت زیادہ درست ہو جاتے ہیں۔

ایک اور سوال جو ہم شیلف آبجیکٹ کی کھوج کے سلسلے میں ایک طویل عرصے سے حل کرنے کی کوشش کر رہے ہیں، وہ یہ ہے کہ اب جب مصنوعات کو پہچاننے کی ضرورت کو ایک بہاوی کام کی طرف لے جایا گیا ہے اور یہ کام تمام ممکنہ مصنوعات پر بکس کھینچنا ہے، کیا کوئی شیلف آبجیکٹ کا بہتر پتہ لگانے کے لیے ایک بہت بڑے غیر تشریح شدہ ڈیٹاسیٹ میں موجود شور اور بگاڑ کو استعمال کرنے کا طریقہ۔ ایک حالیہ کام میں، [میں ذکر کیا گیا ہے CVPR 2021 میں ریٹیل ویژن ورکشاپ ریٹیل وژن ورکشاپ ]، ہم شیلف آبجیکٹ کا پتہ لگانے کے کام کی درستگی کو بہتر بنانے کے لیے بغیر نوٹ شدہ شیلف امیجز کے اپنے بڑے ذخیرے کا استعمال کرتے ہیں۔

(کاغذ) خوردہ مناظر میں گھنے آبجیکٹ کی کھوج کے لیے نیم زیر نگرانی سیکھنے - لنک

جے دیپ چوہان، سری کرشنا وردراجن، مکتبھ میانک سریواستو

Psuedolabel پر مبنی طالب علم کی تربیت ایک ایسی چال ہے جسے ہم نے متعدد شعبوں میں استعمال کیا ہے، نہ کہ شیلف آبجیکٹ کا پتہ لگانے کے لیے۔ جب کہ دیگر خود سیکھنے کی تکنیکوں کے لیے GPUs پر بڑے بیچ کے سائز کی ضرورت ہوتی ہے اس طرح محدود ہارڈ ویئر جیسے ParallelDots جیسی کمپنی کے لیے انہیں آزمانا مشکل ہو جاتا ہے۔ pseudolabels وہ ہے جسے ہم نے سنگل GPU سیلف لرننگ کرنے کی اپنی چال کے طور پر اپنایا ہے۔

ریٹیل سینز سیوڈولابلز میں گھنے آبجیکٹ کی کھوج کے لیے نیم زیر نگرانی سیکھنے

بہتر درجہ بندی کی درستگی

ہم نے ماضی میں اعلیٰ درستگی کے ساتھ درست درجہ بندی کرنے والوں کو تربیت دینے کے لیے متعدد چالوں کا استعمال کیا ہے۔

(کاغذ) خوردہ مصنوعات کی تصویر کی درجہ بندی کے لیے ترکیبوں کا بیگ - لنک، جو اس بات کی وضاحت کرتا ہے کہ ہم کس طرح درجہ بندی کرنے والوں کو اعلیٰ درستگی کے ساتھ تربیت دیتے ہیں۔

مکتبھ میانک سریواستو

تمام باکسز جنہیں شیلف آبجیکٹ کا پتہ لگانے والا شیلف امیج سے نکالتا ہے اس درجہ بندی سے پروڈکٹ کے برانڈ کا اندازہ لگانے کے لیے گزر جاتا ہے۔

ریٹیل بہتر درجہ بندی کی درستگی کے لیے چالوں کا بیگ

تاہم، دکان کے بار بار تبدیل ہونے والے کیٹلاگ کے ساتھ، ہمارے پروڈکٹ کی درجہ بندی کرنے والے کو چیزوں کو کچھ مختلف طریقے سے کرنے کے لیے تیار کرنے کی ضرورت ہے۔ درجہ بندی کرنے والے کی تربیت بہت وسائل کی حامل ہے، اسٹورز کے کیٹلاگ سے مصنوعات کو تیزی سے شامل کرنے یا ہٹانے کے ساتھ، ہمیں ایک درجہ بندی کرنے والے کی ضرورت ہے جو تیزی سے تربیت یافتہ ہو اور زیادہ درست ہو یا کم از کم اتنا درست ہو جتنا کہ مکمل ریڑھ کی ہڈی کو ٹھیک کرنے کے طریقے۔ یہ ایسا لگتا ہے جیسے کسی کا کیک ہو اور اس کی درجہ بندی بھی کی جائے، اور ڈیپ لرننگ میں خود سیکھنے کی تکنیکوں کو یہی دکھایا گیا ہے۔ ہم کلاسیفائر بنانے کے لیے سیلف لرننگ کے تصورات کو استعمال کرنے کی کوشش کر رہے ہیں جنہیں بہت ہلکے سے تربیت دی جا سکتی ہے۔

(کاغذ) ریٹیل پروڈکٹ امیج کی درجہ بندی کے لیے نمائندگی سیکھنے کے لیے متضاد لرننگ اور سیوڈولابلز کا استعمال۔ لنک

مکتبھ میانک سریواستو

ہم یہاں جو چال استعمال کرتے ہیں وہ ایک نمائندگی سیکھنے والے کو تربیت دینے کے لیے ہمارے پاس موجود ریٹیل پروڈکٹ امیجز کے بڑے ذخیرے کو استعمال کر رہی ہے، جس کا آؤٹ پٹ تربیت کے لیے ایک سادہ مشین لرننگ کلاسیفائر کو دیا جا سکتا ہے۔ اس طرح کی سیکھی ہوئی خصوصیت کی نمائندگی کافی اچھی طرح سے کام کرتی ہے۔ ریٹیل امیجز کی درجہ بندی کرنے کے لیے ایک چھوٹے لاجسٹک ریگریشن کلاسیفائر کی تربیت کتنی اچھی ہے۔ بدقسمتی سے، ہمارے پاس اس طرح کے کاموں کے لیے 20 گنا زیادہ تصاویر ہیں، اس لیے فی الحال ہماری حاصل کردہ درستگی محدود ہارڈویئر انفراسٹرکچر تک محدود ہے تاکہ اس طرح کے سیلف لرننگ کیے جا سکیں اور پھر بھی ہم بہت سے [سب نہیں] ڈیٹا سیٹس پر آرٹ کی حالت کو مات دیتے ہیں۔

ریٹیل پروڈکٹ امیج کی درجہ بندی کے لیے نمائندگی سیکھنے کے لیے متضاد لرننگ اور سیوڈولابلز کا استعمال

شیلف امیجز پر سائز کی بنیاد پر اندازہ

نیلے رنگ کے پیکٹ پکڑے آدمی آلو کے چپس بچھا رہا ہے۔

جب کہ ہم شیلف امیجز میں نظر آنے والے مختلف پروڈکٹس کے برانڈز کا پتہ لگا رہے ہیں، ایک حالیہ قیاس جس کو ہم نے حل کرنے کی کوشش کی ہے وہ یہ ہے کہ کسی پروڈکٹ کے سائز کے مختلف قسم کی پروڈکٹ جس پر ہم انحصار کرتے ہیں۔ مثال کے طور پر، جبکہ کمپیوٹر ویژن پائپ لائن شیلف پر لیز میجک مسالہ کا پتہ لگاتی ہے اور اسے لیز میجک مسالہ کے طور پر درجہ بندی کرتی ہے، ہمیں کیسے معلوم ہوگا کہ یہ 50 گرام ویریئنٹ ہے یا 100 گرام ویرینٹ ہے یا پروڈکٹ کا 200 گرام ویرینٹ ہے۔ اس طرح ہم شیلف کے سائز کے مختلف قسم کا اندازہ لگانے کے لیے ایک تیسرا بہاو کام شامل کرتے ہیں۔ یہ پائپ لائن شیلف سے نکالے گئے مختلف ڈبوں، ان کے برانڈز اور خصوصیات بناتی ہے جس سے سائز کا اندازہ لگایا جا سکتا ہے۔ جیسا کہ واضح ہے، آپ باؤنڈنگ باکس کوآرڈینیٹ یا ایریا کو اس طرح کے استدلال کے لیے استعمال نہیں کر سکتے کیونکہ تصاویر کسی بھی فاصلے سے لی جا سکتی ہیں۔ ہم مختلف گروپوں کے خانوں کے درمیان پہلو کا تناسب اور رقبہ کا تناسب جیسی خصوصیات کا استعمال کرتے ہیں تاکہ سائز کی مختلف حالت کا اندازہ لگایا جاسکے۔

(کاغذ) پروڈکٹ کی مختلف اقسام کی درجہ بندی کرنے کے لیے ریٹیل شیلف اشیاء پر سائز کی بنیاد پر استدلال کرنے کے لیے مشین لرننگ کے طریقے - لنک

مکتبھ میانک سریواستو، پرتیوش کمار

استدلال کے کام کی دو مختلف شکلوں کو تربیت دینے کے لیے بہت ساری فیچر انجینئرنگ ٹرکس استعمال کی جاتی ہیں: بائنڈ فیچرز پر XGBOST کا استعمال اور Gaussian mixture ماڈل سے اخذ کردہ خصوصیات پر نیورل نیٹ ورک کا استعمال۔

پروڈکٹ کی مختلف اقسام کی درجہ بندی کرنے کے لیے ریٹیل شیلف اشیاء پر سائز پر مبنی استدلال کرنے کے لیے مشین لرننگ کا طریقہ

پوائنٹ آف سیلز میٹریل کے بارے میں استدلال

جب آپ ریٹیل اسٹور میں جاتے ہیں، تو آپ کو مختلف POSM مواد نظر آئیں گے: شیلف سٹرپس، کٹ آؤٹ، پوسٹرز، گینڈولاس اور ڈیمو ریک۔

کولگیٹ پوائنٹ آف سیل میٹریل POSM استدلال

جب کہ ہم کسی تصویر میں POSM کی موجودگی کی تصدیق کے لیے ڈیپ لرننگ پر مبنی کلیدی پوائنٹ کی نمائندگی کے مماثلت کا استعمال کر رہے ہیں، POSM کے بارے میں جزوی طور پر استدلال کرنے کا کام تھا۔ یہ مثال کے طور پر اوپر کی مثال میں ہے، ہمیں یہ جانچنے کی ضرورت ہو سکتی ہے کہ آیا پروڈکٹ کی تصویر مثالی شیلف کی پٹی میں دائیں طرف حقیقی دنیا کی جگہ پر موجود ہے یا نہیں۔ ہم اسے POSM تصدیق کے بعد "Part" کا پتہ لگاتے ہیں۔

(کاغذ) ریٹیل POSMs کی تصدیق کے لیے کی پوائنٹ میچنگ اور انٹرایکٹو سیلف اٹینشن نیٹ ورک کا استعمال کرتے ہوئے – لنک

ہرشیتا سیٹھ، سونال کانت، مکتبھ میانک سریواستو

بنیادی طور پر چونکہ POSM ہفتہ وار/ماہانہ بہت تیزی سے تبدیل ہوتا ہے، آپ کو ہر POSM کے لیے الگورتھم کی تربیت کے لیے بہت زیادہ ڈیٹا کبھی نہیں مل سکتا۔ لہذا ہمیں الگورتھم کی ضرورت ہے جو موجودہ ڈیٹاسیٹ پر ایک طرح سے تربیت کریں تاکہ وہ کسی بھی ڈیٹاسیٹ پر لاگو ہو سکیں۔ POSMs کے لیے خود توجہ کے نیٹ ورک کے حالیہ کام کے ساتھ ہمارا مقصد یہی ہے۔ ہم مماثل کلیدی نکات [مثالی POSM امیج اور حقیقی لفظ کی تصویر پر] اور ان کے وضاحت کنندگان [دونوں تصویروں سے] ہر حصے کے لیے الگ الگ ان پٹ کے طور پر درست موجودگی کا تعین کرنے کے لیے استعمال کرتے ہیں۔

ریٹیل POSMs کی تصدیق کے لیے کی پوائنٹ میچنگ اور انٹرایکٹو سیلف اٹینشن نیٹ ورک کا استعمال — ParallelDots پر ڈیٹا سائنس ٹیم - سال کے اختتام کی رپورٹ

ایک Sentiment Analysis API جو کسی بھی ڈومین ڈیٹا پر کام کرتا ہے۔

جب کسی ماڈل کو جذباتی تجزیہ API کے طور پر تعینات کرنے کی تربیت دیتے ہیں، تو آپ واقعی مختلف ڈومینز سے تشریح شدہ ڈیٹا حاصل نہیں کر سکتے۔ مثال کے طور پر، ہمارے پاس پچھلا جذباتی تجزیہ ماڈل ایک بڑا زبان کا ماڈل تھا جو 10-15k عجیب ٹویٹس پر فائن ٹیون کیا گیا تھا جس پر ہم نے اندرون خانہ تشریح کی تھی۔ لہذا الگورتھم نے سیکھنے کے دوران مختلف ڈومینز میں جذبات کا اظہار مشکل سے دیکھا ہے۔ ہم نے اپنے جذبات کی درجہ بندی الگورتھم کو ڈومین کی تبدیلی کے لیے مضبوط بنانے کے لیے سیلف لرننگ کا استعمال کرنے کی کوشش کی۔ 2 ملین + غیر تشریح شدہ جملہ لیں، سیوڈولابلز بنانے کے لیے کلاسیفائر کا ایک پرانا ورژن چلائیں اور ان سیڈو لیبلز اور بوم کو سیکھنے کے لیے ایک نئے کلاسیفائر کو تربیت دیں۔ اسی. سچ ہونا بہت اچھا لگتا ہے، ہمارا کام دیکھیں:

(کاغذ) سینٹمنٹ کلاسیفائر کی تربیت کے لیے Psuedolabels کا استعمال ڈیٹاسیٹس میں ماڈل کو بہتر بناتا ہے۔ لنک

نتیش ریڈی، مکتبھ میانک سریواستو

ٹارگٹڈ جذبات کا پتہ لگانے کے لیے جدید ترین طریقہ بنانا

ہمارے لیے، NLP API کاروبار میں، ٹارگٹڈ جذبات اس وقت ہوتے ہیں جب آپ کے پاس یہ جملہ ہوتا ہے کہ "Apple اتنا مزیدار نہیں تھا، لیکن نارنجی اچھا تھا"، ایک درجہ بندی کرنے والا منفی واپس آتا ہے جب اسے ان پٹ "apple" ملتا ہے اور مثبت آتا ہے تو اسے نارنجی ملتا ہے۔ بنیادی طور پر، جذبات ایک جملے میں کسی چیز کی طرف ہدایت کرتا ہے۔ ہم نے ایک نیا طریقہ تیار کیا ہے جو ہدف شدہ جذبات کا پتہ لگاتا ہے اور جو جلد ہی NLP API کے طور پر دستیاب ہوگا۔ تحقیق کا میدان پہلو پر مبنی جذباتی تجزیہ سے مطابقت رکھتا ہے اور ہمارے حالیہ کام کو متعدد ڈیٹاسیٹس میں جدید ترین نتائج حاصل ہوتے ہیں، صرف ایک فن تعمیر کو سیاق و سباق سے متعلق [BERT] اور غیر متعلقہ [GloVe] کا موازنہ کرنے سے۔ جذبات کہیں سیاق و سباق میں چھپے ہیں، ٹھیک ہے؟

(کاغذ) کیا BERT جذبات کو سمجھتا ہے؟ پہلو پر مبنی جذباتی ماڈلز کو بہتر بنانے کے لیے سیاق و سباق اور غیر متعلقہ ایمبیڈنگز کے درمیان موازنہ کا فائدہ اٹھانا - لنک

نتیش ریڈی, پرنائی دیپ سنگھ, مکتبھ میانک سریواستو

حصہ 1 - کیا BERT پہلو پر مبنی جذباتی ماڈلز کو بہتر بنانے کے لیے سیاق و سباق اور غیر سیاق و سباق کے درمیان سرایت کرنے والے جذبات کے موازنہ کو سمجھتا ہے

حصہ 2 - کیا BERT پہلو پر مبنی جذباتی ماڈلز کو بہتر بنانے کے لیے سیاق و سباق اور غیر سیاق و سباق کے درمیان سرایت کرنے والے جذباتی موازنہ کو سمجھتا ہے؟ — ParallelDots پر ڈیٹا سائنس ٹیم - سال کے اختتام کی رپورٹ

آگے اور اوپر۔

امید ہے کہ آپ کو وہ نئی ٹیکنالوجی پسند آئی ہوگی جو ہم نے پچھلے سال تیار کی ہے۔ اگر آپ کے پاس سوالات ہیں تو جواب دینے میں بہت خوشی ہے۔ ہم نئی اور دلچسپ ٹکنالوجی تیار کرنا جاری رکھتے ہیں اور کچھ نئے ٹھنڈے مشین لرننگ مسائل پر کام کر رہے ہیں جیسے ریٹیل سفارشات کے لیے گراف نیورل نیٹ ورکس، آؤٹ آف ڈسٹری بیوشن امیج کی درجہ بندی اور زبان کے ماڈلز۔ ہم بھی بھرتی کر رہے ہیں، careers@paralleldots.com پر ہمیں لکھیں یا ہماری AI ٹیم میں شامل ہونے کے لیے ہمارے AngelList صفحہ پر درخواست دیں۔ اگر آپ مشین لرننگ انجینئر، بیک اینڈ ڈیولپر یا AI پروجیکٹ مینیجر بننا چاہتے ہیں تو آپ درخواست دے سکتے ہیں۔ ParallelDots AngelList

بلاگ پسند آیا؟ ہمارے دوسرے کو چیک کریں۔ بلاگز یہ دیکھنے کے لیے کہ کس طرح تصویر کی شناخت کی ٹیکنالوجی برانڈز کو ریٹیل میں اپنی عمل درآمد کی حکمت عملیوں کو بہتر بنانے میں مدد کر سکتی ہے۔

دیکھنا چاہتے ہیں کہ آپ کا اپنا برانڈ شیلف پر کیسا کارکردگی دکھا رہا ہے؟ کلک کریں۔ یہاں شیلف واچ کے لیے ایک مفت ڈیمو شیڈول کرنے کے لیے۔

شریک بانی اور چیف ڈیٹا سائنسدان، ParallelDots at متوازی ڈاٹس

مکتبھ میانک کی تازہ ترین پوسٹس (تمام دیکھ)

ٹائم اسٹیمپ: دسمبر 29، 2021جولائی 16، 2022

ٹائم اسٹیمپ: نومبر 10، 2021

ParallelDots پر ڈیٹا سائنس ٹیم - سال کے اختتام کی رپورٹ

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

AI ٹیم کے لیے چیلنجز [سرکا مارچ 2020]

نئے سسٹمز اور الگورتھم

موبائل پروڈکٹ ریکگنیشن AI یا موبائل شیلف ریکگنیشن AI

آٹو اسکیلنگ کلاؤڈ AI کا اندازہ

شیلف آبجیکٹ کا پتہ لگانے کے الگورتھم کو بہتر بنانا

بہتر درجہ بندی کی درستگی

شیلف امیجز پر سائز کی بنیاد پر اندازہ

پوائنٹ آف سیلز میٹریل کے بارے میں استدلال

ایک Sentiment Analysis API جو کسی بھی ڈومین ڈیٹا پر کام کرتا ہے۔

ٹارگٹڈ جذبات کا پتہ لگانے کے لیے جدید ترین طریقہ بنانا

آگے اور اوپر۔

سے زیادہ متوازی ڈاٹس

ParallelDots نے Btomorrow Ventures کی قیادت میں سیریز A راؤنڈ اٹھایا

جون 2022 ParallelDots پر: ParallelDots نے Btomorrow Ventures کی قیادت میں سیریز A راؤنڈ بڑھایا، اور مزید…

جون 2022 ParallelDots پر: ParallelDots نے Btomorrow Ventures کی قیادت میں سیریز A راؤنڈ بڑھایا، اور مزید…

کس طرح کیٹیگری مینیجر زمرہ کی ترقی کو چیمپیئن بنا سکتے ہیں اور بڑھتی ہوئی فروخت کو آگے بڑھانے میں مدد کر سکتے ہیں

ہمارے ISO 27001:2013 سرٹیفیکیشن کا اعلان

ریٹیل شیلف مانیٹرنگ میں تصویر کی شناخت کس طرح مدد کرتی ہے۔

ریٹیل ایگزیکیوشن کے لیے تصویر کی شناخت - متوازی ڈاٹس پارٹنرز کوواڈوس کے ساتھ وسطی یورپی مارکیٹس کے لیے

پرفیکٹ ریٹیل ایگزیکیوشن سٹریٹیجی کی تعمیر - تصویر کی شناخت کے ساتھ۔

شیلف واچ – ایک سمارٹ امیج ریکگنیشن پر مبنی ریٹیل ایگزیکیوشن سافٹ ویئر

ہمارے متعلق

عمودی تلاش اور Ai

پلیٹ فارم

مربوط رہو

اکاؤنٹ