ایمیزون ریکگنیشن کسٹم لیبلز اور ڈسالٹ سسٹمز 3DEXCITE کے ساتھ مصنوعی ڈیٹا سیٹس کا استعمال کرتے ہوئے کمپیوٹر ویژن

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

یہ برنارڈ پیکس، طوفان جواب کے CTO، اور Dassault Systèmes 3DExcite کے سینئر اسٹریٹجسٹ کارل ہرکٹ کے ساتھ مل کر لکھی گئی ایک پوسٹ ہے۔

اگرچہ کمپیوٹر وژن صنعتی دیکھ بھال، مینوفیکچرنگ، لاجسٹکس، اور صارفین کی ایپلی کیشنز کے لیے اہم ہو سکتا ہے، لیکن اس کو اپنانا تربیتی ڈیٹا سیٹس کی دستی تخلیق سے محدود ہے۔ صنعتی سیاق و سباق میں لیبل والی تصویروں کی تخلیق بنیادی طور پر دستی طور پر کی جاتی ہے، جس سے شناخت کی محدود صلاحیتیں پیدا ہوتی ہیں، پیمانہ نہیں ہوتا، اور اس کے نتیجے میں مزدوری کے اخراجات اور کاروباری قدر کے حصول میں تاخیر ہوتی ہے۔ یہ پروڈکٹ ڈیزائن، پروڈکٹ انجینئرنگ، اور پروڈکٹ کنفیگریشن میں تیزی سے تکرار کے ذریعے فراہم کردہ کاروباری چستی کے خلاف ہے۔ یہ عمل پیچیدہ مصنوعات جیسے کاروں، ہوائی جہازوں، یا جدید عمارتوں کے لیے پیمانہ نہیں ہے، کیونکہ ان حالات میں ہر لیبلنگ پروجیکٹ منفرد ہے (منفرد مصنوعات سے متعلق)۔ نتیجے کے طور پر، کمپیوٹر وژن ٹیکنالوجی کو ڈیٹا کی تیاری میں بڑی کوشش کے بغیر بڑے پیمانے پر منفرد پروجیکٹس پر آسانی سے لاگو نہیں کیا جا سکتا، بعض اوقات استعمال کیس کی ترسیل کو محدود کر دیتا ہے۔

اس پوسٹ میں، ہم ایک نیا نقطہ نظر پیش کرتے ہیں جہاں ڈیزائن اور CAD فائلوں سے انتہائی خصوصی کمپیوٹر ویژن سسٹم بنائے جاتے ہیں۔ ہم بصری طور پر درست ڈیجیٹل جڑواں بچوں کی تخلیق اور مصنوعی لیبل والی تصاویر کی تخلیق کے ساتھ شروع کرتے ہیں۔ پھر ہم ان تصاویر کو آگے بڑھاتے ہیں۔ ایمیزون ریکگنیشن کسٹم لیبلز اپنی مرضی کے مطابق آبجیکٹ کا پتہ لگانے کے ماڈل کو تربیت دینے کے لیے۔ سافٹ ویئر کے ساتھ موجودہ دانشورانہ املاک کا استعمال کرکے، ہم کمپیوٹر ویژن کو سستی اور مختلف صنعتی سیاق و سباق سے متعلقہ بنا رہے ہیں۔

شناختی نظام کی تخصیص کاروباری نتائج کو آگے بڑھانے میں مدد کرتی ہے۔

خصوصی کمپیوٹر ویژن سسٹم جو ڈیجیٹل جڑواں بچوں سے تیار کیے جاتے ہیں ان میں مخصوص خوبیاں ہوتی ہیں، جن کو استعمال کے درج ذیل معاملات میں واضح کیا جا سکتا ہے:

منفرد مصنوعات کے لیے ٹریس ایبلٹی - ایئربس، بوئنگ، اور دیگر ہوائی جہاز بنانے والے منفرد تفویض کرتے ہیں۔ مینوفیکچرر سیریل نمبرز (MSNs) ان کے تیار کردہ ہر ہوائی جہاز کو۔ یہ پیدا کرنے کے لئے، پورے پیداوار کے عمل میں منظم کیا جاتا ہے ایئر قابلیت کی دستاویزات اور پرواز کے لیے اجازت نامہ حاصل کریں۔ اے ڈیجیٹل جڑواں (ایک ورچوئل 3D ماڈل جو کسی فزیکل پروڈکٹ کی نمائندگی کرتا ہے) ہر MSN کی ترتیب سے اخذ کیا جا سکتا ہے، اور ایک تقسیم شدہ کمپیوٹر ویژن سسٹم تیار کرتا ہے جو صنعتی سہولیات میں اس MSN کی پیشرفت کو ٹریک کرتا ہے۔ حسب ضرورت شناخت ایئر لائنز کو دی گئی شفافیت کو خودکار بناتی ہے، اور ایئر لائنز کی طرف سے دستی طور پر انجام دی جانے والی زیادہ تر چیک پوائنٹس کو بدل دیتی ہے۔ منفرد مصنوعات پر خودکار کوالٹی اشورینس کا اطلاق ہوائی جہازوں، کاروں، عمارتوں اور یہاں تک کہ کرافٹ پروڈکشن پر بھی ہو سکتا ہے۔
سیاق و سباق میں اضافہ شدہ حقیقت - پیشہ ورانہ درجے کے کمپیوٹر ویژن سسٹمز محدود مناظر کی گنجائش کر سکتے ہیں، لیکن اعلیٰ امتیازی صلاحیتوں کے ساتھ۔ مثال کے طور پر، صنعتی دیکھ بھال میں، تصویر میں سکریو ڈرایور تلاش کرنا بیکار ہے۔ آپ کو سکریو ڈرایور ماڈل یا یہاں تک کہ اس کے سیریل نمبر کی شناخت کرنے کی ضرورت ہے۔ اس طرح کے پابند سیاق و سباق میں، حسب ضرورت شناخت کے نظام عام شناختی نظاموں سے بہتر کارکردگی کا مظاہرہ کرتے ہیں کیونکہ وہ اپنے نتائج میں زیادہ متعلقہ ہوتے ہیں۔ حسب ضرورت شناخت کے نظام درست فیڈ بیک لوپس کے ذریعے فعال کرتے ہیں۔ سرشار بڑھا ہوا حقیقت HMI یا موبائل آلات میں ڈیلیور کیا جاتا ہے۔
اینڈ ٹو اینڈ کوالٹی کنٹرول - کے ساتھ سسٹم انجینئرنگ، آپ جزوی تعمیرات کے ڈیجیٹل جڑواں بنا سکتے ہیں، اور کمپیوٹر ویژن سسٹم بنا سکتے ہیں جو مینوفیکچرنگ اور پروڈکشن کے مختلف مراحل کے مطابق ہوتے ہیں۔ بصری کنٹرول کو مینوفیکچرنگ ورک سٹیشنوں کے ساتھ جوڑا جا سکتا ہے، جس سے آخر سے آخر تک معائنہ اور نقائص کا جلد پتہ لگایا جا سکتا ہے۔ اپنی مرضی کی پہچان آخر سے آخر تک معائنہ کے لیے مؤثر طریقے سے اسمبلی لائنوں میں نقائص کے جھرن کو روکتا ہے۔ مسترد ہونے کی شرح کو کم کرنا اور پیداوار کی پیداوار کو زیادہ سے زیادہ کرنا حتمی مقصد ہے۔
لچکدار معیار کا معائنہ - جدید معیار کے معائنہ کو ڈیزائن کی مختلف حالتوں اور لچکدار مینوفیکچرنگ کے مطابق ڈھالنا پڑتا ہے۔ ڈیزائن میں تغیرات پروڈکٹ کے استعمال اور مصنوعات کی دیکھ بھال پر فیڈ بیک لوپس سے آتے ہیں۔ لچکدار مینوفیکچرنگ میک ٹو آرڈر حکمت عملی کے لیے ایک کلیدی صلاحیت ہے، اور لاگت کی اصلاح کے دبلی پتلی مینوفیکچرنگ اصول کے مطابق ہے۔ ڈیجیٹل جڑواں بچوں میں ڈیزائن کی مختلف حالتوں اور ترتیب کے اختیارات کو یکجا کر کے، حسب ضرورت شناخت کمپیوٹر وژن کے نظام کو پیداواری منصوبوں اور ڈیزائن کی مختلف حالتوں میں متحرک موافقت کے قابل بناتی ہے۔

Amazon Recognition کے ذریعے تقویت یافتہ Dassault Systèmes 3DEXCITE کے ساتھ کمپیوٹر ویژن کو بہتر بنائیں

Dassault Systèmes کے اندر، ڈیجیٹل جڑواں بچوں میں گہری مہارت رکھنے والی کمپنی جو کہ دوسرا بڑا یورپی سافٹ ویئر ایڈیٹر بھی ہے، 3DEXCITE ٹیم ایک مختلف راستہ تلاش کر رہی ہے۔ جیسا کہ کارل ہرکٹ نے وضاحت کی ہے، "کیا ہوگا اگر مصنوعی تصاویر سے تربیت یافتہ عصبی ماڈل کسی جسمانی مصنوعات کو پہچان سکے؟" 3DEXCITE نے اپنی ٹیکنالوجی کو AWS انفراسٹرکچر کے ساتھ ملا کر اس عجیب و غریب انداز کی فزیبلٹی کو ثابت کر کے اس مسئلے کو حل کیا ہے۔ کے نام سے بھی جانا جاتا ہے۔ کراس ڈومین آبجیکٹ کا پتہ لگانا، جہاں پتہ لگانے والا ماڈل ماخذ ڈومین (مصنوعی امیجز) سے لیبل لگائی گئی تصاویر سے سیکھتا ہے اور بغیر لیبل والے ٹارگٹ ڈومین (جسمانی اجزاء) کی پیشین گوئیاں کرتا ہے۔

Dassault Systèmes 3DEXCITE اور AWS پروٹوٹائپنگ ٹیم نے ایک ایسا مظاہرہ کرنے والا نظام بنانے کے لیے افواج میں شمولیت اختیار کی ہے جو صنعتی گیئر باکس کے حصوں کو پہچانتا ہے۔ یہ پروٹو ٹائپ 3 ہفتوں میں بنایا گیا تھا، اور تربیت یافتہ ماڈل نے 98% F1 سکور حاصل کیا۔ شناختی ماڈل کو مکمل طور پر ایک سافٹ ویئر پائپ لائن سے تربیت دی گئی ہے، جس میں حقیقی حصے کی کوئی تصویر نہیں ہے۔ صنعتی گیئر باکس کے ڈیزائن اور CAD فائلوں سے، 3DEXCITE نے بصری طور پر درست ڈیجیٹل جڑواں بچے بنائے ہیں۔ انہوں نے ڈیجیٹل جڑواں بچوں سے ہزاروں مصنوعی لیبل والی تصاویر بھی تیار کیں۔ پھر انہوں نے Recognition Custom Labels کا استعمال کرتے ہوئے ان تصاویر سے ایک انتہائی خصوصی اعصابی ماڈل کو تربیت دی اور ایک متعلقہ شناختی API فراہم کیا۔ انہوں نے گیئر باکس کے ایک جسمانی حصے کی کسی بھی ویب کیم سے شناخت کو فعال کرنے کے لیے ایک ویب سائٹ بنائی۔

ایمیزون پہچان۔ ایک AI سروس ہے جو آپ کو تصاویر اور ویڈیوز سے بامعنی میٹا ڈیٹا نکالنے کی اجازت دینے کے لیے ڈیپ لرننگ ٹکنالوجی کا استعمال کرتی ہے — بشمول اشیاء، لوگوں، متن، مناظر، سرگرمیوں، اور ممکنہ طور پر نامناسب مواد کی شناخت کرنے کے لیے — جس میں مشین لرننگ (ML) مہارت کی ضرورت نہیں ہے۔ Amazon Recognition انتہائی درست چہرے کا تجزیہ اور چہرے کی تلاش کی صلاحیتیں بھی فراہم کرتا ہے جسے آپ صارف کی توثیق، لوگوں کی گنتی، اور حفاظتی استعمال کے معاملات کی وسیع اقسام کے لیے چہروں کا پتہ لگانے، تجزیہ کرنے اور موازنہ کرنے کے لیے استعمال کر سکتے ہیں۔ آخر میں، Recognition Custom Labels کے ساتھ، آپ آبجیکٹ کا پتہ لگانے اور تصویر کی درجہ بندی کے ماڈل بنانے کے لیے اپنا ڈیٹا استعمال کر سکتے ہیں۔

کمپیوٹر وژن کے لیے ریکگنیشن کسٹم لیبلز کے ساتھ مصنوعی لیبل والی تصویروں کی تیاری کے لیے Dassault Systèmes ٹیکنالوجی کا امتزاج ریکگنیشن سسٹمز کے لیے ایک قابل توسیع ورک فلو فراہم کرتا ہے۔ استعمال میں آسانی یہاں ایک اہم مثبت عنصر ہے کیونکہ مجموعی سافٹ ویئر پائپ لائن میں Recognition Custom Labels کو شامل کرنا مشکل نہیں ہے — یہ اتنا ہی آسان ہے جتنا کسی API کو ورک فلو میں ضم کرنا۔ ایم ایل سائنسدان بننے کی ضرورت نہیں؛ صرف پکڑے گئے فریموں کو AWS کو بھیجیں اور نتیجہ حاصل کریں کہ آپ ڈیٹا بیس میں داخل ہو سکتے ہیں یا ویب براؤزر میں ڈسپلے کر سکتے ہیں۔

یہ تربیتی ڈیٹاسیٹس کی دستی تخلیق پر ڈرامائی بہتری کو مزید واضح کرتا ہے۔ آپ مہنگے، غیر ضروری کام کے اوقات کی ضرورت کے بغیر، تیزی سے اور زیادہ درستگی کے ساتھ بہتر نتائج حاصل کر سکتے ہیں۔ بہت سے ممکنہ استعمال کے معاملات کے ساتھ، Dassault Systèmes اور Recognition Custom Labels کا امتزاج آج کے کاروبار کو اہم اور فوری ROI فراہم کرنے کی صلاحیت رکھتا ہے۔

حل جائزہ

اس حل میں پہلا قدم ان تصاویر کو پیش کرنا ہے جو تربیتی ڈیٹاسیٹ بناتے ہیں۔ یہ 3DEXCITE پلیٹ فارم کے ذریعے کیا جاتا ہے۔ ہم اسکرپٹس کا استعمال کرکے پروگرامی طور پر لیبلنگ ڈیٹا تیار کرسکتے ہیں۔ ایمیزون سیج میکر گراؤنڈ ٹروتھ درجہ بندی اور آبجیکٹ کا پتہ لگانے کے کاموں کے لیے تصاویر اور ویڈیوز کو آسانی سے لیبل کرنے کے لیے ایک تشریحی ٹول فراہم کرتا ہے۔ ایمیزون ریکگنیشن میں ماڈل کو تربیت دینے کے لیے، لیبلنگ فائل کو گراؤنڈ ٹروتھ فارمیٹ کی تعمیل کرنے کی ضرورت ہے۔ یہ لیبل JSON میں ہیں، بشمول تصویر کا سائز، باؤنڈنگ باکس کوآرڈینیٹ، اور کلاس IDs۔

پھر مصنوعی تصاویر اور مینی فیسٹ کو اپ لوڈ کریں۔ ایمیزون سادہ اسٹوریج سروس (Amazon S3)، جہاں Recognition Custom Labels انہیں ٹریننگ ڈیٹاسیٹ کے اجزاء کے طور پر درآمد کر سکتے ہیں۔

Recognition Custom Labels کو ماڈلز بمقابلہ اصلی اجزاء کی تصاویر کے سیٹ کی جانچ کرنے دینے کے لیے، ہم کیمرے کے ساتھ لیے گئے اصلی انجن کے پرزوں کی تصاویر کا ایک سیٹ فراہم کرتے ہیں اور ٹیسٹنگ ڈیٹاسیٹ کے طور پر استعمال کرنے کے لیے انہیں Amazon S3 پر اپ لوڈ کرتے ہیں۔

آخر میں، Recognition Custom Labels مصنوعی تربیتی ڈیٹاسیٹ اور حقیقی اشیاء کی تصویروں پر مشتمل ٹیسٹنگ ڈیٹاسیٹ کا استعمال کرتے ہوئے آبجیکٹ کا پتہ لگانے کے بہترین ماڈل کو تربیت دیتا ہے، اور اس ماڈل کے ساتھ اختتامی نقطہ تخلیق کرتا ہے جسے ہم اپنی درخواست میں آبجیکٹ کی شناخت چلانے کے لیے استعمال کر سکتے ہیں۔

درج ذیل خاکہ ہمارے حل کے ورک فلو کی وضاحت کرتا ہے:

مصنوعی تصاویر بنائیں

مصنوعی تصاویر 3Dexperience پلیٹ فارم سے تیار کی گئی ہیں، جو Dassault Systèmes کی پیداوار ہے۔ یہ پلیٹ فارم آپ کو آبجیکٹ کی CAD (کمپیوٹر کی مدد سے ڈیزائن) فائل کی بنیاد پر فوٹو ریئلسٹک تصاویر بنانے اور پیش کرنے کی اجازت دیتا ہے۔ ہم پلیٹ فارم پر امیج ٹرانسفارمیشن کنفیگریشنز کو تبدیل کر کے چند گھنٹوں میں ہزاروں قسمیں تیار کر سکتے ہیں۔

اس پروٹوٹائپ میں، ہم نے آبجیکٹ کا پتہ لگانے کے لیے مندرجہ ذیل پانچ بصری طور پر الگ الگ گیئر باکس حصوں کا انتخاب کیا۔ ان میں گیئر ہاؤسنگ، گیئر ریشو، بیئرنگ کور، فلینج، اور ورم گیئر شامل ہیں۔

ہم نے تصویر کے تنوع کو بڑھانے اور مصنوعی ڈیٹا کو مزید فوٹو ریئلسٹک بنانے کے لیے درج ذیل ڈیٹا کو بڑھانے کے طریقے استعمال کیے ہیں۔ یہ ماڈل کو عام کرنے کی غلطی کو کم کرنے میں مدد کرتا ہے۔

/ باہر زوم - یہ طریقہ تصادفی طور پر تصویروں میں آبجیکٹ کو زوم ان یا آؤٹ کرتا ہے۔
گھماؤ - یہ طریقہ تصویروں میں آبجیکٹ کو گھماتا ہے، اور ایسا لگتا ہے کہ ایک ورچوئل کیمرا 360 ڈگری کے زاویوں سے آبجیکٹ کی بے ترتیب تصاویر لیتا ہے۔
مواد کی شکل و صورت کو بہتر بنائیں - ہم نے شناخت کیا کہ کچھ گیئر حصوں کے لیے مواد کی شکل ابتدائی رینڈرنگ میں کم حقیقت پسندانہ ہے۔ ہم نے مصنوعی تصاویر کو بہتر بنانے کے لیے ایک دھاتی اثر شامل کیا۔
روشنی کی مختلف ترتیبات استعمال کریں۔ - اس پروٹو ٹائپ میں، ہم نے روشنی کے دو حالات بنائے:
- گودام - ایک حقیقت پسندانہ روشنی کی تقسیم۔ سائے اور عکاسی ممکن ہے۔
- سٹوڈیو - ایک یکساں روشنی اس چیز کے چاروں طرف ڈالی جاتی ہے۔ یہ حقیقت پسندانہ نہیں ہے لیکن اس میں کوئی سائے یا عکاسی نہیں ہے۔
ایک حقیقت پسندانہ پوزیشن کا استعمال کریں کہ اصل وقت میں آبجیکٹ کو کس طرح دیکھا جاتا ہے۔ - حقیقی زندگی میں، کچھ اشیاء، جیسے کہ فلینج اور بیئرنگ کور، عام طور پر کسی سطح پر رکھی جاتی ہیں، اور ماڈل اوپر اور نیچے کے پہلوؤں کی بنیاد پر اشیاء کا پتہ لگا رہا ہے۔ لہذا، ہم نے تربیتی تصاویر کو ہٹا دیا جو حصوں کے پتلے کنارے کو ظاہر کرتی ہیں، جسے کنارے کی پوزیشن بھی کہا جاتا ہے، اور فلیٹ پوزیشن میں اشیاء کی تصاویر کو بڑھایا۔
ایک تصویر میں متعدد اشیاء شامل کریں۔ - حقیقی زندگی کے منظرناموں میں، ایک سے زیادہ گیئر پارٹس ایک ہی منظر میں ظاہر ہو سکتے ہیں، اس لیے ہم نے ایسی تصاویر تیار کیں جن میں گیئر کے متعدد پرزے ہوں۔

3Dexperience پلیٹ فارم پر، ہم تصاویر پر مختلف پس منظر کا اطلاق کر سکتے ہیں، جس سے تصویری تنوع کو مزید بڑھانے میں مدد مل سکتی ہے۔ وقت کی پابندی کی وجہ سے، ہم نے اسے اس پروٹو ٹائپ میں نافذ نہیں کیا۔

مصنوعی تربیتی ڈیٹاسیٹ درآمد کریں۔

ML میں، لیبل لگے ہوئے ڈیٹا کا مطلب ہے کہ ہدف کو دکھانے کے لیے تربیتی ڈیٹا کی تشریح کی گئی ہے، جس کا جواب آپ چاہتے ہیں کہ آپ کا ML ماڈل پیش گوئی کرے۔ لیبل شدہ ڈیٹا جو Recognition Custom Labels کے ذریعے استعمال کیا جا سکتا ہے، وہ زمینی سچائی کے مینی فیسٹ فائل کے تقاضوں کے مطابق ہونا چاہیے۔ ایک مینی فیسٹ فائل ایک یا زیادہ JSON لائنوں سے بنی ہے۔ ہر لائن میں ایک تصویر کی معلومات ہوتی ہے۔ مصنوعی تربیتی اعداد و شمار کے لیے، لیبلنگ کی معلومات پروگرام کے مطابق CAD فائل اور تصویری تبدیلی کی ترتیب کی بنیاد پر تیار کی جا سکتی ہیں جن کا ہم نے پہلے ذکر کیا ہے، جو لیبلنگ کے کام کی اہم دستی کوشش کو بچاتا ہے۔ لیبلنگ فائل فارمیٹس کے تقاضوں کے بارے میں مزید معلومات کے لیے، رجوع کریں۔ ایک مینی فیسٹ فائل بنائیں اور مینی فیسٹ فائلوں میں آبجیکٹ لوکلائزیشن. مندرجہ ذیل تصویر لیبلنگ کی ایک مثال ہے:

{ "source-ref": "s3://<bucket>/<prefix>/multiple_objects.png", "bounding-box": { "image_size": [ { "width": 1024, "height": 1024, "depth": 3 } ], "annotations": [ { "class_id": 1, "top": 703, "left": 606, "width": 179, "height": 157 }, { "class_id": 4, "top": 233, "left": 533, "width": 118, "height": 139 }, { "class_id": 0, "top": 592, "left": 154, "width": 231, "height": 332 }, { "class_id": 3, "top": 143, "left": 129, "width": 268, "height": 250 } ] }, "bounding-box-metadata": { "objects": [ { "confidence": 1 }, { "confidence": 1 }, { "confidence": 1 }, { "confidence": 1 } ], "class-map": { "0": "Gear_Housing", "1": "Gear_Ratio", "3": "Flange", "4": "Worm_Gear" }, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2021-06-18T11:56:01", "job-name": "3DEXCITE" }
}

مینی فیسٹ فائل تیار ہونے کے بعد، ہم اسے S3 بالٹی پر اپ لوڈ کرتے ہیں، اور پھر آپشن کو منتخب کرکے Recognition Custom Labels میں ایک ٹریننگ ڈیٹاسیٹ بناتے ہیں۔ ایمیزون سیج میکر گراؤنڈ ٹروتھ کے لیبل والی تصاویر درآمد کریں۔.

مینی فیسٹ فائل درآمد ہونے کے بعد، ہم ایمیزون ریکوگنیشن کنسول پر لیبلنگ کی معلومات کو بصری طور پر دیکھ سکتے ہیں۔ اس سے ہمیں تصدیق کرنے میں مدد ملتی ہے کہ مینی فیسٹ فائل تیار اور درآمد کی گئی ہے۔ مزید خاص طور پر، باؤنڈنگ بکس کو امیجز میں موجود اشیاء کے ساتھ سیدھ میں لانا چاہیے، اور آبجیکٹ کی کلاس آئی ڈیز کو صحیح طریقے سے تفویض کیا جانا چاہیے۔

ٹیسٹنگ ڈیٹاسیٹ بنائیں

ٹیسٹ امیجز کو حقیقی زندگی میں فون یا کیمرہ کے ساتھ مختلف زاویوں اور روشنی کے حالات سے لیا جاتا ہے، کیونکہ ہم ماڈل کی درستگی کی توثیق کرنا چاہتے ہیں، جسے ہم نے مصنوعی ڈیٹا کا استعمال کرتے ہوئے تربیت دی تھی، حقیقی زندگی کے منظرناموں کے خلاف۔ آپ ان ٹیسٹ امیجز کو S3 بالٹی میں اپ لوڈ کر سکتے ہیں، اور پھر انہیں شناخت کے حسب ضرورت لیبلز میں ڈیٹا سیٹ کے طور پر درآمد کر سکتے ہیں۔ یا آپ انہیں اپنی مقامی مشین سے ڈیٹا سیٹس پر براہ راست اپ لوڈ کر سکتے ہیں۔

Recognition Custom Labels بلٹ ان تصویری تشریح کی صلاحیت فراہم کرتا ہے، جس کا تجربہ زمینی سچائی جیسا ہی ہوتا ہے۔ ٹیسٹ ڈیٹا درآمد ہونے پر آپ لیبلنگ کا کام شروع کر سکتے ہیں۔ آبجیکٹ کا پتہ لگانے کے استعمال کے کیس کے لیے، باؤنڈنگ باکسز کو دلچسپی کی چیزوں کے گرد مضبوطی سے بنایا جانا چاہیے، جس سے ماڈل کو ان علاقوں اور پکسلز کو درست طریقے سے سیکھنے میں مدد ملتی ہے جو ہدف کی اشیاء سے تعلق رکھتے ہیں۔ اس کے علاوہ، آپ کو تمام امیجز میں ٹارگٹ آبجیکٹ کی ہر مثال پر لیبل لگانا چاہیے، یہاں تک کہ وہ بھی جو جزوی طور پر نظر سے باہر ہیں یا دوسری اشیاء کے ذریعے بند ہیں، بصورت دیگر ماڈل مزید غلط منفی کی پیش گوئی کرتا ہے۔

کراس ڈومین آبجیکٹ کا پتہ لگانے کا ماڈل بنائیں

Recognition Custom Labels ایک مکمل طور پر منظم سروس ہے؛ آپ کو صرف ٹرین اور ٹیسٹ ڈیٹا سیٹ فراہم کرنے کی ضرورت ہے۔ یہ ماڈلز کے ایک سیٹ کو تربیت دیتا ہے اور فراہم کردہ ڈیٹا کی بنیاد پر بہترین کارکردگی کا مظاہرہ کرنے والے کا انتخاب کرتا ہے۔ اس پروٹوٹائپ میں، ہم تصویری بڑھانے کے طریقوں کے مختلف امتزاج کے ساتھ تجربہ کرکے مصنوعی تربیتی ڈیٹاسیٹس تیار کرتے ہیں جن کا ہم نے پہلے ذکر کیا ہے۔ Recognition Custom Labels میں ہر تربیتی ڈیٹاسیٹ کے لیے ایک ماڈل بنایا گیا ہے، جو ہمیں خاص طور پر اس استعمال کے کیس کے لیے بہترین تربیتی ڈیٹاسیٹ کا موازنہ اور تلاش کرنے کی اجازت دیتا ہے۔ ہر ماڈل میں تربیتی تصاویر کی کم از کم تعداد ہوتی ہے، اچھی تصویری تنوع پر مشتمل ہوتا ہے، اور بہترین ماڈل کی درستگی فراہم کرتا ہے۔ 15 تکرار کے بعد، ہم نے تقریباً 1 مصنوعی تربیتی تصاویر کا استعمال کرتے ہوئے 98% ماڈل کی درستگی کا F10,000 سکور حاصل کیا، جو کہ اوسطاً 2,000 تصاویر فی آبجیکٹ ہے۔

ماڈل انفرنس کے نتائج

مندرجہ ذیل تصویر میں Amazon Recognition ماڈل کو ریئل ٹائم انفرنس ایپلی کیشن میں استعمال کیا جا رہا ہے۔ تمام اجزاء کو اعلی اعتماد کے ساتھ صحیح طریقے سے پتہ چلا ہے۔

Amazon Recognition Custom Labels اور Dassault Systèmes 3DEXCITE PlatoBlockchain Data Intelligence کے ساتھ مصنوعی ڈیٹاسیٹس کا استعمال کرتے ہوئے کمپیوٹر ویژن۔ عمودی تلاش۔ عی

نتیجہ

اس پوسٹ میں، ہم نے دکھایا کہ کمپیوٹر وژن ماڈل کو خالص مصنوعی امیجز پر کیسے تربیت دی جائے، اور یہ ماڈل اب بھی حقیقی دنیا کی اشیاء کو کیسے پہچان سکتا ہے۔ یہ تربیتی ڈیٹا کو جمع کرنے اور لیبل لگانے میں اہم دستی کوشش کو بچاتا ہے۔ اس تلاش کے ساتھ، Dassault Systèmes ڈیزائنرز اور انجینئرز کے تیار کردہ 3D پروڈکٹ ماڈلز کی کاروباری قدر کو بڑھا رہا ہے، کیونکہ اب آپ CAD، CAE، اور PLM ڈیٹا کو جسمانی دنیا میں تصاویر کی شناخت کے نظام میں استعمال کر سکتے ہیں۔

Recognition Custom Labels کی کلیدی خصوصیات اور استعمال کے معاملات کے بارے میں مزید معلومات کے لیے، دیکھیں ایمیزون ریکگنیشن کسٹم لیبلز. اگر آپ کی تصاویر پر مقامی طور پر زمینی سچائی کا لیبل نہیں لگایا گیا ہے، جو کہ اس پروجیکٹ کا معاملہ تھا، تو دیکھیں مینی فیسٹ فائل بنانا اپنے لیبلنگ ڈیٹا کو اس فارمیٹ میں تبدیل کرنے کے لیے جسے Recognition Custom Labels استعمال کر سکتے ہیں۔

مصنفین کے بارے میں

ووڈی بوراکینو فی الحال AWS میں ایک سینئر مشین لرننگ اسپیشلسٹ سولیوشن آرکیٹیکٹ ہیں۔ میلان، اٹلی میں مقیم، ووڈی نے 2015 میں AWS میں شامل ہونے سے پہلے سافٹ ویئر ڈویلپمنٹ پر کام کیا، جہاں وہ کمپیوٹر وژن اور اسپیشل کمپیوٹنگ (AR/VR/XR) ٹیکنالوجیز کا جنون ہے۔ اس کا جذبہ اب میٹاورس انوویشن پر مرکوز ہے۔ اس پر عمل کریں۔ لنکڈ.

ینگ ہو، پی ایچ ڈی، AWS میں مشین لرننگ پروٹو ٹائپنگ آرکیٹیکٹ ہے۔ اس کی دلچسپی کے اہم شعبے ڈیپ لرننگ، کمپیوٹر ویژن، این ایل پی اور ٹائم سیریز ڈیٹا پریڈیکشن ہیں۔ اپنے فارغ وقت میں، وہ ناول پڑھنے اور برطانیہ کے نیشنل پارکس میں پیدل سفر سے لطف اندوز ہوتی ہیں۔

برنارڈ پیکس اس وقت طوفان جواب کا CTO ہے جو AWS پر تعینات صنعتی حل پر مرکوز ہے۔ پیرس، فرانس میں مقیم، برنارڈ نے پہلے بطور پرنسپل سولیوشن آرکیٹیکٹ اور AWS میں پرنسپل کنسلٹنٹ کے طور پر کام کیا۔ انٹرپرائز ماڈرنائزیشن میں ان کی شراکتیں AWS برائے صنعتی، AWS CDK کا احاطہ کرتی ہیں، اور یہ اب گرین آئی ٹی اور آواز پر مبنی نظاموں میں شامل ہیں۔ اس کی پیروی کریں۔ ٹویٹر.

کارل ہرکٹ فی الحال Dassault Systèmes 3DExcite میں سینئر سٹریٹجسٹ ہیں۔ میونخ، جرمنی میں مقیم، وہ کمپیوٹر وژن کے جدید نفاذات تخلیق کرتا ہے جو ٹھوس نتائج فراہم کرتے ہیں۔ اس پر عمل کریں۔ لنکڈ.

ٹائم اسٹیمپ: مارچ 14، 2022

Amazon Recognition Custom Labels اور Dassault Systèmes 3DEXCITE کے ساتھ مصنوعی ڈیٹاسیٹس کا استعمال کرتے ہوئے کمپیوٹر ویژن

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

شناختی نظام کی تخصیص کاروباری نتائج کو آگے بڑھانے میں مدد کرتی ہے۔

Amazon Recognition کے ذریعے تقویت یافتہ Dassault Systèmes 3DEXCITE کے ساتھ کمپیوٹر ویژن کو بہتر بنائیں

حل جائزہ

مصنوعی تصاویر بنائیں

مصنوعی تربیتی ڈیٹاسیٹ درآمد کریں۔

ٹیسٹنگ ڈیٹاسیٹ بنائیں

کراس ڈومین آبجیکٹ کا پتہ لگانے کا ماڈل بنائیں

ماڈل انفرنس کے نتائج

نتیجہ

مصنفین کے بارے میں

سے زیادہ AWS مشین لرننگ

ایمیزون سیج میکر پر شارڈڈ ڈیٹا کی ہم آہنگی کا استعمال کرتے ہوئے قریب لکیری اسکیلنگ کے ساتھ بڑے ماڈلز کو تربیت دیں

Amazon SageMaker جغرافیائی صلاحیتوں کا استعمال کرتے ہوئے چوہا کے انفیکشن کا تجزیہ کریں | ایمیزون ویب سروسز

NFL کے نیکسٹ جنرل کے اعدادوشمار میں دفاعی کوریج اسکیموں کی نشاندہی کرنا

Amazon Translate کا استعمال کرتے ہوئے Salesforce Service Cloud پر کثیر لسانی کسٹمر سپورٹ ترجمہ آسان بنا دیا گیا۔

اپنے تربیتی اسکرپٹس کا استعمال کریں اور Amazon SageMaker میں ہائپر پیرامیٹر آپٹیمائزیشن کا استعمال کرتے ہوئے خود بخود بہترین ماڈل منتخب کریں۔

ایمیزون پر Amp نے کس طرح کسٹمر کی مصروفیت بڑھانے کے لیے ڈیٹا کا استعمال کیا، حصہ 1: ڈیٹا اینالیٹکس پلیٹ فارم بنانا

انسانی جائزے اور BI ویژولائزیشن کے ساتھ ذہین دستاویز پروسیسنگ کے لیے کاروباری اصولوں کو حسب ضرورت بنائیں

Amazon SageMaker کے ساتھ صحت کی دیکھ بھال کے لیے خلاصہ کے اختیارات کی تلاش | ایمیزون ویب سروسز

ہمارے متعلق

عمودی تلاش اور Ai

پلیٹ فارم

مربوط رہو

اکاؤنٹ