ہاؤسنگ کی قیمت کا تعین مشین لرننگ (ML) کے استعمال کی بہترین مثال ہے۔ ایک اہم اثر ہیریسن اور روبن فیلڈ (1978) نے بنایا، جس نے ایک اہم کاغذ اور ڈیٹاسیٹ شائع کیا جو بوسٹن ہاؤسنگ ڈیٹاسیٹ کے نام سے غیر رسمی طور پر مشہور ہوا۔ اس بنیادی کام نے متعدد جہتوں کے فنکشن کے طور پر مکانات کی قیمتوں کا تخمینہ لگانے کا ایک طریقہ تجویز کیا، بشمول ہوا کا معیار، جو ان کی تحقیق کا بنیادی مرکز تھا۔ تقریباً 50 سال بعد، مکانات کی قیمتوں کا تخمینہ کاروباری فیصلہ سازی میں ڈیٹا اور ایم ایل کے استعمال میں دلچسپی رکھنے والے طلباء اور پیشہ ور افراد کے لیے ایک اہم تدریسی آلہ بن گیا ہے۔
اس پوسٹ میں، ہم ایک اوپن سورس ماڈل کے استعمال پر بحث کرتے ہیں جو خاص طور پر بصری سوالوں کے جوابات (VQA) کے کام کے لیے ڈیزائن کیا گیا ہے۔ VQA کے ساتھ، آپ فطری زبان کا استعمال کرتے ہوئے تصویر کا سوال پوچھ سکتے ہیں اور اپنے سوال کا جواب حاصل کر سکتے ہیں—سادہ زبان میں بھی۔ اس پوسٹ میں ہمارا مقصد حوصلہ افزائی کرنا اور یہ ظاہر کرنا ہے کہ اس ٹیکنالوجی کا استعمال کرتے ہوئے کیا ممکن ہے۔ ہم اس صلاحیت کے ساتھ استعمال کرنے کی تجویز کرتے ہیں۔ ایمیزون سیج میکر ML استعمال کے معاملے میں ریگریشن ماڈل کی درستگی کو بہتر بنانے کے لیے خدمات کا پلیٹ فارم، اور آزادانہ طور پر، بصری تصاویر کی خودکار ٹیگنگ کے لیے۔
ہم ایک متعلقہ فراہم کرتے ہیں یو ٹیوب ویڈیو یہ ظاہر کرتا ہے کہ یہاں کیا بات کی گئی ہے۔ سب سے نمایاں نقطہ کو اجاگر کرنے کے لیے ویڈیو پلے بیک درمیان میں شروع ہو جائے گا۔ ہم تجویز کرتے ہیں کہ آپ ویڈیو کے ساتھ اس پڑھنے کی پیروی کریں تاکہ اس تصور کو تقویت ملے اور اس کی بہتر تفہیم حاصل کی جا سکے۔
فاؤنڈیشن ماڈلز
یہ حل Hugging Face ماڈل ریپوزٹری میں شائع کردہ فاؤنڈیشن ماڈل کے استعمال پر مرکوز ہے۔ یہاں، ہم اصطلاح استعمال کرتے ہیں۔ بنیاد ماڈل ایک مصنوعی ذہانت (AI) کی صلاحیت کو بیان کرنے کے لیے جو ڈیٹا کے ایک بڑے اور متنوع جسم پر پہلے سے تربیت یافتہ ہے۔ فاؤنڈیشن ماڈل کبھی کبھی زیرو سے ماڈل کی تربیت کے بوجھ کے بغیر استعمال کے لیے تیار ہو سکتے ہیں۔ کچھ فاؤنڈیشن ماڈلز کو ٹھیک بنایا جا سکتا ہے، جس کا مطلب ہے کہ انہیں اضافی پیٹرن سکھانا جو آپ کے کاروبار سے متعلق ہیں لیکن اصل، عمومی شائع شدہ ماڈل سے غائب ہیں۔ بعض اوقات درست جوابات فراہم کرنے کے لیے فائن ٹیوننگ کی ضرورت ہوتی ہے جو آپ کے استعمال کے معاملے یا علم کے جسم کے لیے منفرد ہوتے ہیں۔
میں گلے لگانے والا چہرہ ریپوزٹری، منتخب کرنے کے لیے کئی VQA ماڈلز موجود ہیں۔ ہم نے اس تحریر کے وقت سب سے زیادہ ڈاؤن لوڈز والا ماڈل منتخب کیا۔ اگرچہ یہ پوسٹ اوپن سورس ماڈل ریپوزٹری سے ماڈل استعمال کرنے کی صلاحیت کو ظاہر کرتی ہے، لیکن یہی تصور اس ماڈل پر لاگو ہوگا جسے آپ نے صفر سے تربیت دی ہو یا کسی دوسرے قابل اعتماد فراہم کنندہ سے استعمال کیا ہو۔
کلاسیکی استعمال کے معاملے میں ایک جدید نقطہ نظر
گھر کی قیمت کا تخمینہ روایتی طور پر ٹیبلر ڈیٹا کے ذریعے ہوتا ہے جہاں پراپرٹی کی خصوصیات کو قیمت بتانے کے لیے استعمال کیا جاتا ہے۔ اگرچہ غور کرنے کے لیے سیکڑوں خصوصیات ہو سکتی ہیں، لیکن کچھ بنیادی مثالیں تیار جگہ میں گھر کا سائز، بیڈ رومز اور باتھ رومز کی تعداد، اور رہائش کا مقام ہیں۔
مشین لرننگ ٹیبلر ڈیٹا سے ہٹ کر متنوع ان پٹ ذرائع کو شامل کرنے کی صلاحیت رکھتی ہے، جیسے آڈیو، اسٹیل امیجز، موشن ویڈیو، اور قدرتی زبان۔ AI میں، اصطلاح ملٹی موڈل مختلف قسم کے میڈیا کے استعمال سے مراد ہے، جیسے تصاویر اور ٹیبلر ڈیٹا۔ اس پوسٹ میں، ہم دکھاتے ہیں کہ آج کی جدید دنیا کے ذریعہ تیار کردہ وافر ڈیجیٹل ایگزاسٹ میں بند پوشیدہ قدر کو تلاش کرنے اور آزاد کرنے کے لیے ملٹی موڈل ڈیٹا کا استعمال کیسے کیا جائے۔
اس خیال کو ذہن میں رکھتے ہوئے، ہم پراپرٹی کی تصاویر سے پوشیدہ خصوصیات کو نکالنے کے لیے فاؤنڈیشن ماڈل کے استعمال کا مظاہرہ کرتے ہیں۔ تصاویر میں پائی جانے والی بصیرتوں کو استعمال کرکے، جو پہلے ٹیبلر ڈیٹا میں دستیاب نہیں تھی، ہم ماڈل کی درستگی کو بہتر بنا سکتے ہیں۔ اس پوسٹ میں زیر بحث تصاویر اور ٹیبلر ڈیٹا دونوں ہی اصل میں دستیاب اور شائع کیے گئے تھے۔ GitHub کے بذریعہ احمد اور مصطفیٰ (2016)۔
ایک تصویر کی قیمت ہزار الفاظ ہے
اب جب کہ ہم VQA کی صلاحیتوں کو سمجھ چکے ہیں، آئیے کچن کی دو درج ذیل تصاویر پر غور کریں۔ آپ ان تصاویر سے گھر کی قیمت کا اندازہ کیسے لگائیں گے؟ کچھ سوالات کیا ہیں جو آپ خود سے پوچھیں گے؟ ہر تصویر آپ کے ذہن میں درجنوں سوالات پیدا کر سکتی ہے۔ ان میں سے کچھ سوالات بامعنی جوابات کا باعث بن سکتے ہیں جو گھر کی تشخیص کے عمل کو بہتر بناتے ہیں۔
Unsplash پر فرانسسکا توسولینی (L) اور Sidekix Media (R) کو تصاویر کریڈٹ کرتی ہیں۔
مندرجہ ذیل جدول VQA کے تعاملات کی مثالیں ان کے متعلقہ جوابات کے ساتھ سوالات کو دکھا کر فراہم کرتا ہے۔ جوابات واضح، مسلسل قدر، یا بائنری جوابات کی شکل میں آ سکتے ہیں۔
مثال سوال | فاؤنڈیشن ماڈل سے مثالی جواب |
کاؤنٹر ٹاپس کس چیز سے بنے ہیں؟ | گرینائٹ، ٹائل، سنگ مرمر، ٹکڑے ٹکڑے، وغیرہ |
کیا یہ ایک مہنگا باورچی خانہ ہے؟ | ہاں نہیں |
کتنے الگ الگ ڈوب ہیں؟ | 0، 1، 2 |
حوالہ فن تعمیر
اس پوسٹ میں، ہم استعمال کرتے ہیں ایمیزون سیج میکر ڈیٹا رینگلر ڈیٹا سیٹ میں ہزاروں تصاویر کے لیے بصری سوالات کے یکساں سیٹ سے پوچھنا۔ سیج میکر ڈیٹا رینگلر ڈیٹا کی تیاری اور فیچر انجینئرنگ کے عمل کو آسان بنانے کے لیے مقصد سے بنایا گیا ہے۔ 300 سے زیادہ بلٹ ان ٹرانسفارمیشنز فراہم کرکے، SageMaker Data Wrangler ML کے لیے ٹیبلر اور امیج ڈیٹا تیار کرنے میں لگنے والے وقت کو ہفتوں سے منٹ تک کم کرنے میں مدد کرتا ہے۔ یہاں، SageMaker Data Wrangler ماڈل ٹریننگ کے لیے فاؤنڈیشن ماڈل کی تصویر سے پیدا ہونے والی خصوصیات کے ساتھ اصل ٹیبلر سیٹ سے ڈیٹا کی خصوصیات کو یکجا کرتا ہے۔
اگلا، ہم کے استعمال کے ساتھ ایک رجعت ماڈل کی تعمیر ایمیزون سیج میکر کینوس. SageMaker Canvas بغیر کوئی کوڈ لکھے ایک ماڈل بنا سکتا ہے، اور ابتدائی نتائج 2-15 منٹ میں فراہم کر سکتا ہے۔ مندرجہ ذیل حصے میں، ہم اس حل کی رہنمائی کو ممکن بنانے کے لیے ایک حوالہ فن تعمیر فراہم کرتے ہیں۔
Hugging Face اور دیگر فراہم کنندگان کے بہت سے مشہور ماڈلز ایک کلک کے ساتھ قابل تعینات ہیں۔ ایمیزون سیج میکر جمپ اسٹارٹ. ان ذخیروں میں سینکڑوں ہزاروں ماڈل دستیاب ہیں۔ اس پوسٹ کے لیے، ہم ایک ایسا ماڈل منتخب کرتے ہیں جو SageMaker JumpStart میں دستیاب نہیں ہے، جس کے لیے گاہک کی تعیناتی کی ضرورت ہے۔ جیسا کہ مندرجہ ذیل تصویر میں دکھایا گیا ہے، ہم ایک کا استعمال کرتے ہوئے اندازہ لگانے کے لیے ایک گلے لگانے والے چہرے کا ماڈل لگاتے ہیں۔ ایمیزون سیج میکر اسٹوڈیو کاپی. نوٹ بک کا استعمال ریئل ٹائم انفرنس کے لیے اینڈ پوائنٹ کو تعینات کرنے کے لیے کیا جاتا ہے۔ نوٹ بک ایسے اثاثوں کا استعمال کرتی ہے جس میں Hugging Face بائنری ماڈل، کنٹینر امیج کا ایک پوائنٹر، اور ایک مقصد سے بنایا گیا inference.py اسکرپٹ شامل ہے جو ماڈل کے متوقع ان پٹ اور آؤٹ پٹ سے میل کھاتا ہے۔ جیسا کہ آپ اسے پڑھتے ہیں، دستیاب VQA ماڈلز کا مرکب تبدیل ہو سکتا ہے۔ اہم بات یہ ہے کہ دستیاب VQA ماڈلز کا جائزہ لینا، جس وقت آپ اسے پڑھتے ہیں، اور اپنے منتخب کردہ ماڈل کو تعینات کرنے کے لیے تیار رہیں، جس کی اپنی API درخواست اور جوابی معاہدہ ہوگا۔
SageMaker اینڈ پوائنٹ کے ذریعے VQA ماڈل پیش کیے جانے کے بعد، ہم پائپ لائن کو آرکیسٹریٹ کرنے کے لیے SageMaker ڈیٹا رینگلر کا استعمال کرتے ہیں جو بالآخر ڈیجیٹل امیجز سے اخذ کردہ ٹیبلولر ڈیٹا اور خصوصیات کو یکجا کرتی ہے اور ماڈل ٹریننگ کے لیے ڈیٹا کو نئی شکل دیتی ہے۔ اگلا اعداد و شمار ایک نظریہ پیش کرتا ہے کہ کس طرح پورے پیمانے پر ڈیٹا کی تبدیلی کا کام چلایا جاتا ہے۔
درج ذیل تصویر میں، ہم ڈیٹا کی تیاری کے کاموں کو ترتیب دینے کے لیے SageMaker Data Wrangler اور SageMaker Canvas کو ماڈل ٹریننگ کے لیے استعمال کرتے ہیں۔ سب سے پہلے، سیج میکر ڈیٹا رینگلر استعمال کرتا ہے۔ ایمیزون لوکیشن سروس خام ڈیٹا میں دستیاب زپ کوڈز کو عرض البلد اور طول البلد کی خصوصیات میں تبدیل کرنے کے لیے۔ دوسرا، SageMaker Data Wrangler حقیقی وقت کا اندازہ لگانے کے لیے SageMaker کی میزبانی کے اختتامی نقطہ پر ہزاروں تصاویر بھیجنے میں ہم آہنگی پیدا کرنے کے قابل ہے، ہر منظر کے لیے یکساں سوالات پوچھتا ہے۔ اس کے نتیجے میں خصوصیات کی ایک بھرپور صف پیدا ہوتی ہے جو کچن، باتھ رومز، گھر کے بیرونی حصوں وغیرہ میں مشاہدہ کی گئی خصوصیات کو بیان کرتی ہے۔ سیج میکر ڈیٹا رینگلر کے ذریعہ ڈیٹا تیار کرنے کے بعد، ایک تربیتی ڈیٹا سیٹ دستیاب ہے۔ ایمیزون سادہ اسٹوریج سروس (ایمیزون S3)۔ S3 ڈیٹا کو ان پٹ کے طور پر استعمال کرتے ہوئے، SageMaker Canvas کسی بھی کوڈ کو لکھے بغیر، 2-15 منٹ میں، ایک ماڈل کو تربیت دینے کے قابل ہے۔
سیج میکر ڈیٹا رینگلر کا استعمال کرتے ہوئے ڈیٹا کی تبدیلی
درج ذیل اسکرین شاٹ میں سیج میکر ڈیٹا رینگلر ورک فلو دکھایا گیا ہے۔ کام کا فلو ایمیزون S3 میں محفوظ گھروں کی ہزاروں تصاویر سے شروع ہوتا ہے۔ اگلا، ایک منظر کا پتہ لگانے والا منظر کا تعین کرتا ہے، جیسے باورچی خانے یا باتھ روم۔ آخر میں، تصویروں کے بارے میں ایک منظر کے لیے مخصوص سوالات پوچھے جاتے ہیں، جس کے نتیجے میں تربیت کے لیے ایک بھرپور، ٹیبلولر ڈیٹاسیٹ دستیاب ہوتا ہے۔
ذیل میں سیج میکر ڈیٹا رینگلر کسٹم ٹرانسفارمیشن کوڈ کی ایک مثال ہے جو فاؤنڈیشن ماڈل کے ساتھ تعامل کرنے اور کچن کی تصویروں کے بارے میں معلومات حاصل کرنے کے لیے استعمال ہوتا ہے۔ پچھلے اسکرین شاٹ میں، اگر آپ کچن فیچر نوڈ کا انتخاب کریں گے، تو درج ذیل کوڈ ظاہر ہوگا:
سیکیورٹی کے خیال کے طور پر، آپ کو پہلے SageMaker ڈیٹا رینگلر کو فعال کرنا ہوگا تاکہ وہ اپنے SageMaker کو ریئل ٹائم اینڈ پوائنٹ پر کال کریں۔ AWS شناخت اور رسائی کا انتظام (میں ہوں). اسی طرح، کوئی بھی AWS وسائل جو آپ SageMaker Data Wrangler کے ذریعے طلب کرتے ہیں اس کے لیے بھی اسی طرح کی اجازت کی ضرورت ہوگی۔
سیج میکر ڈیٹا رینگلر سے پہلے اور بعد میں ڈیٹا ڈھانچہ
اس سیکشن میں، ہم اصل ٹیبلر ڈیٹا کی ساخت اور بہتر ڈیٹا پر تبادلہ خیال کرتے ہیں۔ بہتر کردہ ڈیٹا میں اس مثال کے استعمال کے معاملے سے متعلق ڈیٹا کی نئی خصوصیات شامل ہیں۔ آپ کی درخواست میں، آپ کی درجہ بندی یا رجعت کے کام میں مدد کے لیے اپنی تصاویر میں دستیاب سوالات کے متنوع سیٹ کا تصور کرنے کے لیے وقت نکالیں۔ خیال یہ ہے کہ زیادہ سے زیادہ سوالات کا تصور کریں اور پھر ان کی جانچ کریں تاکہ یہ یقینی بنایا جا سکے کہ وہ ویلیو ایڈ فراہم کرتے ہیں۔
اصل ٹیبلر ڈیٹا کی ساخت
جیسا کہ ماخذ میں بیان کیا گیا ہے۔ GitHub repo، نمونہ ڈیٹاسیٹ میں 535 ٹیبلر ریکارڈز شامل ہیں جن میں فی پراپرٹی چار تصاویر شامل ہیں۔ مندرجہ ذیل جدول اصل ٹیبلر ڈیٹا کی ساخت کو واضح کرتا ہے۔
نمایاں کریں | تبصرہ |
بیڈروم کی تعداد | . |
غسل خانوں کی تعداد | . |
رقبہ (مربع فٹ) | . |
زپ کوڈ | . |
قیمت | یہ وہ ہدف متغیر ہے جس کی پیش گوئی کی جائے گی۔ |
بہتر ڈیٹا کا ڈھانچہ
درج ذیل جدول ڈیٹا کے بہتر ڈھانچے کی وضاحت کرتا ہے، جس میں تصاویر سے اخذ کردہ کئی نئی خصوصیات شامل ہیں۔
نمایاں کریں | تبصرہ |
بیڈروم کی تعداد | . |
غسل خانوں کی تعداد | . |
رقبہ (مربع فٹ) | . |
طول بلد | ایمیزون لوکیشن سروس میں اصل زپ کوڈ پاس کر کے حساب کیا گیا۔ یہ زپ کے لیے سینٹروڈ ویلیو ہے۔ |
طول بلد | ایمیزون لوکیشن سروس میں اصل زپ کوڈ پاس کر کے حساب کیا گیا۔ یہ زپ کے لیے سینٹروڈ ویلیو ہے۔ |
کیا سونے کے کمرے میں والٹ چھت ہے؟ | 0 = نہیں؛ 1 = ہاں |
کیا باتھ روم مہنگا ہے؟ | 0 = نہیں؛ 1 = ہاں |
کیا کچن مہنگا ہے؟ | 0 = نہیں؛ 1 = ہاں |
قیمت | یہ وہ ہدف متغیر ہے جس کی پیش گوئی کی جائے گی۔ |
سیج میکر کینوس کے ساتھ ماڈل ٹریننگ
ایک سیج میکر ڈیٹا رینگلر پروسیسنگ جاب مکمل طور پر تیار کرتا ہے اور پورے ٹیبلولر ٹریننگ ڈیٹاسیٹ کو Amazon S3 میں دستیاب کرتا ہے۔ اگلا، سیج میکر کینوس ایم ایل لائف سائیکل کے ماڈل بنانے کے مرحلے سے خطاب کرتا ہے۔ کینوس S3 ٹریننگ سیٹ کھول کر شروع ہوتا ہے۔ ماڈل کو سمجھنے کے قابل ہونا اکثر گاہک کی کلیدی ضرورت ہوتی ہے۔ کوڈ لکھے بغیر، اور چند کلکس کے اندر، SageMaker Canvas ماڈل کی کارکردگی پر بھرپور، بصری تاثرات فراہم کرتا ہے۔ جیسا کہ مندرجہ ذیل سیکشن میں اسکرین شاٹ میں دیکھا گیا ہے، سیج میکر کینوس دکھاتا ہے کہ کس طرح واحد خصوصیات ماڈل کو آگاہ کرتی ہیں۔
اصلی ٹیبلر ڈیٹا اور ریئل اسٹیٹ امیجز سے اخذ کردہ خصوصیات کے ساتھ تربیت یافتہ ماڈل
ہم مندرجہ ذیل اسکرین شاٹ سے دیکھ سکتے ہیں کہ پراپرٹی کی تصاویر سے تیار کردہ خصوصیات اہم تھیں۔ ان نتائج کی بنیاد پر، تصویر سے سوال "کیا یہ باورچی خانہ مہنگا ہے" اصل ٹیبلر سیٹ میں "بیڈ رومز کی تعداد" سے زیادہ اہم تھا، جس کی خصوصیت کی اہمیت کی قدریں بالترتیب 7.08 اور 5.498 تھیں۔
مندرجہ ذیل اسکرین شاٹ ماڈل کے بارے میں اہم معلومات فراہم کرتا ہے۔ سب سے پہلے، بقایا گراف جامنی رنگ کے سایہ دار زون کے ارد گرد سیٹ کلسٹرنگ میں زیادہ تر پوائنٹس دکھاتا ہے۔ یہاں، اس مثال کے لیے سیج میکر کینوس کے باہر دو آؤٹ لیرز کو دستی طور پر بیان کیا گیا تھا۔ یہ آؤٹ لیرز حقیقی گھر کی قیمت اور پیش گوئی کی گئی قیمت کے درمیان اہم فرق کی نمائندگی کرتے ہیں۔ اس کے علاوہ، آر2 قدر، جس کی ممکنہ حد 0-100% ہے، کو 76% پر دکھایا گیا ہے۔ یہ اس بات کی نشاندہی کرتا ہے کہ ماڈل نامکمل ہے اور گھر کی قدروں کا مکمل تخمینہ لگانے کے لیے تمام اقسام کا مکمل حساب کتاب کرنے کے لیے کافی معلوماتی پوائنٹس نہیں ہیں۔
ہم زیادہ جامع ماڈل بنانے کے لیے اضافی سگنلز تلاش کرنے اور تجویز کرنے کے لیے آؤٹ لیرز کا استعمال کر سکتے ہیں۔ مثال کے طور پر، ان بیرونی خصوصیات میں سوئمنگ پول شامل ہوسکتا ہے یا زمین کے بڑے پلاٹوں پر واقع ہوسکتا ہے۔ ڈیٹا سیٹ میں یہ خصوصیات شامل نہیں تھیں۔ تاہم، آپ اس ڈیٹا کو تلاش کرنے اور ایک اضافی خصوصیت کے طور پر شامل "سوئمنگ پول" کے ساتھ ایک نئے ماڈل کو تربیت دینے کے قابل ہو سکتے ہیں۔ مثالی طور پر، آپ کی اگلی کوشش پر، R2 قدر بڑھے گی اور MAE اور RMSE کی قدریں کم ہو جائیں گی۔
ریئل اسٹیٹ کی تصاویر سے اخذ کردہ خصوصیات کے بغیر تربیت یافتہ ماڈل
آخر میں، اگلے حصے میں جانے سے پہلے، آئیے یہ دریافت کریں کہ آیا تصاویر کی خصوصیات مددگار تھیں۔ مندرجہ ذیل اسکرین شاٹ VQA ماڈل کی خصوصیات کے بغیر ایک اور SageMaker Canvas کا تربیت یافتہ ماڈل فراہم کرتا ہے۔ ہم دیکھتے ہیں کہ ماڈل کی خرابی کی شرح میں اضافہ ہوا ہے، 282K کے RMSE سے 352K کے RMSE تک۔ اس سے، ہم یہ نتیجہ اخذ کر سکتے ہیں کہ تصاویر کے تین آسان سوالات نے ماڈل کی درستگی میں تقریباً 20 فیصد اضافہ کیا۔ نہیں دکھایا گیا، لیکن مکمل ہونے کے لیے، R2 مندرجہ ذیل ماڈل کی قدر بھی بگڑ گئی، VQA خصوصیات کے ساتھ 62% کی قدر سے 76% کی قدر گر گئی۔ یہ اس بات کی ایک مثال ہے کہ کس طرح SageMaker Canvas تیزی سے تجربہ کرنے اور ڈیٹا پر مبنی نقطہ نظر کو استعمال کرنے کو سیدھا بناتا ہے جو آپ کی کاروباری ضرورت کو پورا کرنے کے لیے ایک ماڈل تیار کرتا ہے۔
آگے کی تلاش میں
بہت سی تنظیمیں فاؤنڈیشن ماڈلز میں تیزی سے دلچسپی لے رہی ہیں، خاص طور پر جب سے جنرل پری ٹرینڈ ٹرانسفارمرز (GPTs) دسمبر 2022 میں باضابطہ طور پر مرکزی دھارے میں دلچسپی کا موضوع بن گئے۔ ; تاہم، دیگر متنوع استعمال کے معاملات دستیاب ہیں، جیسے کہ کمپیوٹر ویژن اور، زیادہ مختصر طور پر، یہاں بیان کردہ خصوصی VQA کام۔
یہ پوسٹ صنعت کے استعمال کے معاملات کو حل کرنے کے لیے ملٹی موڈل ڈیٹا کے استعمال کی ترغیب دینے کی ایک مثال ہے۔ اگرچہ ہم نے ریگریشن ماڈل میں VQA کے استعمال اور فائدے کا مظاہرہ کیا ہے، لیکن اس کا استعمال بعد کی تلاش یا کاروباری ورک فلو روٹنگ کے لیے تصاویر کو لیبل اور ٹیگ کرنے کے لیے بھی کیا جا سکتا ہے۔ تصور کریں کہ فروخت یا کرایہ کے لیے درج پراپرٹیز تلاش کرنے کے قابل ہوں۔ فرض کریں کہ آپ ٹائل فرش یا ماربل کاؤنٹر ٹاپس والی پراپرٹی ڈھونڈنا چاہتے ہیں۔ آج، آپ کو امیدواروں کی خصوصیات کی ایک لمبی فہرست حاصل کرنی پڑ سکتی ہے اور ہر امیدوار کے ذریعے براؤز کرتے وقت اپنے آپ کو نظروں سے فلٹر کرنا پڑ سکتا ہے۔ اس کے بجائے، ان خصوصیات پر مشتمل فہرستوں کو فلٹر کرنے کے قابل ہونے کا تصور کریں — چاہے کسی شخص نے انہیں واضح طور پر ٹیگ نہ کیا ہو۔ انشورنس انڈسٹری میں، دعوے کے نقصانات کا تخمینہ لگانے کی صلاحیت کا تصور کریں، یا تصاویر سے کاروباری ورک فلو میں اگلی کارروائیوں کو روٹ کریں۔ سوشل میڈیا پلیٹ فارمز میں، تصاویر کو بعد میں استعمال کے لیے آٹو ٹیگ کیا جا سکتا ہے۔
خلاصہ
اس پوسٹ میں دکھایا گیا ہے کہ سیج میکر پلیٹ فارم کا استعمال کرتے ہوئے کلاسک ML استعمال کیس کو بہتر بنانے کے لیے فاؤنڈیشن ماڈل کے ذریعے فعال کمپیوٹر وژن کو کیسے استعمال کیا جائے۔ تجویز کردہ حل کے حصے کے طور پر، ہم نے ایک عوامی ماڈل رجسٹری پر دستیاب ایک مقبول VQA ماڈل کا پتہ لگایا اور اسے حقیقی وقت کا اندازہ لگانے کے لیے SageMaker اینڈ پوائنٹ کا استعمال کرتے ہوئے تعینات کیا۔
اس کے بعد، ہم نے SageMaker Data Wrangler کو ایک ورک فلو ترتیب دینے کے لیے استعمال کیا جس میں ٹیبلولر ڈیٹا کا ایک بھرپور سیٹ تیار کرنے کے لیے امیجز سے یکساں سوالات پوچھے گئے تھے۔ آخر میں، ہم نے ریگریشن ماڈل کو تربیت دینے کے لیے SageMaker Canvas کا استعمال کیا۔ یہ نوٹ کرنا ضروری ہے کہ نمونہ ڈیٹاسیٹ بہت آسان تھا اور اس لیے ڈیزائن کے لحاظ سے نامکمل تھا۔ اس کے باوجود، SageMaker Canvas ماڈل کی درستگی کو سمجھنا اور بیس لائن ماڈل کی درستگی کو بہتر بنانے کے لیے اضافی سگنلز تلاش کرنا آسان بناتا ہے۔
ہمیں امید ہے کہ اس پوسٹ نے آپ کو ملٹی موڈل ڈیٹا استعمال کرنے کی ترغیب دی ہے جو آپ کی تنظیم کے پاس ہو سکتی ہے۔ مزید برآں، ہم امید کرتے ہیں کہ پوسٹ نے آپ کو ماڈل ٹریننگ کو ایک تکراری عمل کے طور پر غور کرنے کی ترغیب دی ہے۔ ایک عظیم نمونہ کچھ صبر کے ساتھ حاصل کیا جا سکتا ہے۔ وہ ماڈل جو قریب قریب پرفیکٹ ہیں ان کے درست ہونے کے لیے بہت اچھے ہو سکتے ہیں، شاید ہدف کے رساو یا اوور فٹنگ کا نتیجہ۔ ایک مثالی منظر نامہ ایک ایسے ماڈل سے شروع ہوگا جو اچھا ہے، لیکن کامل نہیں۔ غلطیوں، نقصانات اور بقایا پلاٹوں کا استعمال کرتے ہوئے، آپ اپنے ابتدائی بیس لائن تخمینہ سے درستگی بڑھانے کے لیے اضافی ڈیٹا سگنل حاصل کر سکتے ہیں۔
AWS ML سروسز کا سب سے وسیع اور گہرا سیٹ پیش کرتا ہے اور کلاؤڈ انفراسٹرکچر کو سپورٹ کرتا ہے، ML کو ہر ڈویلپر، ڈیٹا سائنسدان، اور ماہر پریکٹیشنر کے ہاتھ میں دیتا ہے۔ اگر آپ SageMaker پلیٹ فارم، بشمول SageMaker Data Wrangler اور SageMaker Canvas کے بارے میں مزید جاننا چاہتے ہیں، تو براہ کرم اپنی AWS اکاؤنٹ ٹیم سے رابطہ کریں اور بات چیت شروع کریں۔ نیز، سیج میکر ڈیٹا رینگلر کے بارے میں مزید پڑھنے پر غور کریں۔ اپنی مرضی کے مطابق تبدیلیاں.
حوالہ جات
احمد، ای ایچ، اور مصطفی، ایم (2016)۔ بصری اور متنی خصوصیات سے مکان کی قیمت کا تخمینہ۔ IJCCI 2016- کمپیوٹیشنل انٹیلی جنس پر 8ویں بین الاقوامی مشترکہ کانفرنس کی کارروائی، 3, 62-68۔
ہیریسن جونیئر، ڈی، اور روبن فیلڈ، ڈی ایل (1978)۔ ہیڈونک ہاؤسنگ کی قیمتیں اور صاف ہوا کی مانگ۔ جرنل آف ماحولیاتی معاشیات اور انتظام, 5(1)، 81-102.
Kim, W., Son, B. & Kim, I.. (2021)۔ ViLT: Convolution یا علاقائی نگرانی کے بغیر وژن اور زبان کا ٹرانسفارمر۔ مشین لرننگ پر 38ویں بین الاقوامی کانفرنس کی کارروائی، مشین لرننگ ریسرچ کی کارروائیوں میں۔ 139:5583-5594۔
مصنف کے بارے میں
چارلس لافلن ایک پرنسپل AI/ML ماہر حل آرکیٹیکٹ ہے اور AWS میں Amazon SageMaker سروس ٹیم میں کام کرتا ہے۔ وہ سروس روڈ میپ کو تشکیل دینے میں مدد کرتا ہے اور مختلف AWS صارفین کے ساتھ روزانہ تعاون کرتا ہے تاکہ جدید AWS ٹیکنالوجیز اور سوچ کی قیادت کا استعمال کرتے ہوئے اپنے کاروبار کو تبدیل کرنے میں مدد کی جا سکے۔ چارلس نے سپلائی چین مینجمنٹ میں ایم ایس اور پی ایچ ڈی کی ڈگری حاصل کی ہے۔ ڈیٹا سائنس میں
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://aws.amazon.com/blogs/machine-learning/use-foundation-models-to-improve-model-accuracy-with-amazon-sagemaker/
- : ہے
- : ہے
- : نہیں
- :کہاں
- $UP
- 08
- 1
- 100
- 2016
- 2021
- 2022
- 32
- 49
- 50
- 50 سال
- 7
- 8
- 8th
- a
- کی صلاحیت
- قابلیت
- ہمارے بارے میں
- بہت زیادہ
- تک رسائی حاصل
- اکاؤنٹ
- درستگی
- حاصل کیا
- اعمال
- ایڈیشنل
- اس کے علاوہ
- پتے
- کے بعد
- احمد
- AI
- AI / ML
- AIR
- تمام
- کی اجازت
- تقریبا
- شانہ بشانہ
- بھی
- اگرچہ
- ایمیزون
- ایمیزون سیج میکر
- ایمیزون ویب سروسز
- amp
- an
- اور
- ایک اور
- جواب
- جواب
- کوئی بھی
- اے پی آئی
- ظاہر
- درخواست
- کا اطلاق کریں
- نقطہ نظر
- فن تعمیر
- کیا
- ارد گرد
- لڑی
- مصنوعی
- مصنوعی ذہانت
- مصنوعی انٹیلی جنس (AI)
- AS
- پوچھنا
- سے پوچھ
- تشخیص کریں
- اثاثے
- At
- کرنے کی کوشش
- آڈیو
- آٹومیٹڈ
- دستیاب
- AWS
- کی بنیاد پر
- بیس لائن
- BE
- بن گیا
- بن
- بننے
- رہا
- اس سے پہلے
- شروع کریں
- کیا جا رہا ہے
- فائدہ
- کے درمیان
- سے پرے
- جسم
- بوسٹن
- دونوں
- تعمیر
- عمارت
- تعمیر میں
- بوجھ
- کاروبار
- کاروبار
- لیکن
- by
- فون
- کر سکتے ہیں
- امیدوار
- کینوس
- صلاحیتوں
- صلاحیت
- صلاحیت رکھتا
- کیس
- مقدمات
- چھت
- مرکوز
- مراکز
- چین
- تبدیل
- خصوصیات
- چارلس
- میں سے انتخاب کریں
- کا دعوی
- کلاسک
- درجہ بندی
- صاف
- بادل
- کلاؤڈ بنیادی ڈھانچے
- clustering کے
- کوڈ
- کوڈ
- تعاون کرتا ہے
- رنگ
- یکجا
- کس طرح
- مکمل
- وسیع
- کمپیوٹیشنل
- کمپیوٹر
- کمپیوٹر ویژن
- تصور
- نتیجہ اخذ
- کانفرنس
- غور کریں
- غور
- پر مشتمل ہے
- کنٹینر
- پر مشتمل ہے
- مسلسل
- کنٹریکٹ
- بات چیت
- تبدیل
- محدد
- درست
- اسی کے مطابق
- سکتا ہے
- کریڈٹ
- شوقین
- اپنی مرضی کے
- گاہک
- گاہکوں
- جدید
- روزانہ
- اعداد و شمار
- ڈیٹا کی تیاری
- ڈیٹا سائنس
- ڈیٹا سائنسدان
- ڈیٹا سیٹ
- ڈیٹا کی ساخت
- اعداد و شمار پر مبنی ہے
- دسمبر
- فیصلہ کرنا
- کمی
- گہری۔
- نجات
- ڈیمانڈ
- مظاہرہ
- demonstrated,en
- ثبوت
- تعیناتی
- تعینات
- تعیناتی
- اخذ کردہ
- بیان
- بیان کیا
- ڈیزائن
- ڈیزائن
- یہ تعین
- ترقی یافتہ
- ڈیولپر
- ڈیجیٹل
- طول و عرض
- بات چیت
- بات چیت
- متنوع
- do
- کرتا
- نہیں کرتا
- ڈاؤن لوڈز
- درجنوں
- چھوڑنا
- e
- ہر ایک
- آسان
- معاشیات
- کو چالو کرنے کے
- چالو حالت میں
- حوصلہ افزائی
- اختتام پوائنٹ
- انجنیئرنگ
- بہتر
- کافی
- پوری
- ماحولیاتی
- خرابی
- نقائص
- خاص طور پر
- تخمینہ
- وغیرہ
- بھی
- ہر کوئی
- مثال کے طور پر
- مثال کے طور پر
- توقع
- مہنگی
- تجربہ
- ماہر
- واضح طور پر
- تلاش
- نکالنے
- چہرہ
- نمایاں کریں
- خصوصیات
- آراء
- فٹ
- چند
- اعداد و شمار
- فلٹر
- آخر
- مل
- پہلا
- فلور
- توجہ مرکوز
- پر عمل کریں
- کے بعد
- مندرجہ ذیل ہے
- کے لئے
- فارم
- ملا
- فاؤنڈیشن
- چار
- سے
- مکمل پیمانہ
- مکمل طور پر
- تقریب
- افعال
- بنیادی
- حاصل کرنا
- فرق
- جنرل
- پیدا
- حاصل
- مقصد
- اچھا
- گراف
- عظیم
- جھنڈا
- رہنمائی
- ہاتھوں
- ہے
- he
- مدد
- مدد گار
- مدد کرتا ہے
- یہاں
- پوشیدہ
- نمایاں کریں
- کی ڈگری حاصل کی
- ہوم پیج (-)
- ہومز
- امید ہے کہ
- میزبانی کی
- ہاؤس
- ہاؤسنگ
- کس طرح
- کیسے
- تاہم
- HTTP
- HTTPS
- سینکڑوں
- i
- خیال
- مثالی
- مثالی طور پر
- شناختی
- if
- وضاحت کرتا ہے
- تصویر
- تصاویر
- تصور
- درآمد
- اہمیت
- اہم
- کو بہتر بنانے کے
- بہتر
- in
- شامل
- شامل
- سمیت
- شامل کرنا
- اضافہ
- اضافہ
- دن بدن
- آزادانہ طور پر
- اشارہ کرتا ہے
- صنعت
- اثر و رسوخ
- مطلع
- معلومات
- انفراسٹرکچر
- ابتدائی
- ان پٹ
- بصیرت
- حوصلہ افزائی
- متاثر
- کے بجائے
- انشورنس
- انٹیلی جنس
- بات چیت
- بات چیت
- دلچسپی
- دلچسپی
- بین الاقوامی سطح پر
- میں
- IT
- میں
- ایوب
- مشترکہ
- فوٹو
- JSON
- کلیدی
- کم
- علم
- جانا جاتا ہے
- لیبل
- لینڈ
- زبان
- بڑے
- بعد
- قیادت
- قیادت
- جانیں
- سیکھنے
- زندگی کا دورانیہ
- لسٹ
- فہرست
- لسٹنگس
- تھوڑا
- ایل ایل ایم
- واقع ہے
- محل وقوع
- تالا لگا
- لانگ
- نقصانات
- مشین
- مشین لرننگ
- بنا
- مین سٹریم میں
- بنا
- بناتا ہے
- انتظام
- دستی طور پر
- بہت سے
- میچ
- مئی..
- بامعنی
- کا مطلب ہے کہ
- میڈیا
- طریقہ
- مڈ وے
- شاید
- برا
- منٹ
- لاپتہ
- اختلاط
- ML
- ماڈل
- ماڈل
- جدید
- زیادہ
- سب سے زیادہ
- تحریک
- منتقل
- ضروری
- قدرتی
- ضرورت ہے
- ضرورت
- نئی
- نئی خصوصیات
- اگلے
- نہیں
- نوڈ
- نوٹ بک
- تعداد
- متعدد
- حاصل
- ہوا
- of
- تجویز
- سرکاری طور پر
- اکثر
- on
- صرف
- اوپن سورس
- کھولنے
- or
- حکم
- تنظیم
- تنظیمیں
- اصل
- اصل میں
- دیگر
- ہمارے
- باہر
- آؤٹ لیٹر
- پیداوار
- باہر
- خود
- کاغذ.
- حصہ
- پاسنگ
- صبر
- پیٹرن
- فی
- کامل
- کارکردگی
- شاید
- اجازتیں
- انسان
- مرحلہ
- تصویر
- تصویر
- تصویر
- تصاویر
- پائپ لائن
- سادہ
- پلیٹ فارم
- پلیٹ فارم
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- مہربانی کرکے
- پوائنٹ
- پوائنٹس
- پول
- مقبول
- حصہ
- قبضہ کرو
- ممکن
- پوسٹ
- پیش گوئی
- ابتدائی
- تیاری
- تیار
- تیار
- تیار کرتا ہے
- پہلے
- قیمت
- قیمتیں
- پرنسپل
- کارروائییں
- عمل
- پروسیسنگ
- تیار
- پیشہ ور ماہرین
- خصوصیات
- جائیداد
- تجویز کریں
- مجوزہ
- فراہم
- فراہم
- فراہم کنندہ
- فراہم کرنے والے
- فراہم کرتا ہے
- فراہم کرنے
- عوامی
- شائع
- ڈالنا
- معیار
- سوال
- سوالات
- جلدی سے
- R
- رینج
- شرح
- خام
- تک پہنچنے
- پڑھیں
- پڑھنا
- تیار
- اصل وقت
- وصول
- ریکارڈ
- کو کم
- حوالہ
- مراد
- خطے
- رجسٹری
- مضبوط
- رشتہ دار
- متعلقہ
- کرایہ پر
- ذخیرہ
- کی نمائندگی
- درخواست
- ضرورت
- کی ضرورت ہے
- تحقیق
- نئی شکل دینا
- رہائش
- وسائل
- بالترتیب
- جواب
- جوابات
- نتیجہ
- نتیجے
- نتائج کی نمائش
- واپسی
- کا جائزہ لینے کے
- امیر
- امیر
- سڑک موڈ
- روٹ
- روٹنگ
- رن
- رن ٹائم
- s
- sagemaker
- فروخت
- اسی
- نمونہ ڈیٹاسیٹ
- منظر نامے
- منظر
- سائنس
- سائنسدان
- سکٹ
- اسکرپٹ
- تلاش کریں
- دوسری
- سیکشن
- سیکورٹی
- دیکھنا
- طلب کرو
- دیکھا
- منتخب
- بھیجنا
- خدمت
- خدمت کی
- سروس
- سروسز
- مقرر
- کئی
- شکل
- دکھائیں
- دکھایا گیا
- شوز
- نگاہ
- سگنل
- اہم
- اسی طرح
- اسی طرح
- سادہ
- آسان بنانے
- بعد
- ایک
- سائز
- So
- سماجی
- سوشل میڈیا
- سوشل میڈیا پلیٹ فارم
- حل
- حل
- کچھ
- کبھی کبھی
- اس
- ماخذ
- ذرائع
- خلا
- ماہر
- خصوصی
- خاص طور پر
- چوک میں
- شروع کریں
- ابھی تک
- ذخیرہ
- ذخیرہ
- براہ راست
- ساخت
- ڈھانچوں
- طلباء
- بعد میں
- اس طرح
- مشورہ
- نگرانی
- فراہمی
- فراہمی کا سلسلہ
- سپلائی چین مینجمنٹ
- امدادی
- اس بات کا یقین
- ٹیبل
- TAG
- لے لو
- لیتا ہے
- ہدف
- ٹاسک
- کاموں
- پڑھانا
- ٹیم
- ٹیکنالوجی
- ٹیکنالوجی
- اصطلاح
- ٹیسٹ
- متنی
- سے
- کہ
- ۔
- ماخذ
- ان
- ان
- تو
- وہاں.
- لہذا
- یہ
- وہ
- بات
- اس
- ان
- سوچا
- سوچا قیادت۔
- ہزار
- ہزاروں
- تین
- کے ذریعے
- وقت
- کرنے کے لئے
- آج
- آج کا
- بھی
- کے آلے
- موضوع
- روایتی طور پر
- ٹرین
- تربیت یافتہ
- ٹریننگ
- تبدیل
- تبدیلی
- تبدیلی
- ٹرانسفارمر
- ٹرانسفارمرز
- سچ
- قابل اعتماد
- دو
- قسم
- اقسام
- آخر میں
- سمجھ
- افہام و تفہیم
- منفرد
- Unsplash سے
- استعمال کی شرائط
- استعمال کیس
- استعمال کیا جاتا ہے
- استعمال
- کا استعمال کرتے ہوئے
- استعمال کرنا۔
- تشخیص
- قیمت
- ویلیو ایڈ
- اقدار
- متغیر
- مختلف اقسام کے
- بہت
- ویڈیو
- لنک
- نظر
- نقطہ نظر
- بصری
- W
- چاہتے ہیں
- تھا
- we
- ویب
- ویب خدمات
- مہینے
- اچھا ہے
- تھے
- کیا
- کیا ہے
- جس
- ڈبلیو
- گے
- کھڑکیاں
- ساتھ
- کے اندر
- بغیر
- لکڑی
- کام
- کام کا بہاؤ
- کام کرتا ہے
- دنیا
- قابل
- گا
- تحریری طور پر
- سال
- پیداوار
- تم
- اور
- اپنے آپ کو
- یو ٹیوب پر
- زیفیرنیٹ
- صفر
- زپ