تخلیقی مصنوعی ذہانت (پیدا کرنے والا AI) ماڈلز نے اعلیٰ معیار کا متن، تصاویر اور دیگر مواد تیار کرنے میں متاثر کن صلاحیتوں کا مظاہرہ کیا ہے۔ تاہم، ان ماڈلز کو اپنی پوری صلاحیت تک پہنچنے کے لیے بڑے پیمانے پر صاف، منظم تربیتی ڈیٹا کی ضرورت ہوتی ہے۔ زیادہ تر حقیقی دنیا کا ڈیٹا پی ڈی ایف جیسے غیر ساختہ فارمیٹس میں موجود ہوتا ہے، جس کو مؤثر طریقے سے استعمال کرنے سے پہلے پہلے سے پروسیسنگ کی ضرورت ہوتی ہے۔
کے مطابق آئی ڈی سی, غیر ساختہ ڈیٹا آج تمام کاروباری ڈیٹا کا 80% سے زیادہ ہے۔ اس میں ای میلز، پی ڈی ایف، اسکین شدہ دستاویزات، تصاویر، آڈیو، ویڈیو اور بہت کچھ جیسے فارمیٹس شامل ہیں۔ اگرچہ یہ ڈیٹا قیمتی بصیرت رکھتا ہے، لیکن اس کی غیر ساختہ نوعیت AI الگورتھم کے لیے اس کی تشریح اور اس سے سیکھنا مشکل بنا دیتی ہے۔ ایک کے مطابق ڈیلوئٹ کے ذریعہ 2019 کا سروےصرف 18% کاروباروں نے غیر ساختہ ڈیٹا سے فائدہ اٹھانے کے قابل ہونے کی اطلاع دی۔
جیسا کہ اے آئی کو اپنانے میں تیزی آتی جا رہی ہے، غیر ساختہ ڈیٹا کو ہضم کرنے اور سیکھنے کے لیے موثر میکانزم تیار کرنا مستقبل میں اور بھی اہم ہو جاتا ہے۔ اس میں بہتر پری پروسیسنگ ٹولز، نیم زیر نگرانی سیکھنے کی تکنیک، اور قدرتی زبان کی پروسیسنگ میں پیشرفت شامل ہو سکتی ہے۔ وہ کمپنیاں جو اپنے غیر ساختہ ڈیٹا کو زیادہ مؤثر طریقے سے استعمال کرتی ہیں وہ AI سے نمایاں مسابقتی فوائد حاصل کریں گی۔ اچھی ماڈل کی کارکردگی کے لیے صاف ڈیٹا اہم ہے۔ نکالے گئے متن میں اب بھی بڑی مقدار میں بے ہودہ اور بوائلر پلیٹ متن موجود ہے (مثال کے طور پر، HTML پڑھیں)۔ انٹرنیٹ سے سکریپ شدہ ڈیٹا میں اکثر نقلیں ہوتی ہیں۔ سوشل میڈیا، جائزے، یا صارف کے تیار کردہ کسی بھی مواد کے ڈیٹا میں زہریلے اور متعصب مواد بھی شامل ہو سکتے ہیں، اور آپ کو کچھ پری پروسیسنگ اقدامات کا استعمال کرتے ہوئے انہیں فلٹر کرنے کی ضرورت پڑ سکتی ہے۔ بہت سے کم معیار والے مواد یا بوٹ سے تیار کردہ متن بھی ہو سکتے ہیں، جنہیں ساتھ والے میٹا ڈیٹا کا استعمال کرتے ہوئے فلٹر کیا جا سکتا ہے (مثال کے طور پر، کسٹمر سروس کے جوابات کو فلٹر کریں جنہیں کم کسٹمر ریٹنگ ملے)۔
بازیافت اگمینٹڈ جنریشن میں متعدد مراحل پر ڈیٹا کی تیاری اہم ہے۔آر اے جیماڈلز۔ علمی ماخذ کی دستاویزات کو پہلے سے پروسیسنگ کی ضرورت ہوتی ہے، جیسے متن کو صاف کرنا اور سیمنٹک ایمبیڈنگز بنانا، تاکہ ان کو موثر انداز میں ترتیب دیا جا سکے اور بازیافت کیا جا سکے۔ صارف کی فطری زبان کے استفسار کے لیے بھی پری پروسیسنگ کی ضرورت ہوتی ہے، اس لیے اسے ویکٹر میں انکوڈ کیا جا سکتا ہے اور اس کا موازنہ دستاویز کی سرایت سے کیا جا سکتا ہے۔ متعلقہ سیاق و سباق کو بازیافت کرنے کے بعد، انہیں فاؤنڈیشن ماڈل کے لیے حتمی پرامپٹ بنانے کے لیے صارف کے استفسار سے منسلک ہونے سے پہلے اضافی پری پروسیسنگ کی ضرورت ہو سکتی ہے، جیسے تراشنا۔ ایمیزون سیج میکر کینوس اب ڈیٹا کی تیاری کی جامع صلاحیتوں کی حمایت کرتا ہے۔ ایمیزون سیج میکر ڈیٹا رینگلر. اس انضمام کے ساتھ، SageMaker Canvas صارفین کو ڈیٹا تیار کرنے، ایم ایل اور فاؤنڈیشن ماڈلز بنانے اور استعمال کرنے کے لیے ڈیٹا سے کاروباری بصیرت تک وقت کو تیز کرنے کے لیے اینڈ ٹو اینڈ نو کوڈ ورک اسپیس فراہم کرتا ہے۔ اب آپ 50 سے زیادہ ڈیٹا ذرائع سے ڈیٹا کو آسانی سے دریافت اور جمع کر سکتے ہیں، اور SageMaker Canvas کے بصری انٹرفیس میں 300 سے زیادہ بلٹ ان تجزیوں اور تبدیلیوں کا استعمال کرتے ہوئے ڈیٹا کو دریافت اور تیار کر سکتے ہیں۔
حل جائزہ
اس پوسٹ میں، ہم پی ڈی ایف دستاویزات کے ڈیٹاسیٹ کے ساتھ کام کرتے ہیں۔ایمیزون بیڈرک صارف گائیڈ. مزید، ہم دکھاتے ہیں کہ کس طرح RAG کے لیے ڈیٹا سیٹ کو پہلے سے پروسیس کیا جائے۔ خاص طور پر، ہم ڈیٹا کو صاف کرتے ہیں اور ڈیٹاسیٹ کے مواد کے بارے میں سوالات کے جوابات دینے کے لیے RAG نمونے بناتے ہیں۔ مندرجہ ذیل مشین لرننگ (ML) کے مسئلے پر غور کریں: صارف ایک بڑے لینگویج ماڈل (LLM) سے سوال پوچھتا ہے: "ایمیزون بیڈرک میں ماڈلز کو فلٹر اور تلاش کیسے کریں؟"۔ LLM نے ٹریننگ یا فائن ٹیوننگ مرحلے کے دوران دستاویزات نہیں دیکھی ہیں، اس طرح وہ سوال کا جواب نہیں دے سکے گا اور غالباً گمراہ ہو جائے گا۔ اس پوسٹ کے ساتھ ہمارا مقصد پی ڈی ایف (یعنی، آر اے جی) سے متن کا ایک متعلقہ ٹکڑا تلاش کرنا اور اسے پرامپٹ کے ساتھ منسلک کرنا ہے، اس طرح ایل ایل ایم کو اس دستاویز سے مخصوص سوالات کے جوابات دینے کے قابل بنانا ہے۔
ذیل میں، ہم دکھاتے ہیں کہ آپ ان تمام اہم پری پروسیسنگ مراحل کو کیسے کر سکتے ہیں۔ ایمیزون سیج میکر کینوس (از: وی بلیٹن ایمیزون سیج میکر ڈیٹا رینگلر):
- پی ڈی ایف دستاویز سے متن نکالنا (ٹیکسٹیکٹ کے ذریعے تقویت یافتہ)
- حساس معلومات کو ہٹا دیں (سمجھنے کے ذریعے تقویت یافتہ)
- متن کو ٹکڑوں میں کاٹ دیں۔
- ہر ٹکڑے کے لیے ایمبیڈنگز بنائیں (بیڈرک کے ذریعے تقویت یافتہ)۔
- ویکٹر ڈیٹا بیس میں ایمبیڈنگ اپ لوڈ کریں (اوپن سرچ کے ذریعے تقویت یافتہ)
شرائط
اس واک تھرو کے لیے، آپ کے پاس درج ذیل ہونا چاہیے:
نوٹ: ہدایات پر عمل کرتے ہوئے OpenSearch Service کے ڈومینز بنائیں یہاں. سادگی کے لیے، آئیے عمدہ رسائی کنٹرول کے لیے ماسٹر یوزر نیم اور پاس ورڈ کے ساتھ آپشن کا انتخاب کریں۔ ڈومین بننے کے بعد، درج ذیل میپنگ کے ساتھ ایک ویکٹر انڈیکس بنائیں، اور ویکٹر ڈائمینشن 1536 ایمیزون ٹائٹن ایمبیڈنگز کے ساتھ سیدھ میں آجائے:
واک تھرو
ڈیٹا کا بہاؤ بنائیں
اس سیکشن میں، ہم اس بات کا احاطہ کرتے ہیں کہ ہم PDFs سے ٹیکسٹ اور میٹا ڈیٹا نکالنے، ڈیٹا کو صاف اور اس پر کارروائی کرنے، Amazon Bedrock کا استعمال کرتے ہوئے ایمبیڈنگ بنانے، اور Amazon OpenSearch میں ڈیٹا کو انڈیکس کرنے کے لیے ڈیٹا فلو کیسے بنا سکتے ہیں۔
سیج میکر کینوس لانچ کریں۔
SageMaker Canvas لانچ کرنے کے لیے، درج ذیل مراحل کو مکمل کریں:
- ایمیزون پر سیج میکر کنسولمنتخب کریں ڈومینز نیوی گیشن پین میں.
- اپنا ڈومین منتخب کریں۔
- لانچ مینو پر، منتخب کریں۔ کینوس.
ڈیٹا فلو بنائیں
SageMaker Canvas میں ڈیٹا فلو بنانے کے لیے درج ذیل مراحل کو مکمل کریں:
- سیج میکر کینوس ہوم پیج پر، منتخب کریں۔ ڈیٹا رینگلر.
- میں سے انتخاب کریں تخلیق کریں صفحہ کے دائیں جانب، پھر ڈیٹا فلو کا نام دیں اور منتخب کریں۔ تخلیق کریں.
- یہ ڈیٹا فلو پیج پر اترے گا۔
- میں سے انتخاب کریں ڈیٹا درآمد کریں۔ٹیبلر ڈیٹا کو منتخب کریں۔
اب ایمیزون S3 بالٹی سے ڈیٹا درآمد کریں:
- میں سے انتخاب کریں ڈیٹا درآمد کریں۔ اور منتخب کریں ٹیبلر ڈراپ ڈاؤن فہرست سے.
- ڈیٹا کا ذریعہ اور منتخب کریں ایمیزون S3 ڈراپ ڈاؤن فہرست سے.
- پی ڈی ایف فائل کے مقامات کے ساتھ میٹا ڈیٹا فائل پر جائیں، اور فائل کا انتخاب کریں۔
- اب میٹا ڈیٹا فائل کو ڈیٹا کی تیاری کے ڈیٹا فلو میں لوڈ کیا گیا ہے، اور ہم ڈیٹا اور انڈیکس کو Amazon میں تبدیل کرنے کے لیے اگلے مراحل کو شامل کرنے کے لیے آگے بڑھ سکتے ہیں۔ افتتاحی. اس صورت میں فائل میں ایمیزون S3 ڈائرکٹری میں ہر فائل کے مقام کے ساتھ درج ذیل میٹا ڈیٹا ہے۔
ایک نیا ٹرانسفارم شامل کرنے کے لیے، درج ذیل مراحل کو مکمل کریں:
- جمع کا نشان منتخب کریں اور منتخب کریں۔ ٹرانسفارم شامل کریں۔.
- میں سے انتخاب کریں قدم شامل کریں اور منتخب کریں کسٹم ٹرانسفارم.
- آپ Pandas، PySpark، Python صارف کی طرف سے طے شدہ فنکشنز، اور SQL PySpark کا استعمال کرتے ہوئے اپنی مرضی کی تبدیلی بنا سکتے ہیں۔ منتخب کریں۔ Python (PySpark) اس استعمال کے کیس کے لیے۔
- قدم کے لیے ایک نام درج کریں۔ مثال کے کوڈ کے ٹکڑوں سے، براؤز کریں اور منتخب کریں۔ پی ڈی ایف سے متن نکالیں۔. کوڈ کے ٹکڑوں میں ضروری تبدیلیاں کریں اور منتخب کریں۔ شامل کریں.
- آئیے فائدہ اٹھاتے ہوئے نکالے گئے ڈیٹا سے ذاتی قابل شناخت معلومات (PII) ڈیٹا کو دوبارہ ترتیب دینے کے لیے ایک قدم شامل کریں ایمیزون کی تعریف. منتخب کریں قدم شامل کریں اور منتخب کریں کسٹم ٹرانسفارم. اور منتخب کریں۔ Python (PySpark)۔
مثال کے کوڈ کے ٹکڑوں سے، براؤز کریں اور منتخب کریں۔ ماسک PII. کوڈ کے ٹکڑوں میں ضروری تبدیلیاں کریں اور منتخب کریں۔ شامل کریں.
- اگلا مرحلہ متن کے مواد کا ٹکڑا کرنا ہے۔ منتخب کریں۔ قدم شامل کریں اور منتخب کریں کسٹم ٹرانسفارم. اور منتخب کریں۔ Python (PySpark)۔
مثال کے کوڈ کے ٹکڑوں سے، براؤز کریں اور منتخب کریں۔ متن کا حصہ۔ کوڈ کے ٹکڑوں میں ضروری تبدیلیاں کریں اور منتخب کریں۔ شامل کریں.
- آئیے کا استعمال کرتے ہوئے ٹیکسٹ مواد کو ویکٹر ایمبیڈنگ میں تبدیل کریں۔ ایمیزون بیڈرک ٹائٹن ایمبیڈنگز ماڈل۔ منتخب کریں۔ قدم شامل کریں اور منتخب کریں کسٹم ٹرانسفارم. اور منتخب کریں۔ Python (PySpark)۔
مثال کے کوڈ کے ٹکڑوں سے، براؤز کریں اور منتخب کریں۔ بیڈرک کے ساتھ ٹیکسٹ ایمبیڈنگ تیار کریں۔ کوڈ کے ٹکڑوں میں ضروری تبدیلیاں کریں اور منتخب کریں۔ شامل کریں.
- اب ہمارے پاس پی ڈی ایف فائل کے مواد کے لیے ویکٹر ایمبیڈنگز دستیاب ہیں۔ آئیے آگے بڑھیں اور ڈیٹا کو ایمیزون اوپن سرچ میں انڈیکس کریں۔ منتخب کریں۔ قدم شامل کریں اور منتخب کریں کسٹم ٹرانسفارم. اور منتخب کریں۔ Python (PySpark)۔ آپ اپنا پسندیدہ ویکٹر ڈیٹا بیس استعمال کرنے کے لیے درج ذیل کوڈ کو دوبارہ لکھنے کے لیے آزاد ہیں۔ سادگی کے لیے، ہم OpenSearch API تک رسائی کے لیے ماسٹر یوزر نیم اور پاس ورڈ استعمال کر رہے ہیں، پروڈکشن ورک بوجھ کے لیے آپ کی تنظیم کی پالیسیوں کے مطابق آپشن کا انتخاب کریں۔
آخر میں، تخلیق کردہ ڈیٹا فلو مندرجہ ذیل ہوگا:
اس ڈیٹا فلو کے ساتھ، پی ڈی ایف فائل کے ڈیٹا کو ایمیزون اوپن سرچ میں ویکٹر ایمبیڈنگ کے ساتھ پڑھا اور انڈیکس کیا گیا ہے۔ اب وقت آگیا ہے کہ ہم انڈیکس شدہ ڈیٹا سے استفسار کرنے کے لیے سوالات کے ساتھ ایک فائل بنائیں اور اسے Amazon S3 مقام پر محفوظ کریں۔ ہم اپنے سرچ ڈیٹا کے بہاؤ کو فائل کی طرف اشارہ کریں گے اور ایمیزون S3 کے مقام پر ایک نئی فائل میں متعلقہ نتائج کے ساتھ فائل آؤٹ پٹ کریں گے۔
ایک پرامپٹ تیار کر رہا ہے۔
اپنی پی ڈی ایف سے نالج بیس بنانے کے بعد، ہم چند نمونے کے سوالات کے لیے نالج بیس کو تلاش کر کے اس کی جانچ کر سکتے ہیں۔ ہم ہر استفسار پر اس طرح کارروائی کریں گے:
- استفسار کے لیے سرایت پیدا کریں (ایمیزون بیڈرک کے ذریعے تقویت یافتہ)
- قریبی پڑوسی سیاق و سباق کے لیے ویکٹر ڈیٹا بیس سے استفسار کریں (ایمیزون اوپن سرچ کے ذریعے تقویت یافتہ)
- استفسار اور سیاق و سباق کو پرامپٹ میں یکجا کریں۔
- پرامپٹ کے ساتھ ایل ایل ایم سے استفسار کریں (ایمیزون بیڈرک کے ذریعہ تقویت یافتہ)
- سیج میکر کینوس ہوم پیج پر، منتخب کریں۔ ڈیٹا کی تیاری.
- میں سے انتخاب کریں تخلیق کریں صفحہ کے دائیں جانب، پھر ڈیٹا فلو کا نام دیں اور منتخب کریں۔ تخلیق کریں.
اب آئیے صارف کے سوالات کو لوڈ کریں اور پھر سوال اور اسی طرح کی دستاویزات کو ملا کر ایک پرامپٹ بنائیں۔ یہ پرامپٹ ایل ایل ایم کو صارف کے سوال کا جواب پیدا کرنے کے لیے فراہم کیا جاتا ہے۔
- آئیے صارف کے سوالات کے ساتھ ایک csv فائل لوڈ کریں۔ منتخب کریں۔ درآمد ڈیٹا اور منتخب کریں ٹیبلر ڈراپ ڈاؤن فہرست سے.
- ڈیٹا کا ذریعہ، اور منتخب کریں ایمیزون S3 ڈراپ ڈاؤن فہرست سے۔ متبادل طور پر، آپ صارف کے سوالات کے ساتھ فائل اپ لوڈ کرنے کا انتخاب کر سکتے ہیں۔
- آئیے ڈیٹا کو ویکٹر ایمبیڈنگز میں تبدیل کرنے کے لیے ایک حسب ضرورت تبدیلی شامل کریں، اس کے بعد ایمیزون اوپن سرچ سے متعلقہ ایمبیڈنگز تلاش کریں، اس سے پہلے کہ علم کی بنیاد سے استفسار اور سیاق و سباق کے ساتھ ایمیزون بیڈروک کو پرامپٹ بھیجیں۔ استفسار کے لیے سرایت پیدا کرنے کے لیے، آپ اسی مثال کے کوڈ کا ٹکڑا استعمال کر سکتے ہیں۔ بیڈرک کے ساتھ ٹیکسٹ ایمبیڈنگ تیار کریں۔ اوپر مرحلہ نمبر 7 میں ذکر کیا گیا ہے۔
آئیے تیار کردہ ویکٹر ایمبیڈنگز کے لیے متعلقہ دستاویزات تلاش کرنے کے لیے Amazon OpenSearch API کا استعمال کریں۔ Python (PySpark) کے ساتھ کسٹم ٹرانسفارم شامل کریں۔
آئیے ایمیزون اوپن سرچ نالج بیس سے دستاویزات پاس کرتے ہوئے، استفسار کے جواب کے لیے ایمیزون بیڈرک API کو کال کرنے کے لیے ایک حسب ضرورت تبدیلی شامل کریں۔ مثال کے کوڈ کے ٹکڑوں سے، براؤز کریں اور منتخب کریں۔ سیاق و سباق کے ساتھ بیڈرک سے سوال کریں۔ کوڈ کے ٹکڑوں میں ضروری تبدیلیاں کریں اور منتخب کریں۔ شامل کریں.
خلاصہ یہ ہے کہ RAG پر مبنی سوال کا جواب دینے والا ڈیٹا فلو مندرجہ ذیل ہے:
ایم ایل پریکٹیشنرز فیچر انجینئرنگ کوڈ تیار کرنے، اسے اپنے ابتدائی ڈیٹاسیٹس پر لاگو کرنے، انجنیئر کردہ ڈیٹاسیٹس پر ماڈلز کی تربیت، اور ماڈل کی درستگی کا جائزہ لینے میں بہت زیادہ وقت صرف کرتے ہیں۔ اس کام کی تجرباتی نوعیت کو دیکھتے ہوئے، یہاں تک کہ سب سے چھوٹا پروجیکٹ بھی متعدد تکرار کا باعث بنتا ہے۔ ایک ہی فیچر انجینئرنگ کوڈ اکثر بار بار چلایا جاتا ہے، اسی آپریشن کو دہرانے پر وقت اور حسابی وسائل ضائع کرتے ہیں۔ بڑی تنظیموں میں، یہ پیداواری صلاحیت میں اور بھی زیادہ نقصان کا سبب بن سکتا ہے کیونکہ مختلف ٹیمیں اکثر ایک جیسی ملازمتیں چلاتی ہیں یا یہاں تک کہ ڈپلیکیٹ فیچر انجینئرنگ کوڈ لکھتی ہیں کیونکہ انہیں پہلے کے کام کا کوئی علم نہیں ہوتا ہے۔ فیچرز کی ری پروسیسنگ سے بچنے کے لیے، ہم اپنے ڈیٹا فلو کو ایمیزون پر ایکسپورٹ کریں گے۔ سیج میکر پائپ لائن۔ چلو منتخب کریں + سوال کے دائیں جانب بٹن۔ ایکسپورٹ ڈیٹا فلو کو منتخب کریں اور منتخب کریں۔ سیج میکر پائپ لائن چلائیں۔ (بذریعہ Jupyter نوٹ بک)۔
صفائی ستھرائی
مستقبل کے چارجز سے بچنے کے لیے، اس پوسٹ کو فالو کرتے ہوئے اپنے بنائے گئے وسائل کو حذف یا بند کریں۔ کا حوالہ دیتے ہیں Amazon SageMaker Canvas سے لاگ آؤٹ ہو رہا ہے۔ مزید تفصیلات کے لئے.
نتیجہ
اس پوسٹ میں، ہم نے آپ کو دکھایا کہ کس طرح LLM کے لیے ڈیٹا تیار کرنے والے ڈیٹا پروفیشنل کا کردار سنبھال کر Amazon SageMaker Canvas کی آخر سے آخر تک کی صلاحیتیں ہیں۔ انٹرایکٹو ڈیٹا کی تیاری نے معلوماتی خصوصیات کو انجینئر کرنے کے لیے ڈیٹا کو تیزی سے صاف کرنے، تبدیل کرنے اور تجزیہ کرنے کے قابل بنا دیا۔ کوڈنگ کی پیچیدگیوں کو دور کرکے، SageMaker Canvas نے تیز رفتار تکرار کو ایک اعلیٰ معیار کا تربیتی ڈیٹاسیٹ بنانے کی اجازت دی۔ اس تیز رفتار ورک فلو کی وجہ سے کاروباری اثرات کے لیے ایک پرفارمنس مشین لرننگ ماڈل کی تعمیر، تربیت، اور تعیناتی کی گئی ہے۔ اپنی جامع ڈیٹا کی تیاری اور ڈیٹا سے لے کر بصیرت تک متحد تجربے کے ساتھ، SageMaker Canvas صارفین کو اپنے ML نتائج کو بہتر بنانے کی طاقت دیتا ہے۔
ہم آپ کو دریافت کرکے مزید جاننے کی ترغیب دیتے ہیں۔ ایمیزون سیج میکر ڈیٹا رینگلر, ایمیزون سیج میکر کینوس, ایمیزون ٹائٹن ماڈل، ایمیزون بیڈرک، اور ایمیزون اوپن سرچ سروس اس پوسٹ میں فراہم کردہ نمونے کے نفاذ اور آپ کے کاروبار سے متعلقہ ڈیٹا سیٹ کا استعمال کرتے ہوئے حل تیار کرنے کے لیے۔ اگر آپ کے سوالات یا مشورے ہیں تو براہ کرم ایک تبصرہ کریں۔
مصنفین کے بارے میں
اجے گووندرام AWS میں ایک سینئر سولیوشن آرکیٹیکٹ ہے۔ وہ اسٹریٹجک صارفین کے ساتھ کام کرتا ہے جو پیچیدہ کاروباری مسائل کو حل کرنے کے لیے AI/ML استعمال کر رہے ہیں۔ اس کا تجربہ تکنیکی سمت فراہم کرنے کے ساتھ ساتھ معمولی سے بڑے پیمانے پر AI/ML ایپلیکیشن کی تعیناتیوں کے لیے ڈیزائن مدد فراہم کرنے میں ہے۔ اس کا علم ایپلی کیشن آرکیٹیکچر سے لے کر بڑے ڈیٹا، تجزیات اور مشین لرننگ تک ہے۔ وہ آرام کرتے ہوئے موسیقی سننے، باہر کا تجربہ کرنے اور اپنے پیاروں کے ساتھ وقت گزارنے سے لطف اندوز ہوتا ہے۔
نکیتا ایوکن ایمیزون سیج میکر ڈیٹا رینگلر میں ایک سینئر اپلائیڈ سائنٹسٹ ہے جس میں مشین لرننگ اور ڈیٹا کلیننگ الگورتھم میں دلچسپی ہے۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://aws.amazon.com/blogs/machine-learning/simplify-data-prep-for-gen-ai-with-amazon-sagemaker-data-wrangler/
- : ہے
- : ہے
- : نہیں
- 100
- 14
- 20
- 25
- 28
- 50
- 7
- 8
- 804
- a
- قابلیت
- ہمارے بارے میں
- اوپر
- رفتار کو تیز تر
- تیز
- تک رسائی حاصل
- کے مطابق
- اکاؤنٹس
- درستگی
- شامل کریں
- ایڈیشنل
- منہ بولابیٹا بنانے
- ترقی
- فائدہ
- فوائد
- کے بعد
- پھر
- مجموعی
- آگے
- AI
- AI / ML
- یلگوردمز
- سیدھ میں لائیں
- تمام
- کی اجازت
- بھی
- ایمیزون
- ایمیزون سیج میکر
- ایمیزون سیج میکر ڈیٹا رینگلر
- ایمیزون ویب سروسز
- مقدار
- an
- تجزیہ
- تجزیاتی
- تجزیہ
- اور
- جواب
- کوئی بھی
- اے پی آئی
- درخواست
- اطلاقی
- درخواست دینا
- فن تعمیر
- کیا
- مصنوعی
- مصنوعی ذہانت
- AS
- اسسٹنس
- At
- منسلک کریں
- آڈیو
- اضافہ
- دستیاب
- سے اجتناب
- AWS
- بیس
- کی بنیاد پر
- BE
- کیونکہ
- ہو جاتا ہے
- رہا
- اس سے پہلے
- کیا جا رہا ہے
- بہتر
- باصلاحیت
- بگ
- بگ ڈیٹا
- تعمیر
- عمارت
- تعمیر میں
- کاروبار
- کاروبار
- بٹن
- by
- فون
- کر سکتے ہیں
- کینوس
- صلاحیتوں
- کیس
- کیونکہ
- تبدیلیاں
- بوجھ
- میں سے انتخاب کریں
- صاف
- صفائی
- کوڈ
- کوڈنگ
- امتزاج
- تبصرہ
- کمپنیاں
- مقابلے میں
- مقابلہ
- مکمل
- پیچیدہ
- پیچیدگیاں
- سمجھو
- وسیع
- کمپیوٹنگ
- غور کریں
- کنسول
- پر مشتمل ہے
- پر مشتمل ہے
- مواد
- مندرجات
- سیاق و سباق
- سیاق و سباق
- جاری ہے
- کنٹرول
- تبدیل
- اسی کے مطابق
- سکتا ہے
- احاطہ
- تخلیق
- بنائی
- اہم
- اپنی مرضی کے
- گاہک
- کسٹمر سروس
- گاہکوں
- اعداد و شمار
- ڈیٹا کی تیاری
- ڈیٹا بیس
- ڈیٹاسیٹس
- ڈیلائٹ
- demonstrated,en
- تعینات
- تعینات
- ڈیزائن
- تفصیلات
- ترقی
- مختلف
- مشکل
- طول و عرض
- سمت
- براہ راست
- دریافت
- do
- دستاویز
- دستاویزات
- دستاویزات
- ڈومین
- ڈومینز
- نیچے
- کے دوران
- e
- ہر ایک
- آسانی سے
- مؤثر طریقے
- ہنر
- مؤثر طریقے سے
- ای میل
- سرایت کرنا
- بااختیار بنانا
- چالو حالت میں
- کو فعال کرنا
- کی حوصلہ افزائی
- آخر سے آخر تک
- انجینئر
- انجنیئر
- انجنیئرنگ
- کا جائزہ لینے
- بھی
- مثال کے طور پر
- موجود ہے
- تجربہ
- تجربہ کرنا
- تجرباتی
- تلاش
- ایکسپلور
- برآمد
- نکالنے
- نمایاں کریں
- خصوصیات
- چند
- قطعات
- فائل
- فلٹر
- فائنل
- مل
- بہاؤ
- پیچھے پیچھے
- کے بعد
- مندرجہ ذیل ہے
- کے لئے
- فوربس
- فاؤنڈیشن
- بنیادیں
- مفت
- سے
- مکمل
- افعال
- مزید
- مستقبل
- حاصل کرنا
- پیدا
- پیدا
- پیدا کرنے والے
- نسل
- پیداواری
- پیداواری AI۔
- حاصل
- دے دو
- دی
- گلوبل
- Go
- مقصد
- اچھا
- زیادہ سے زیادہ
- ہے
- he
- ہیڈر
- اعلی معیار کی
- ان
- کی ڈگری حاصل کی
- ہوم پیج (-)
- کس طرح
- کیسے
- تاہم
- HTML
- HTTPS
- i
- ایک جیسے
- if
- تصاویر
- اثر
- نفاذ
- درآمد
- اہم
- متاثر کن
- کو بہتر بنانے کے
- in
- شامل ہیں
- انڈکس
- انڈیکس شدہ
- معلومات
- معلوماتی
- ابتدائی
- بصیرت
- ہدایات
- انضمام
- انٹیلی جنس
- انٹرایکٹو
- مفادات
- انٹرفیس
- انٹرنیٹ
- میں
- شامل
- IT
- تکرار
- تکرار
- میں
- نوکریاں
- فوٹو
- JSON
- علم
- لینڈ
- زبان
- بڑے
- بڑے پیمانے پر
- شروع
- لیڈز
- جانیں
- سیکھنے
- چھوڑ دو
- قیادت
- لیورنگنگ
- جھوٹ ہے
- کی طرح
- لسٹ
- سن
- ایل ایل ایم
- لوڈ
- محل وقوع
- مقامات
- بند
- بہت
- محبت کرتا تھا
- لو
- مشین
- مشین لرننگ
- مین
- بنا
- بناتا ہے
- ماسک
- بڑے پیمانے پر
- ماسٹر
- مئی..
- نظام
- میڈیا
- مینو
- میٹا
- میٹا ڈیٹا
- ML
- ماڈل
- ماڈل
- معمولی
- زیادہ
- سب سے زیادہ
- ایک سے زیادہ
- موسیقی
- نام
- قدرتی
- قدرتی زبان عملیات
- فطرت، قدرت
- سمت شناسی
- ضروری
- ضرورت ہے
- نئی
- اگلے
- نہیں
- نوٹ بک
- اب
- of
- اکثر
- on
- ایک بار
- والوں
- صرف
- آپریشنز
- اختیار
- or
- تنظیم
- تنظیمیں
- دیگر
- ہمارے
- باہر
- نتائج
- باہر
- پیداوار
- پر
- صفحہ
- pandas
- پین
- پاسنگ
- پاس ورڈ
- کارکردگی
- ذاتی
- لینے
- ٹکڑا
- ٹکڑے ٹکڑے
- پائپ لائن
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- مہربانی کرکے
- علاوہ
- پوائنٹ
- پالیسیاں
- پوسٹ
- ممکنہ
- طاقت
- کو ترجیح دی
- تیاری
- تیار
- کی تیاری
- پہلے
- شاید
- مسئلہ
- مسائل
- آگے بڑھو
- عمل
- پروسیسنگ
- پیداوار
- پیداوری
- پیشہ ورانہ
- منصوبے
- خصوصیات
- فراہم
- فراہم کرتا ہے
- فراہم کرنے
- ازگر
- سوالات
- سوال
- سوالات
- جلدی سے
- حدود
- تیزی سے
- درجہ بندی
- تک پہنچنے
- پڑھیں
- حقیقی دنیا
- موصول
- کا حوالہ دیتے ہیں
- متعلقہ
- متعلقہ
- کو ہٹانے کے
- اطلاع دی
- درخواستوں
- کی ضرورت
- کی ضرورت ہے
- وسائل
- جواب
- جوابات
- آرام
- نتائج کی نمائش
- واپسی
- جائزہ
- ٹھیک ہے
- کردار
- رن
- sagemaker
- اسی
- محفوظ کریں
- سائنسدان
- تلاش کریں
- تلاش
- سیکشن
- دیکھا
- منتخب
- بھیجنا
- سینئر
- حساس
- سروس
- سروسز
- ترتیبات
- ہونا چاہئے
- دکھائیں
- سے ظاہر ہوا
- بند
- بند کرو
- کی طرف
- سائن ان کریں
- اہم
- اسی طرح
- سادگی
- آسان بنانے
- سائز
- ٹکڑا
- So
- سماجی
- سوشل میڈیا
- حل
- حل
- حل
- کچھ
- ماخذ
- ذرائع
- مخصوص
- خاص طور پر
- خرچ
- خرچ کرنا۔
- اسٹیج
- مراحل
- مرحلہ
- مراحل
- ابھی تک
- حکمت عملی
- منظم
- خلاصہ
- کی حمایت کرتا ہے
- سروے
- لے لو
- ٹیموں
- ٹیکنیکل
- تکنیک
- ٹیسٹ
- متن
- کہ
- ۔
- مستقبل
- ان
- ان
- تو
- وہاں.
- یہ
- وہ
- اس
- اس طرح
- وقت
- ٹائٹین
- کرنے کے لئے
- آج
- اوزار
- ٹریننگ
- تبدیل
- تبدیلی
- تبدیلی
- تبدیل
- سچ
- کاٹنا
- قسم
- اقسام
- متحد
- us
- استعمال کی شرائط
- استعمال کیا جاتا ہے
- رکن کا
- صارفین
- کا استعمال کرتے ہوئے
- قیمتی
- کی طرف سے
- ویڈیو
- بصری
- واک تھرو
- we
- ویب
- ویب خدمات
- اچھا ہے
- جس
- جبکہ
- ڈبلیو
- گے
- ساتھ
- کام
- کام کا بہاؤ
- کام کرتا ہے
- گا
- لکھنا
- تم
- اور
- زیفیرنیٹ