صحت کی دیکھ بھال، مالیاتی خدمات، پبلک سیکٹر، اور دیگر صنعتوں میں AWS کے صارفین اربوں دستاویزات کو تصاویر یا پی ڈی ایف کے طور پر محفوظ کرتے ہیں۔ ایمیزون سادہ اسٹوریج سروس (ایمیزون S3)۔ تاہم، وہ بصیرت حاصل کرنے سے قاصر ہیں جیسے کہ بڑے لینگوئج ماڈلز (LLMs) کے لیے دستاویزات میں بند معلومات کو استعمال کرنا یا اس وقت تک تلاش کرنا جب تک کہ وہ متن، فارمز، ٹیبلز اور دیگر سٹرکچرڈ ڈیٹا کو نکال نہ لیں۔ AWS ذہین دستاویز پروسیسنگ (IDP) کے ساتھ AI خدمات کا استعمال کرتے ہوئے جیسے ایمیزون ٹیکسٹ، آپ PDFs یا دستاویزی تصاویر (TIFF، JPEG، PNG) سے ڈیٹا کو تیزی سے اور درست طریقے سے پروسیس کرنے کے لیے صنعت کی معروف مشین لرننگ (ML) ٹیکنالوجی کا فائدہ اٹھا سکتے ہیں۔ دستاویزات سے متن نکالنے کے بعد، آپ اسے فاؤنڈیشن ماڈل کو ٹھیک کرنے کے لیے استعمال کر سکتے ہیں، فاؤنڈیشن ماڈل کا استعمال کرتے ہوئے ڈیٹا کا خلاصہ کریں۔، یا اسے ڈیٹا بیس میں بھیجیں۔
اس پوسٹ میں، ہم دستاویزات کے ایک بڑے ذخیرے کو خام ٹیکسٹ فائلوں میں پروسیس کرنے اور انہیں Amazon S3 میں اسٹور کرنے پر توجہ مرکوز کرتے ہیں۔ ہم آپ کو اس استعمال کے معاملے کے لیے دو مختلف حل فراہم کرتے ہیں۔ پہلا آپ کو کسی بھی سرور یا مثال سے ایک پائیتھن اسکرپٹ چلانے کی اجازت دیتا ہے جس میں Jupyter نوٹ بک بھی شامل ہے۔ یہ شروع کرنے کا تیز ترین طریقہ ہے۔ دوسرا نقطہ نظر مختلف بنیادی ڈھانچے کے اجزاء کا استعمال کرتے ہوئے ٹرنکی تعیناتی ہے۔ AWS کلاؤڈ ڈویلپمنٹ کٹ (AWS CDK) تعمیرات. AWS CDK کنسٹرکٹ آپ کے دستاویزات پر کارروائی کرنے اور آئی ڈی پی پائپ لائن کی تعمیر کے لیے ایک لچکدار اور لچکدار فریم ورک فراہم کرتا ہے۔ AWS CDK کے استعمال کے ذریعے، آپ ترمیم کو شامل کرنے کے لیے اس کی فعالیت کو بڑھا سکتے ہیں، ایمیزون اوپن سرچ میں آؤٹ پٹ کو اسٹور کریں۔، یا ایک حسب ضرورت شامل کریں۔ او ڈبلیو ایس لامبڈا۔ اپنی کاروباری منطق کے ساتھ کام کریں۔
یہ دونوں حل آپ کو لاکھوں صفحات پر تیزی سے کارروائی کرنے کی اجازت دیتے ہیں۔ ان میں سے کسی ایک حل کو پیمانے پر چلانے سے پہلے، ہم آپ کے دستاویزات کے ذیلی سیٹ کے ساتھ جانچ کرنے کی تجویز کرتے ہیں تاکہ یہ یقینی بنایا جا سکے کہ نتائج آپ کی توقعات پر پورا اترتے ہیں۔ مندرجہ ذیل حصوں میں، ہم پہلے اسکرپٹ حل کی وضاحت کرتے ہیں، اس کے بعد AWS CDK تعمیراتی حل۔
حل 1: ازگر کا اسکرپٹ استعمال کریں۔
یہ حل خام ٹیکسٹ کے لیے Amazon Textract کے ذریعے دستاویزات پر تیزی سے کارروائی کرتا ہے کیونکہ سروس اس توقع کے ساتھ اجازت دے گی کہ اگر اسکرپٹ میں کوئی ناکامی ہوتی ہے، تو یہ عمل وہیں سے شروع ہو جائے گا جہاں سے اس نے چھوڑا تھا۔ حل تین مختلف خدمات کا استعمال کرتا ہے: ایمیزون S3، ایمیزون ڈائنومو ڈی بی، اور ایمیزون ٹیکسٹریکٹ۔
درج ذیل خاکہ اسکرپٹ کے اندر واقعات کی ترتیب کو واضح کرتا ہے۔ اسکرپٹ کے ختم ہونے پر، مکمل ہونے والے وقت کے ساتھ ساتھ SageMaker اسٹوڈیو کنسول کو واپس کر دیا جائے گا۔
ہم نے اس حل کو a میں پیک کیا ہے۔ .ipynb اسکرپٹ اور .py اسکرپٹ. آپ اپنی ضروریات کے مطابق کسی بھی قابل تعیناتی حل کو استعمال کر سکتے ہیں۔
شرائط
اس اسکرپٹ کو Jupyter نوٹ بک سے چلانے کے لیے، the AWS شناخت اور رسائی کا انتظام نوٹ بک کو تفویض کردہ (IAM) رول میں ایسی اجازتیں ہونی چاہئیں جو اسے DynamoDB، Amazon S3، اور Amazon Textract کے ساتھ تعامل کرنے کی اجازت دیتی ہیں۔ عام رہنمائی یہ ہے کہ آپ کو ان میں سے ہر ایک خدمات کے لیے کم سے کم استحقاق کی اجازتیں فراہم کریں۔ AmazonSageMaker-ExecutionRole
کردار مزید جاننے کے لیے رجوع کریں۔ AWS کے زیر انتظام پالیسیوں کے ساتھ شروع کریں اور کم از کم استحقاق کی اجازتوں کی طرف بڑھیں۔.
متبادل طور پر، آپ اس اسکرپٹ کو دوسرے ماحول جیسے کہ ایک سے چلا سکتے ہیں۔ ایمیزون لچکدار کمپیوٹ کلاؤڈ (ایمیزون EC2) مثال یا کنٹینر جس کا آپ انتظام کریں گے، بشرطیکہ Python، Pip3، اور AWS SDK برائے Python (Boto3) نصب ہیں. ایک بار پھر، وہی IAM پالیسیوں کو لاگو کرنے کی ضرورت ہے جو اسکرپٹ کو مختلف منظم خدمات کے ساتھ تعامل کرنے کی اجازت دیتی ہیں۔
واک تھرو
اس حل کو نافذ کرنے کے لیے، آپ کو پہلے ریپوزٹری کو کلون کرنے کی ضرورت ہے۔ GitHub کے.
آپ کو اسکرپٹ میں درج ذیل متغیرات کو ترتیب دینے کی ضرورت ہے اس سے پہلے کہ آپ اسے چلا سکیں:
- ٹریکنگ_ٹیبل - یہ DynamoDB ٹیبل کا نام ہے جو بنایا جائے گا۔
- ان پٹ_بالٹی - یہ ایمیزون S3 میں آپ کا ماخذ مقام ہے جس میں وہ دستاویزات ہیں جو آپ ٹیکسٹ کا پتہ لگانے کے لیے Amazon Textract کو بھیجنا چاہتے ہیں۔ اس متغیر کے لیے، بالٹی کا نام فراہم کریں، جیسے
mybucket
. - آؤٹ پٹ_بکٹ - یہ اس جگہ کو ذخیرہ کرنے کے لیے ہے جہاں آپ Amazon Textract کو نتائج لکھنا چاہتے ہیں۔ اس متغیر کے لیے، بالٹی کا نام فراہم کریں، جیسے
myoutputbucket
. - _input_prefix (اختیاری) – اگر آپ اپنی S3 بالٹی میں کسی فولڈر کے اندر سے کچھ فائلوں کو منتخب کرنا چاہتے ہیں، تو آپ اس فولڈر کا نام بطور ان پٹ سابقہ بیان کر سکتے ہیں۔ بصورت دیگر، سب کو منتخب کرنے کے لیے پہلے سے طے شدہ کو خالی چھوڑ دیں۔
اسکرپٹ درج ذیل ہے:
جب اسکرپٹ چلایا جاتا ہے تو درج ذیل DynamoDB ٹیبل اسکیما بن جاتا ہے۔
جب اسکرپٹ کو پہلی بار چلایا جائے گا، تو یہ چیک کرے گا کہ آیا DynamoDB ٹیبل موجود ہے اور ضرورت پڑنے پر اسے خود بخود بنا دے گا۔ ٹیبل بننے کے بعد، ہمیں اسے Amazon S3 سے دستاویز آبجیکٹ کے حوالہ جات کی فہرست کے ساتھ آباد کرنے کی ضرورت ہے جس پر ہم کارروائی کرنا چاہتے ہیں۔ ڈیزائن کے لحاظ سے اسکرپٹ مخصوص میں موجود اشیاء پر شمار کرے گا۔ input_bucket
اور جب چلایا جائے تو خود بخود ہمارے ٹیبل کو ان کے ناموں کے ساتھ آباد کریں۔ 10 سے زیادہ دستاویزات کو شمار کرنے اور ان ناموں کو اسکرپٹ سے DynamoDB ٹیبل میں آباد کرنے میں تقریباً 100,000 منٹ لگتے ہیں۔ اگر آپ کے پاس ایک بالٹی میں لاکھوں اشیاء ہیں، تو آپ متبادل طور پر Amazon S3 کی انوینٹری کی خصوصیت استعمال کر سکتے ہیں جو ناموں کی CSV فائل تیار کرتی ہے، پھر اس فہرست میں سے DynamoDB ٹیبل کو اپنی اسکرپٹ کے ساتھ پہلے سے تیار کریں اور نام کا فنکشن استعمال نہ کریں۔ fetchAllObjectsInBucketandStoreName
اس پر تبصرہ کرتے ہوئے. مزید جاننے کے لیے رجوع کریں۔ ایمیزون S3 انوینٹری کو ترتیب دینا.
جیسا کہ پہلے ذکر کیا گیا ہے، نوٹ بک ورژن اور ازگر اسکرپٹ ورژن دونوں موجود ہیں۔ نوٹ بک شروع کرنے کا سب سے سیدھا طریقہ ہے۔ بس ہر سیل کو شروع سے ختم تک چلائیں۔
اگر آپ CLI سے Python اسکرپٹ چلانے کا فیصلہ کرتے ہیں، تو یہ تجویز کیا جاتا ہے کہ آپ ٹرمینل ملٹی پلیکسر جیسے کہ tmux استعمال کریں۔ یہ اسکرپٹ کو رکنے سے روکنے کے لیے ہے اگر آپ کا SSH سیشن ختم ہو جائے۔ مثال کے طور پر: tmux new -d ‘python3 textractFeeder.py’
.
مندرجہ ذیل ہے اسکرپٹ کا داخلہ نقطہ; یہاں سے آپ ان طریقوں پر تبصرہ کر سکتے ہیں جن کی ضرورت نہیں ہے۔
جب اسکرپٹ DynamoDB ٹیبل کو آباد کر رہا ہو تو درج ذیل فیلڈز سیٹ کیے جاتے ہیں:
- آبجیکٹ کا نام - Amazon S3 میں موجود دستاویز کا نام جو Amazon Textract کو بھیجا جائے گا۔
- bucketName - وہ بالٹی جہاں دستاویز آبجیکٹ کو محفوظ کیا جاتا ہے۔
اگر آپ S3 انوینٹری رپورٹ سے CSV فائل استعمال کرنے کا فیصلہ کرتے ہیں اور اسکرپٹ کے اندر ہونے والی آٹو پاپولیٹنگ کو چھوڑ دیتے ہیں تو ان دونوں فیلڈز کو پاپولٹ ہونا چاہیے۔
اب جب کہ ٹیبل دستاویز آبجیکٹ کے حوالہ جات کے ساتھ تیار اور آباد ہو گیا ہے، اسکرپٹ ایمیزون ٹیکسٹریکٹ کو کال کرنا شروع کرنے کے لیے تیار ہے۔ StartDocumentTextDetection
API Amazon Textract، دوسری منظم خدمات کی طرح، ایک ہے۔ پہلے سے طے شدہ حد APIs پر جسے ٹرانزیکشن فی سیکنڈ (TPS) کہا جاتا ہے۔ اگر ضرورت ہو تو، آپ Amazon Textract کنسول سے کوٹہ بڑھانے کی درخواست کر سکتے ہیں۔ کوڈ کو ایمیزون ٹیکسٹریکٹ کو کال کرتے وقت بیک وقت متعدد تھریڈز استعمال کرنے کے لیے ڈیزائن کیا گیا ہے تاکہ سروس کے ساتھ تھرو پٹ کو زیادہ سے زیادہ بنایا جا سکے۔ آپ اسے کوڈ میں ترمیم کرکے تبدیل کرسکتے ہیں۔ threadCountforTextractAPICall
متغیر پہلے سے طے شدہ طور پر، یہ 20 تھریڈز پر سیٹ ہے۔ اسکرپٹ ابتدائی طور پر DynamoDB ٹیبل سے 200 قطاریں پڑھے گی اور انہیں ان میموری لسٹ میں اسٹور کرے گی جو تھریڈ سیفٹی کے لیے کلاس کے ساتھ لپٹی ہوئی ہے۔ اس کے بعد ہر کالر تھریڈ شروع ہوتا ہے اور اس کی اپنی سوئم لین میں چلتا ہے۔ بنیادی طور پر، Amazon Textract کالر تھریڈ ان میموری لسٹ سے ایک آئٹم کو بازیافت کرے گا جس میں ہمارے آبجیکٹ کا حوالہ ہے۔ اس کے بعد اسے غیر مطابقت پذیر کہا جائے گا۔ start_document_text_detection
API اور نوکری کی شناخت کے ساتھ اعتراف کا انتظار کریں۔ اس کے بعد جاب آئی ڈی کو اس آبجیکٹ کے لیے DynamoDB قطار میں اپ ڈیٹ کر دیا جاتا ہے، اور دھاگہ فہرست سے اگلی آئٹم بازیافت کر کے دہرایا جائے گا۔
مندرجہ ذیل مین آرکیسٹریشن کوڈ ہے۔ اسکرپٹ:
کال کرنے والے تھریڈز اس وقت تک دہراتے رہیں گے جب تک کہ فہرست میں کوئی آئٹم باقی نہ رہے، اس مقام پر ہر تھریڈز رک جائیں گے۔ جب ان کی سوئم لین میں کام کرنے والے تمام تھریڈز بند ہو جاتے ہیں، تو DynamoDB سے اگلی 200 قطاریں بازیافت کی جاتی ہیں اور 20 تھریڈز کا ایک نیا سیٹ شروع کر دیا جاتا ہے، اور یہ سارا عمل اس وقت تک دہرایا جاتا ہے جب تک کہ ہر وہ قطار جس میں جاب آئی ڈی نہیں ہوتی DynamoDB سے بازیافت نہیں ہو جاتی اور اپ ڈیٹ اگر کسی غیر متوقع مسئلے کی وجہ سے اسکرپٹ کریش ہو جائے تو اسکرپٹ کو دوبارہ سے چلایا جا سکتا ہے۔ orchestrate()
طریقہ یہ اس بات کو یقینی بناتا ہے کہ تھریڈز ان قطاروں پر کارروائی جاری رکھیں گے جن میں خالی جاب IDs ہوں گی۔ نوٹ کریں کہ دوبارہ چلاتے وقت orchestrate()
اسکرپٹ کے بند ہونے کے بعد، اس بات کا امکان ہے کہ کچھ دستاویزات دوبارہ ایمیزون ٹیکسٹریکٹ کو بھیج دی جائیں گی۔ یہ تعداد ان دھاگوں کی تعداد کے برابر یا اس سے کم ہوگی جو کریش کے وقت چل رہے تھے۔
جب DynamoDB ٹیبل میں خالی جاب ID پر مشتمل مزید قطاریں نہ ہوں تو اسکرپٹ رک جائے گا۔ تمام اشیاء کے لیے Amazon Textract سے تمام JSON آؤٹ پٹ میں ملیں گے۔ output_bucket
کے تحت پہلے سے طے شدہ طور پر textract_output
فولڈر ہر ذیلی فولڈر کے اندر textract_output
جاب آئی ڈی کے ساتھ نام رکھا جائے گا جو اس جاب آئی ڈی سے مماثل ہے جو اس آبجیکٹ کے لیے DynamoDB ٹیبل میں محفوظ کیا گیا تھا۔ جاب ID فولڈر کے اندر، آپ کو JSON ملے گا، جس کا نام عددی طور پر 1 سے شروع ہو گا اور ممکنہ طور پر اضافی JSON فائلوں کو پھیلا سکتا ہے جن پر 2، 3 اور اسی طرح کا لیبل لگایا جائے گا۔ JSON فائلوں کو پھیلانا گھنے یا کثیر صفحات پر مشتمل دستاویزات کا نتیجہ ہے، جہاں نکالے گئے مواد کی مقدار Amazon Textract کے ڈیفالٹ JSON سائز 1,000 بلاکس سے زیادہ ہے۔ کا حوالہ دیتے ہیں بلاک بلاکس کے بارے میں مزید معلومات کے لیے۔ یہ JSON فائلیں تمام Amazon Textract میٹا ڈیٹا پر مشتمل ہوں گی، بشمول وہ متن جو دستاویزات کے اندر سے نکالا گیا تھا۔
آپ اس حل کے لیے ازگر کوڈ نوٹ بک ورژن اور اسکرپٹ تلاش کر سکتے ہیں۔ GitHub کے.
صاف کرو
جب Python اسکرپٹ مکمل ہو جائے تو، آپ کو بند یا بند کر کے اخراجات بچا سکتے ہیں۔ ایمیزون سیج میکر اسٹوڈیو نوٹ بک یا کنٹینر جو آپ نے کاتا ہے۔
اب پیمانے پر دستاویزات کے ہمارے دوسرے حل کی طرف۔
حل 2: سرور لیس AWS CDK تعمیر کا استعمال کریں۔
یہ حل استعمال کرتا ہے۔ AWS اسٹیپ فنکشنز اور لیمبڈا آئی ڈی پی پائپ لائن کو آرکیسٹریٹ کرنے کے لیے کام کرتا ہے۔ ہم استعمال کرتے ہیں IDP AWS CDK کی تعمیر، جو ایمیزون ٹیکسٹریکٹ کے ساتھ پیمانے پر کام کرنا آسان بنا دیتا ہے۔ اس کے علاوہ، ہم استعمال کرتے ہیں a سٹیپ فنکشنز تقسیم شدہ نقشہ S3 بالٹی میں موجود تمام فائلوں پر اعادہ کریں اور پروسیسنگ شروع کریں۔ پہلا لیمبڈا فنکشن اس بات کا تعین کرتا ہے کہ آپ کی دستاویزات میں کتنے صفحات ہیں۔ یہ پائپ لائن کو یا تو ہم وقت ساز (ایک صفحے کے دستاویزات کے لیے) یا غیر مطابقت پذیر (ملٹی پیج دستاویزات کے لیے) API کو خود بخود استعمال کرنے کے قابل بناتا ہے۔ غیر مطابقت پذیر API کا استعمال کرتے وقت، تمام JSON فائلوں کو ایک اضافی Lambda فنکشن کہا جاتا ہے جو Amazon Textract آپ کے تمام صفحات کے لیے ایک JSON فائل میں تیار کرے گا تاکہ آپ کی ڈاؤن اسٹریم ایپلی کیشنز کو معلومات کے ساتھ کام کرنے کے لیے اسے سیدھا بنایا جا سکے۔
اس حل میں دو اضافی لیمبڈا فنکشن بھی شامل ہیں۔ پہلا فنکشن JSON سے متن کو پارس کرتا ہے اور اسے Amazon S3 میں ٹیکسٹ فائل کے طور پر محفوظ کرتا ہے۔ دوسرا فنکشن JSON کا تجزیہ کرتا ہے اور اسے کام کے بوجھ پر میٹرکس کے لیے اسٹور کرتا ہے۔
درج ذیل خاکہ سٹیپ فنکشنز ورک فلو کو واضح کرتا ہے۔
شرائط
یہ کوڈ بیس AWS CDK استعمال کرتا ہے اور اسے Docker کی ضرورت ہوتی ہے۔ آپ اسے ایک سے تعینات کر سکتے ہیں۔ AWS کلاؤڈ 9 مثال کے طور پر، جس میں AWS CDK اور Docker پہلے ہی سیٹ اپ ہے۔
واک تھرو
اس حل کو نافذ کرنے کے لیے، آپ کو پہلے کلون کرنے کی ضرورت ہے۔ ذخیرہ.
ریپوزٹری کو کلون کرنے کے بعد، انحصار انسٹال کریں:
پھر AWS CDK اسٹیک کو تعینات کرنے کے لیے درج ذیل کوڈ کا استعمال کریں:
آپ کو اس حل کے لیے سورس بالٹی اور سورس کا سابقہ (فائلوں کا مقام جن پر آپ کارروائی کرنا چاہتے ہیں) دونوں فراہم کرنا ہوں گے۔
جب تعیناتی مکمل ہو جائے، سٹیپ فنکشنز کنسول پر جائیں، جہاں آپ کو سٹیٹ مشین نظر آنی چاہیے۔ ServerlessIDPArchivePipeline
.
ریاستی مشین کی تفصیلات کا صفحہ کھولیں اور اس پر پھانسیاں۔ ٹیب، منتخب کریں عمل درآمد شروع کریں۔.
میں سے انتخاب کریں عمل درآمد شروع کریں۔ دوبارہ ریاستی مشین کو چلانے کے لیے۔
ریاستی مشین کو شروع کرنے کے بعد، آپ نقشہ چلانے کو دیکھ کر پائپ لائن کی نگرانی کر سکتے ہیں۔ آپ دیکھیں گے کہ ایک آئٹم پروسیسنگ کی حیثیت مندرجہ ذیل اسکرین شاٹ کی طرح سیکشن. جیسا کہ آپ دیکھ سکتے ہیں، یہ چلانے اور ٹریک کرنے کے لیے بنایا گیا ہے کہ کیا کامیاب ہوا اور کیا ناکام۔ یہ عمل اس وقت تک جاری رہے گا جب تک تمام دستاویزات پڑھ نہیں لی جاتیں۔
اس حل کے ساتھ، آپ کو اپنے AWS اکاؤنٹ میں لاکھوں فائلوں کو پروسیس کرنے کے قابل ہونا چاہیے، اس بات کی فکر کیے بغیر کہ کس طرح مناسب طریقے سے یہ تعین کیا جائے کہ کون سی فائلیں کن API کو بھیجنی ہیں یا آپ کی پائپ لائن میں خراب فائلیں ناکام ہو رہی ہیں۔ سٹیپ فنکشنز کنسول کے ذریعے، آپ حقیقی وقت میں اپنی فائلوں کو دیکھنے اور ان کی نگرانی کر سکیں گے۔
صاف کرو
آپ کی پائپ لائن چلنے کے بعد، صاف کرنے کے لیے، آپ اپنے پروجیکٹ میں واپس جا سکتے ہیں اور درج ذیل کمانڈ درج کر سکتے ہیں:
اس سے وہ تمام سروسز حذف ہو جائیں گی جو اس پروجیکٹ کے لیے تعینات کی گئی تھیں۔
نتیجہ
اس پوسٹ میں، ہم نے ایک ایسا حل پیش کیا ہے جو آپ کی دستاویز کی تصاویر اور پی ڈی ایف کو ٹیکسٹ فائلوں میں تبدیل کرنا آسان بناتا ہے۔ تخلیقی AI اور تلاش کے لیے آپ کے دستاویزات کو استعمال کرنے کے لیے یہ ایک اہم شرط ہے۔ اپنے فاؤنڈیشن ماڈلز کو تربیت دینے یا ٹھیک کرنے کے لیے ٹیکسٹ استعمال کرنے کے بارے میں مزید جاننے کے لیے، دیکھیں Amazon SageMaker JumpStart پر ٹیکسٹ جنریشن کے لیے فائن ٹیون لاما 2. تلاش کے ساتھ استعمال کرنے کے لیے رجوع کریں۔ Amazon Textract اور Amazon OpenSearch کے ساتھ سمارٹ دستاویز سرچ انڈیکس کو لاگو کریں۔. AWS AI سروسز کی طرف سے پیش کردہ جدید دستاویز پراسیسنگ کی صلاحیتوں کے بارے میں مزید جاننے کے لیے، ملاحظہ کریں۔ AWS پر ذہین دستاویز پروسیسنگ کے لیے رہنمائی.
مصنفین کے بارے میں
ٹم کونڈیلو ایمیزون ویب سروسز (AWS) میں ایک سینئر مصنوعی ذہانت (AI) اور مشین لرننگ (ML) ماہر حل آرکیٹیکٹ ہے۔ اس کا فوکس قدرتی زبان کی پروسیسنگ اور کمپیوٹر ویژن ہے۔ ٹم کو گاہک کے خیالات لینے اور انہیں قابل توسیع حل میں تبدیل کرنے میں مزہ آتا ہے۔
ڈیوڈ گرلنگ ایک سینئر AI/ML سلوشنز آرکیٹیکٹ ہے جس کے پاس انٹرپرائز سسٹمز کی ڈیزائننگ، رہنمائی اور ترقی میں بیس سال سے زیادہ کا تجربہ ہے۔ ڈیوڈ ایک ماہر ٹیم کا حصہ ہے جو صارفین کو ان کے استعمال کے معاملات کے لیے اپنے ڈیٹا کے ساتھ ان انتہائی قابل خدمات کو سیکھنے، اختراع کرنے اور استعمال کرنے میں مدد کرنے پر توجہ مرکوز کرتی ہے۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://aws.amazon.com/blogs/machine-learning/create-a-document-lake-using-large-scale-text-extraction-from-documents-with-amazon-textract/
- : ہے
- : ہے
- : نہیں
- :کہاں
- $UP
- 000
- 1
- 10
- 100
- 12
- 20
- 200
- 7
- 710
- 8
- a
- قابلیت
- ہمارے بارے میں
- تک رسائی حاصل
- اکاؤنٹ
- درست طریقے سے
- شامل کریں
- ایڈیشنل
- اس کے علاوہ
- آگے بڑھانے کے
- اعلی درجے کی
- فائدہ
- کے بعد
- پھر
- AI
- AI خدمات
- AI / ML
- تمام
- کی اجازت
- کی اجازت دیتا ہے
- ساتھ
- پہلے ہی
- بھی
- ایمیزون
- ایمیزون EC2
- ایمیزون سیج میکر
- ایمیزون ٹیکسٹ
- ایمیزون ویب سروسز
- ایمیزون ویب سروسز (AWS)
- رقم
- an
- تجزیہ کرتا ہے
- اور
- کوئی بھی
- اے پی آئی
- APIs
- ایپلی کیشنز
- اطلاقی
- نقطہ نظر
- تقریبا
- کیا
- مصنوعی
- مصنوعی ذہانت
- مصنوعی انٹیلی جنس (AI)
- AS
- تفویض
- At
- آٹو
- خود کار طریقے سے
- AWS
- واپس
- بیس
- بنیادی طور پر
- BE
- رہا
- اس سے پہلے
- اربوں
- بلاکس
- بوٹسٹریپ
- دونوں
- تعمیر
- تعمیر
- کاروبار
- by
- فون
- کہا جاتا ہے
- کالر
- بلا
- کر سکتے ہیں
- صلاحیتوں
- صلاحیت رکھتا
- کیس
- مقدمات
- سیل
- کچھ
- تبدیل
- چیک کریں
- میں سے انتخاب کریں
- طبقے
- صاف
- بادل
- کوڈ
- کوڈ بیس
- مجموعہ
- تبصرہ
- تبصرہ
- مکمل
- تکمیل
- اجزاء
- کمپیوٹنگ
- کمپیوٹر
- کمپیوٹر ویژن
- کنسول
- تعمیر
- پر مشتمل ہے
- کنٹینر
- پر مشتمل ہے
- مواد
- جاری
- تبدیل
- مساوی ہے
- اخراجات
- سکتا ہے
- ناکام، ناکامی
- تخلیق
- بنائی
- اپنی مرضی کے
- گاہک
- گاہکوں
- اعداد و شمار
- ڈیٹا بیس
- ڈیوڈ
- فیصلہ کرنا
- پہلے سے طے شدہ
- انحصار
- تعیناتی
- تعینات
- تعیناتی
- بیان
- ڈیزائن
- ڈیزائن
- ڈیزائننگ
- تفصیلات
- کھوج
- اس بات کا تعین
- یہ تعین
- ترقی
- ترقی
- مختلف
- تقسیم کئے
- میں Docker
- دستاویز
- دستاویزات
- نہیں کرتا
- نیچے
- دو
- ہر ایک
- اس سے قبل
- یا تو
- کے قابل بناتا ہے
- آخر سے آخر تک
- ختم ہو جاتا ہے
- درج
- انٹرپرائز
- اندراج
- ماحول
- برابر
- واقعات
- ہر کوئی
- مثال کے طور پر
- سے تجاوز
- پھانسی
- موجود ہے
- امید
- توقعات
- تجربہ
- توسیع
- نکالنے
- نکالنے
- ناکام
- ناکامی
- ناکامی
- نمایاں کریں
- چند
- قطعات
- فائل
- فائلوں
- مالی
- مالیاتی خدمات
- مل
- ختم
- پہلا
- پہلی بار
- لچکدار
- توجہ مرکوز
- توجہ مرکوز
- پیچھے پیچھے
- کے بعد
- مندرجہ ذیل ہے
- کے لئے
- فارم
- ملا
- فاؤنڈیشن
- فریم ورک
- سے
- تقریب
- فعالیت
- افعال
- حاصل کرنا
- جنرل
- پیدا ہوتا ہے
- نسل
- پیداواری
- پیداواری AI۔
- حاصل
- Go
- رہنمائی
- ہوتا ہے
- ہے
- صحت کی دیکھ بھال
- مدد
- یہاں
- انتہائی
- ان
- کس طرح
- کیسے
- تاہم
- HTML
- HTTP
- HTTPS
- i
- ID
- خیالات
- شناختی
- شناخت
- if
- وضاحت کرتا ہے
- تصاویر
- پر عملدرآمد
- in
- شامل
- سمیت
- اضافہ
- انڈکس
- صنعتوں
- صنعت کے معروف
- معلومات
- انفراسٹرکچر
- ابتدائی طور پر
- شروع
- اختراعات
- ان پٹ
- بصیرت
- انسٹال
- نصب
- مثال کے طور پر
- انٹیلی جنس
- انٹیلجنٹ
- ذہین دستاویز پروسیسنگ
- بات چیت
- میں
- انوینٹری
- IT
- اشیاء
- میں
- ایوب
- فوٹو
- JSON
- کلیدی
- جھیل
- لین
- زبان
- بڑے
- بڑے پیمانے پر
- معروف
- جانیں
- سیکھنے
- چھوڑ دو
- چھوڑ دیا
- کم
- کی طرح
- لسٹ
- لاما
- واقع ہے
- محل وقوع
- تالا لگا
- منطق
- اب
- تلاش
- مشین
- مشین لرننگ
- مین
- بنا
- بناتا ہے
- انتظام
- میں کامیاب
- بہت سے
- نقشہ
- زیادہ سے زیادہ
- سے ملو
- ذکر کیا
- میٹا ڈیٹا
- طریقہ
- طریقوں
- پیمائش کا معیار
- لاکھوں
- منٹ
- ML
- ماڈل
- ماڈل
- کی نگرانی
- زیادہ
- سب سے زیادہ
- منتقل
- ایک سے زیادہ
- ضروری
- نام
- نامزد
- نام
- قدرتی
- قدرتی زبان عملیات
- تشریف لے جائیں
- ضرورت ہے
- ضرورت
- نئی
- اگلے
- نہیں
- براہ مہربانی نوٹ کریں
- نوٹ بک
- اب
- تعداد
- اعتراض
- اشیاء
- of
- بند
- کی پیشکش کی
- on
- ایک
- کام
- or
- آرکیسٹرا
- دیگر
- دوسری صورت میں
- ہمارے
- باہر
- پیداوار
- پر
- خود
- پیک۔
- صفحہ
- صفحات
- حصہ
- فی
- اجازتیں
- لینے
- پائپ لائن
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- پوائنٹ
- پالیسیاں
- آباد ہے
- پوسٹ
- ممکنہ
- ممکنہ طور پر
- پیش
- کی روک تھام
- مسئلہ
- عمل
- عمل
- پروسیسنگ
- پیدا
- منصوبے
- مناسب طریقے سے
- فراہم
- فراہم
- فراہم کرتا ہے
- عوامی
- ڈال
- ازگر
- تیز ترین
- جلدی سے
- خام
- پڑھیں
- تیار
- اصلی
- اصل وقت
- سفارش
- سفارش کی
- ریکارڈ
- ریکارڈ
- کا حوالہ دیتے ہیں
- حوالہ
- حوالہ جات
- دوبارہ
- رپورٹ
- ذخیرہ
- درخواست
- ضرورت
- ضروریات
- کی ضرورت ہے
- لچکدار
- نتیجہ
- نتائج کی نمائش
- کردار
- ROW
- رن
- چل رہا ہے
- چلتا ہے
- محفوظ
- سیفٹی
- sagemaker
- اسی
- محفوظ کریں
- توسیع پذیر
- پیمانے
- اسکرپٹ
- sdk
- تلاش کریں
- دوسری
- سیکشن
- سیکشنز
- شعبے
- دیکھنا
- منتخب
- بھیجنے
- سینئر
- بھیجا
- تسلسل
- سرور
- بے سرور
- سروس
- سروسز
- اجلاس
- مقرر
- ہونا چاہئے
- کواڑ بند کرنے
- اسی طرح
- سادہ
- صرف
- سائز
- ہوشیار
- So
- حل
- حل
- کچھ
- ماخذ
- دورانیہ
- تناؤ
- ماہر
- مخصوص
- کاتنا۔
- ڈھیر لگانا
- شروع کریں
- شروع
- شروع
- حالت
- درجہ
- مرحلہ
- بند کرو
- بند کر دیا
- روکنا
- ذخیرہ
- ذخیرہ
- ذخیرہ
- پردہ
- ذخیرہ کرنے
- براہ راست
- سلک
- منظم
- سٹوڈیو
- کامیاب
- اس طرح
- اس بات کا یقین
- سسٹمز
- ٹیبل
- لے لو
- لیا
- لیتا ہے
- لینے
- ٹیم
- ٹیکنالوجی
- ٹرمنل
- ٹیسٹنگ
- متن
- سے
- کہ
- ۔
- کے بارے میں معلومات
- ماخذ
- ریاست
- ان
- ان
- تو
- وہاں.
- یہ
- وہ
- اس
- ان
- تین
- کے ذریعے
- تھرو پٹ
- ٹم
- وقت
- کرنے کے لئے
- کی طرف
- ٹی پی
- ٹریک
- ٹرین
- معاملات
- ٹرننگ
- باری باری
- دو
- قابل نہیں
- کے تحت
- غیر متوقع
- جب تک
- اپ ڈیٹ
- استعمال کی شرائط
- استعمال کیس
- استعمال
- کا استعمال کرتے ہوئے
- استعمال
- استعمال کرتا ہے
- متغیر
- مختلف
- ورژن
- نقطہ نظر
- انتظار
- چاہتے ہیں
- تھا
- دیکھیئے
- راستہ..
- we
- ویب
- ویب خدمات
- تھے
- کیا
- جب
- جس
- پوری
- گے
- ساتھ
- کے اندر
- بغیر
- کام
- کام کا بہاؤ
- فکر مند
- گا
- لپیٹ
- لکھنا
- سال
- تم
- اور
- زیفیرنیٹ