تنظیمی فارم صنعتوں میں ایک بنیادی کاروباری ٹول کے طور پر کام کرتے ہیں — مالیاتی خدمات سے لے کر صحت کی دیکھ بھال اور مزید بہت کچھ۔ مثال کے طور پر، ٹیکس مینجمنٹ انڈسٹری میں ٹیکس فائلنگ فارمز پر غور کریں، جہاں ہر سال نئے فارمز بڑی حد تک ایک جیسی معلومات کے ساتھ سامنے آتے ہیں۔ تمام شعبوں میں AWS صارفین کو اپنی روزمرہ کی کاروباری مشق کے حصے کے طور پر فارمز میں معلومات پر کارروائی اور ذخیرہ کرنے کی ضرورت ہے۔ یہ شکلیں اکثر معلومات کو کسی ایسی تنظیم میں پہنچانے کے لیے ایک بنیادی ذریعہ کے طور پر کام کرتی ہیں جہاں ڈیٹا کیپچر کے تکنیکی ذرائع ناقابل عمل ہوتے ہیں۔
پیشکش کے سالوں میں معلومات حاصل کرنے کے لیے فارم استعمال کرنے کے علاوہ ایمیزون ٹیکسٹ، ہم نے مشاہدہ کیا ہے کہ AWS صارفین اپنی تنظیمی شکلوں کو اکثر ساختی تبدیلیوں، فیلڈز کو شامل یا تبدیل کرنے، یا سال کی تبدیلی یا فارم کے ورژن کی تبدیلی جیسی دیگر باتوں کی بنیاد پر ورژن بناتے ہیں۔
جب کسی فارم کا ڈھانچہ یا مواد تبدیل ہوتا ہے، تو اکثر یہ روایتی OCR سسٹمز کے لیے چیلنجز کا سبب بن سکتا ہے یا معلومات حاصل کرنے کے لیے استعمال ہونے والے ڈاؤن اسٹریم ٹولز کو متاثر کر سکتا ہے، یہاں تک کہ جب آپ کو سال بہ سال اسی معلومات کو حاصل کرنے کی ضرورت ہو اور فارمیٹ سے قطع نظر استعمال کے لیے ڈیٹا کو جمع کرنا پڑے۔ دستاویز کی.
اس مسئلے کو حل کرنے کے لیے، اس پوسٹ میں ہم یہ ظاہر کرتے ہیں کہ آپ Amazon Textract کے ساتھ ایک ایونٹ سے چلنے والی، سرور کے بغیر، ملٹی فارمیٹ کی دستاویز کو پارس کرنے والی پائپ لائن کی تعمیر اور تعیناتی کیسے کر سکتے ہیں۔
حل جائزہ
درج ذیل خاکہ ہمارے حل کے فن تعمیر کی وضاحت کرتا ہے:
سب سے پہلے، حل کا استعمال کرتے ہوئے پائپ لائن کی پیشکش کرتا ہے ایمیزون سادہ اسٹوریج سروس (Amazon S3)، Amazon S3 ایونٹ کی اطلاعات، اور ایک ایمیزون سادہ قطار سروس (Amazon SQS) قطار میں تاکہ پروسیسنگ اس وقت شروع ہو جب کوئی فارم ہدف Amazon S3 پارٹیشن میں اترے۔ پر ایک واقعہ ایمیزون ایونٹ برج بنایا اور ایک کو بھیجا ہے۔ او ڈبلیو ایس لامبڈا۔ ہدف جو ایمیزون ٹیکسٹریکٹ کام کو متحرک کرتا ہے۔
آپ سرور لیس AWS خدمات جیسے لیمبڈا اور استعمال کر سکتے ہیں۔ AWS اسٹیپ فنکشنز گودام، تجزیات، اور AI اور مشین لرننگ (ML) کے لیے AWS AI سروسز اور AWS Analytics اور ڈیٹا بیس سروسز کے درمیان غیر مطابقت پذیر سروس انضمام پیدا کرنے کے لیے۔ اس پوسٹ میں، ہم یہ ظاہر کرتے ہیں کہ Amazon Textract asynchronous APIs کی درخواستوں کی حالت کو غیر مطابقت پذیر طور پر کنٹرول اور برقرار رکھنے کے لیے اسٹیپ فنکشنز کا استعمال کیسے کیا جائے۔ یہ کالز اور جوابات کے انتظام کے لیے ریاستی مشین کا استعمال کرکے حاصل کیا جاتا ہے۔ ہم ریاستی مشین کے اندر لیمبڈا کا استعمال Amazon Textract سے صفحہ بندی API جوابی ڈیٹا کو ایک واحد JSON آبجیکٹ میں ضم کرنے کے لیے کرتے ہیں جس میں OCR کا استعمال کرتے ہوئے نکالا گیا نیم ساختہ ٹیکسٹ ڈیٹا ہوتا ہے۔
اس کے بعد ہم اس OCR ڈیٹا کو ایک عام ڈھانچہ والے فارمیٹ میں جمع کرنے کے لیے معیاری اپروچ کا استعمال کرتے ہوئے مختلف شکلوں میں فلٹر کرتے ہیں۔ ایمیزون ایتینا اور ایک SQL Amazon Textract JSON SerDe.
آپ پروسیسنگ کی حالت کو ٹریک کرنے اور ہر ریاست کے آؤٹ پٹ کو برقرار رکھنے کے لیے سرور لیس اسٹیپ فنکشنز کا استعمال کرتے ہوئے اس پائپ لائن کے ذریعے اٹھائے گئے اقدامات کو ٹریس کر سکتے ہیں۔ یہ وہ چیز ہے جسے کچھ صنعتوں میں صارفین ڈیٹا کے ساتھ کام کرتے وقت کرنے کو ترجیح دیتے ہیں جہاں آپ کو طویل مدتی میں آپ کی پائپ لائن کے نتائج کی وضاحت کو فروغ دینے کے لیے Amazon Textract جیسی سروسز سے تمام پیشین گوئیوں کے نتائج کو برقرار رکھنا چاہیے۔
آخر میں، آپ ایتھینا ٹیبلز میں نکالے گئے ڈیٹا سے استفسار کر سکتے ہیں۔
مندرجہ ذیل حصوں میں، ہم آپ کو پائپ لائن کا استعمال کرتے ہوئے ترتیب دیتے ہیں۔ AWS کلاؤڈ فارمیشنپائپ لائن کی جانچ کرنا، اور فارم کے نئے ورژن شامل کرنا۔ یہ پائپ لائن برقرار رکھنے کے قابل حل فراہم کرتی ہے کیونکہ ہر جزو (انجسٹ، ٹیکسٹ نکالنا، ٹیکسٹ پروسیسنگ) آزاد اور الگ تھلگ ہے۔
CloudFormation اسٹیک کے لیے پہلے سے طے شدہ ان پٹ پیرامیٹرز کی وضاحت کریں۔
CloudFormation اسٹیک کے لیے ان پٹ پیرامیٹرز کی وضاحت کرنے کے لیے، کھولیں۔ default.properties
کے تحت params
فولڈر اور درج ذیل کوڈ درج کریں:
حل تعینات کریں۔
اپنی پائپ لائن کو تعینات کرنے کے لیے، درج ذیل مراحل کو مکمل کریں:
- میں سے انتخاب کریں اسٹیک لانچ کریں۔:
- میں سے انتخاب کریں اگلے.
- اسٹیک کی تفصیلات بتائیں جیسا کہ درج ذیل اسکرین شاٹ میں دکھایا گیا ہے اور منتخب کریں۔ اگلے.
- میں اسٹیک کے اختیارات کو ترتیب دیں۔ سیکشن، اختیاری ٹیگز، اجازتیں، اور دیگر جدید ترتیبات شامل کریں۔
- میں سے انتخاب کریں اگلے.
- اسٹیک کی تفصیلات کا جائزہ لیں اور منتخب کریں۔ میں تسلیم کرتا ہوں کہ AWS CloudFormation حسب ضرورت ناموں کے ساتھ IAM وسائل تخلیق کر سکتی ہے۔.
- میں سے انتخاب کریں اسٹیک بنائیں.
یہ آپ کے AWS اکاؤنٹ میں اسٹیک کی تعیناتی کا آغاز کرتا ہے۔
اسٹیک کے کامیابی کے ساتھ تعینات ہونے کے بعد، پھر آپ پائپ لائن کی جانچ شروع کر سکتے ہیں جیسا کہ اگلے حصے میں بیان کیا گیا ہے۔
پائپ لائن کی جانچ کریں۔
کامیاب تعیناتی کے بعد، اپنی پائپ لائن کو جانچنے کے لیے درج ذیل مراحل کو مکمل کریں:
- ڈاؤن لوڈ، اتارنا نمونے کی فائلیں آپ کے کمپیوٹر پر
- بنائیں ایک
/uploads
فولڈر (تقسیم) نئے بنائے گئے ان پٹ S3 بالٹی کے نیچے۔
- جیسے الگ فولڈرز (پارٹیشنز) بنائیں
jobapplications
کے تحت/uploads
.
- نوکری کی درخواست کا پہلا ورژن نمونہ دستاویزات کے فولڈر سے اپ لوڈ کریں۔
/uploads/jobapplications
تقسیم
جب پائپ لائن مکمل ہو جاتی ہے، تو آپ دستاویز کے اس ورژن کے لیے نکالی گئی کلیدی قدر تلاش کر سکتے ہیں۔ /OuputS3/03-textract-parsed-output/jobapplications
ایمیزون S3 کنسول پر۔
آپ اسے ایتھینا ٹیبل میں بھی تلاش کر سکتے ہیں (applications_data_table
) پر ڈیٹا بیس مینو (jobapplicationsdatabase
).
- نوکری کی درخواست کا دوسرا ورژن نمونہ دستاویزات کے فولڈر سے اپ لوڈ کریں۔
/uploads/jobapplications
تقسیم
جب پائپ لائن مکمل ہو جائے تو، آپ اس ورژن کے لیے نکالی گئی کلیدی قدر تلاش کر سکتے ہیں۔ /OuputS3/03-textract-parsed-output/jobapplications
ایمیزون S3 کنسول پر۔
آپ اسے ایتھینا ٹیبل میں بھی تلاش کر سکتے ہیں (applications_data_table
) پر ڈیٹا بیس مینو (jobapplicationsdatabase
).
آپ نے کر لیا! آپ نے اپنی پائپ لائن کو کامیابی کے ساتھ تعینات کر لیا ہے۔
فارم کے نئے ورژن شامل کریں۔
نئے فارم ورژن کے حل کو اپ ڈیٹ کرنا سیدھا سادہ ہے — ہر فارم ورژن کو صرف پروسیسنگ اسٹیک میں سوالات کی جانچ کرکے اپ ڈیٹ کرنے کی ضرورت ہے۔
اپ ڈیٹس کرنے کے بعد، آپ AWS CloudFormation APIs کا استعمال کرتے ہوئے اپ ڈیٹ شدہ پائپ لائن کو دوبارہ تعینات کر سکتے ہیں اور نئی دستاویزات پر کارروائی کر سکتے ہیں، آپ کے سکیما کے لیے ایک ہی معیاری ڈیٹا پوائنٹس پر پہنچ کر آپ کی پائپ لائن میں تبدیلیاں کرنے کے لیے کم سے کم رکاوٹ اور ترقیاتی کوششوں کی ضرورت ہے۔ یہ لچک، جو تصریف اور نکالنے کے رویے کو الگ کرکے اور Athena میں JSON SerDe فعالیت کا استعمال کرکے حاصل کی جاتی ہے، اس پائپ لائن کو کسی بھی فارم ورژن کے لیے ایک قابل برقرار حل بناتی ہے جس پر آپ کی تنظیم کو معلومات جمع کرنے کے لیے کارروائی کرنے کی ضرورت ہوتی ہے۔
جیسے ہی آپ انجسٹ سلوشن چلاتے ہیں، آنے والے فارموں سے ڈیٹا خود بخود ایتھینا میں جمع ہو جاتا ہے اور ان سے وابستہ فائلوں اور ان پٹ کے بارے میں معلومات کے ساتھ۔ جب آپ کے فارمز میں موجود ڈیٹا غیر ساختہ سے سٹرکچرڈ ڈیٹا میں منتقل ہوتا ہے، تو یہ نیچے کی دھارے والی ایپلی کیشنز جیسے اینالیٹکس، ML ماڈلنگ اور مزید کے لیے استعمال کے لیے تیار ہے۔
صاف کرو
جاری چارجز سے بچنے کے لیے، جب آپ کام کر لیں تو اس حل کے حصے کے طور پر اپنے بنائے گئے وسائل کو حذف کر دیں۔
- Amazon S3 کنسول پر، CloudFormation اسٹیک کے حصے کے طور پر آپ نے بنائی ہوئی بالٹیوں کو دستی طور پر حذف کریں۔
- AWS CloudFormation کنسول پر، منتخب کریں۔ Stacks نیوی گیشن پین میں.
- مین اسٹیک کو منتخب کریں اور منتخب کریں۔ خارج کر دیں.
یہ خود بخود نیسٹڈ اسٹیک کو حذف کر دیتا ہے۔
نتیجہ
اس پوسٹ میں، ہم نے دکھایا کہ کس طرح دستاویز کی پروسیسنگ کو ٹریس کرنے اور اپنی مرضی کے مطابق بنانے کے خواہشمند صارفین Amazon Textract کے ساتھ ایک ایونٹ سے چلنے والی، سرور کے بغیر، ملٹی فارمیٹ کی دستاویز کو پارس کرنے والی پائپ لائن بنا اور تعینات کر سکتے ہیں۔ یہ پائپ لائن ایک قابل برقرار حل فراہم کرتی ہے کیونکہ ہر جزو (انجسٹ، ٹیکسٹ نکالنا، ٹیکسٹ پروسیسنگ) آزاد اور الگ تھلگ ہے، جس سے تنظیموں کو پروسیسنگ کی متنوع ضروریات کو پورا کرنے کے لیے اپنے حل کو فعال کرنے کی اجازت ملتی ہے۔
آج ہی حل آزمائیں اور کمنٹس سیکشن میں اپنی رائے دیں۔
مصنفین کے بارے میں
ایملی سوورڈ AWS پروفیشنل سروسز کے ساتھ ڈیٹا سائنٹسٹ ہے۔ اس نے قدرتی زبان پروسیسنگ (NLP) پر زور دینے کے ساتھ اسکاٹ لینڈ، برطانیہ میں یونیورسٹی آف ایڈنبرا سے مصنوعی ذہانت میں امتیاز کے ساتھ ماسٹر آف سائنس کی ڈگری حاصل کی ہے۔ ایملی نے قابل اطلاق سائنسی اور انجینئرنگ کرداروں میں خدمات انجام دی ہیں جن پر توجہ مرکوز کی گئی AI سے چلنے والی مصنوعات کی تحقیق اور ترقی، آپریشنل عمدگی، اور عوامی اور نجی شعبے میں تنظیموں پر چلنے والے AI کام کے بوجھ کے لیے گورننس۔ وہ AWS سینئر اسپیکر کے طور پر اور حال ہی میں AWS Well-Architected in the Machine Learning Lens کے مصنف کے طور پر صارفین کی رہنمائی میں اپنا حصہ ڈالتی ہے۔
سندیپ سنگھ۔ AWS پروفیشنل سروسز کے ساتھ ڈیٹا سائنٹسٹ ہے۔ انہوں نے سان ڈیاگو اسٹیٹ یونیورسٹی (SDSU)، کیلیفورنیا سے AI اور ڈیٹا سائنس میں ارتکاز کے ساتھ انفارمیشن سسٹمز میں ماسٹر آف سائنس کی ڈگری حاصل کی۔ وہ کمپیوٹر سائنس کے مضبوط پس منظر کے ساتھ ایک مکمل اسٹیک ڈیٹا سائنٹسٹ اور AI سسٹمز اور کنٹرول ڈیزائن میں مہارت کے ساتھ قابل اعتماد مشیر ہیں۔ وہ صارفین کو ان کے اعلیٰ اثر والے پروجیکٹس کو صحیح سمت میں لے جانے میں مدد کرنے، ان کے کلاؤڈ سفر میں مشورہ دینے اور رہنمائی کرنے، اور جدید ترین AI/ML فعال حل تیار کرنے کے بارے میں پرجوش ہے۔
- "
- 100
- ہمارے بارے میں
- اکاؤنٹ
- حاصل کیا
- کے پار
- پتہ
- اعلی درجے کی
- AI
- AI خدمات
- تمام
- اجازت دے رہا ہے
- ایمیزون
- تجزیاتی
- اے پی آئی
- APIs
- درخواست
- ایپلی کیشنز
- نقطہ نظر
- فن تعمیر
- مصنوعی
- مصنوعی ذہانت
- AWS
- پس منظر
- سرحد
- تعمیر
- عمارت
- کاروبار
- کیلی فورنیا
- کیونکہ
- چیلنجوں
- تبدیل
- بوجھ
- بادل
- کوڈ
- تبصروں
- کامن
- جزو
- کمپیوٹر سائنس
- دھیان
- کنسول
- مواد
- کنٹرول
- گاہکوں
- اعداد و شمار
- ڈیٹا سائنس
- ڈیٹا سائنسدان
- ڈیٹا بیس
- demonstrated,en
- تعیناتی
- تعیناتی
- ڈیزائن
- ترقی
- مختلف
- خلل
- دستاویزات
- انجنیئرنگ
- واقعہ
- مثال کے طور پر
- آراء
- قطعات
- مالی
- مالیاتی خدمات
- پہلا
- لچک
- بہاؤ
- توجہ مرکوز
- کے بعد
- فارم
- فارمیٹ
- فارم
- مکمل
- فعالیت
- گورننس
- صحت کی دیکھ بھال
- ہائی
- کی ڈگری حاصل کی
- کس طرح
- کیسے
- HTTPS
- اثر
- صنعتوں
- صنعت
- معلومات
- انضمام
- انٹیلی جنس
- IT
- ایوب
- بادشاہت
- زبان
- سیکھنے
- چھوڑ دو
- لانگ
- مشین
- مشین لرننگ
- برقرار رکھنے کے
- انتظام
- مینیجنگ
- دستی طور پر
- ML
- قدرتی
- سمت شناسی
- تعداد
- کی پیشکش
- تجویز
- کھول
- تنظیم
- تنظیمی
- تنظیمیں
- دیگر
- پریکٹس
- پیشن گوئی
- پرائمری
- نجی
- مسئلہ
- عمل
- مصنوعات
- پیشہ ورانہ
- منصوبوں
- فراہم کرتا ہے
- عوامی
- تحقیق
- تحقیق اور ترقی
- وسائل
- جواب
- نتائج کی نمائش
- رن
- چل رہا ہے
- سان
- سائنس
- سائنسدان
- شعبے
- سیکٹر
- کی تلاش
- بے سرور
- سروس
- سروسز
- مقرر
- قائم کرنے
- سادہ
- So
- حل
- حل
- حل
- کچھ
- اسپیکر
- ڈھیر لگانا
- شروع کریں
- حالت
- ریاستی آرٹ
- ذخیرہ
- ذخیرہ
- مضبوط
- کامیاب
- کامیابی کے ساتھ
- سسٹمز
- ہدف
- ٹیکس
- ٹیسٹ
- ٹیسٹنگ
- کے ذریعے
- آج
- کے آلے
- اوزار
- ٹریک
- روایتی
- متحدہ
- متحدہ سلطنت یونائیٹڈ کنگڈم
- یونیورسٹی
- تازہ ترین معلومات
- استعمال کی شرائط
- قیمت
- کے اندر
- کام کر
- سال
- سال