آج کے معلوماتی دور میں، بے شمار دستاویزات میں موجود ڈیٹا کی وسیع مقدار کاروبار کے لیے ایک چیلنج اور ایک موقع دونوں پیش کرتی ہے۔ روایتی دستاویز پراسیسنگ کے طریقے اکثر کارکردگی اور درستگی میں کم ہوتے ہیں، جس سے جدت، لاگت کی کارکردگی، اور اصلاح کی گنجائش باقی رہ جاتی ہے۔ انٹیلجنٹ ڈاکومنٹ پروسیسنگ (IDP) کی آمد کے ساتھ دستاویزی پروسیسنگ میں نمایاں پیش رفت ہوئی ہے۔ IDP کے ساتھ، کاروبار مختلف دستاویزات کی اقسام سے غیر ساختہ ڈیٹا کو ساختی، قابل عمل بصیرت میں تبدیل کر سکتے ہیں، ڈرامائی طور پر کارکردگی کو بڑھا سکتے ہیں اور دستی کوششوں کو کم کر سکتے ہیں۔ تاہم، صلاحیت وہیں ختم نہیں ہوتی۔ تخلیقی مصنوعی ذہانت (AI) کو اس عمل میں ضم کرکے، ہم IDP کی صلاحیتوں کو مزید بڑھا سکتے ہیں۔ جنریٹو اے آئی نہ صرف دستاویز کی پروسیسنگ میں بہتر صلاحیتوں کو متعارف کراتا ہے، بلکہ یہ ڈیٹا کے پیٹرن کو تبدیل کرنے کے لیے متحرک موافقت بھی متعارف کراتا ہے۔ یہ پوسٹ آپ کو IDP اور جنریٹیو AI کی ہم آہنگی کے ذریعے لے جاتی ہے، اس بات کی نقاب کشائی کرتی ہے کہ وہ دستاویز کی کارروائی میں اگلے محاذ کی نمائندگی کیسے کرتے ہیں۔
ہم IDP پر تفصیل سے اپنی سیریز میں AWS AI خدمات کے ساتھ انٹیلیجنٹ دستاویز پروسیسنگ (حصہ 1 اور حصہ 2)۔ اس پوسٹ میں، ہم بحث کرتے ہیں کہ بڑے لینگویج ماڈلز (LLMs) کے ساتھ نئے یا موجودہ IDP فن تعمیر کو کیسے بڑھایا جائے۔ مزید خاص طور پر، ہم بحث کرتے ہیں کہ ہم کس طرح ضم کر سکتے ہیں۔ ایمیزون ٹیکسٹ ساتھ لینگ چین بطور دستاویز لوڈر اور ایمیزون بیڈرک مختلف IDP مراحل میں دستاویزات سے ڈیٹا نکالنے اور تخلیقی AI صلاحیتوں کو استعمال کرنے کے لیے۔
Amazon Textract ایک مشین لرننگ (ML) سروس ہے جو خودکار طور پر سکین شدہ دستاویزات سے ٹیکسٹ، ہینڈ رائٹنگ اور ڈیٹا نکالتی ہے۔ Amazon Bedrock ایک مکمل طور پر منظم سروس ہے جو استعمال میں آسان APIs کے ذریعے اعلیٰ کارکردگی کا مظاہرہ کرنے والے فاؤنڈیشن ماڈلز (FMs) کا انتخاب پیش کرتی ہے۔
مندرجہ ذیل خاکہ ایک اعلیٰ سطحی ریفرنس آرکیٹیکچر ہے جو بتاتا ہے کہ آپ فاؤنڈیشن ماڈلز کے ساتھ IDP ورک فلو کو مزید کیسے بڑھا سکتے ہیں۔ استعمال کے کیس اور مطلوبہ نتائج کے لحاظ سے آپ IDP کے ایک یا تمام مراحل میں LLM استعمال کر سکتے ہیں۔
مندرجہ ذیل حصوں میں، ہم اس بات کی گہرائی میں غوطہ لگاتے ہیں کہ ان مخصوص کاموں میں سے ہر ایک کے لیے دستاویزات پر کارروائی کرنے کے لیے LangChain کا استعمال کرتے ہوئے Amazon Textract کو کس طرح تخلیقی AI ورک فلو میں ضم کیا جاتا ہے۔ یہاں فراہم کردہ کوڈ بلاکس کو اختصار کے لیے تراش دیا گیا ہے۔ ہماری طرف رجوع کریں۔ GitHub ذخیرہ تفصیلی Python نوٹ بک اور قدم بہ قدم واک تھرو کے لیے۔
جب LLMs کے ساتھ دستاویزات پر کارروائی کی بات آتی ہے تو دستاویزات سے متن نکالنا ایک اہم پہلو ہے۔ آپ دستاویزات سے غیر ساختہ خام متن نکالنے کے لیے Amazon Textract کا استعمال کر سکتے ہیں اور دستاویز میں موجود کلیدی قدر کے جوڑے اور میزیں جیسی اصلی نیم ساختہ یا ساختی اشیاء کو محفوظ کر سکتے ہیں۔ صحت کی دیکھ بھال اور انشورنس کے دعوے یا رہن جیسے دستاویزی پیکج پیچیدہ شکلوں پر مشتمل ہوتے ہیں جن میں ساختی، نیم ساختہ، اور غیر ساختہ فارمیٹس میں بہت ساری معلومات ہوتی ہیں۔ دستاویز نکالنا یہاں ایک اہم قدم ہے کیونکہ ایل ایل ایم زیادہ درست اور متعلقہ ردعمل پیدا کرنے کے لیے بھرپور مواد سے فائدہ اٹھاتے ہیں، جو بصورت دیگر ایل ایل ایم کے آؤٹ پٹ کے معیار کو متاثر کر سکتے ہیں۔
LangChain LLMs کے ساتھ انضمام کے لیے ایک طاقتور اوپن سورس فریم ورک ہے۔ عام طور پر LLMs ورسٹائل ہوتے ہیں لیکن ڈومین سے متعلق مخصوص کاموں کے ساتھ جدوجہد کر سکتے ہیں جہاں گہرے سیاق و سباق اور باریک ردعمل کی ضرورت ہوتی ہے۔ LangChain ایسے حالات میں ڈویلپرز کو ایسے ایجنٹوں کی تعمیر کے لیے بااختیار بناتا ہے جو پیچیدہ کاموں کو چھوٹے ذیلی کاموں میں توڑ سکتے ہیں۔ ذیلی کام اس کے بعد ایل ایل ایم پرامپٹس کو جوڑ کر اور زنجیر بنا کر سیاق و سباق اور میموری کو ایل ایل ایم میں متعارف کرا سکتے ہیں۔
LangChain پیشکش کرتا ہے۔ دستاویز لوڈرز جو دستاویزات سے ڈیٹا کو لوڈ اور تبدیل کر سکتا ہے۔ آپ انہیں دستاویزات کو ترجیحی فارمیٹس میں ڈھانچے کے لیے استعمال کر سکتے ہیں جن پر LLMs کے ذریعے کارروائی کی جا سکتی ہے۔ دی AmazonTextractPDFLloader ایک سروس لوڈر قسم کا دستاویز لوڈر ہے جو LangChain کے ساتھ مل کر Amazon Textract کا استعمال کرکے دستاویز کی پروسیسنگ کو خودکار کرنے کا فوری طریقہ فراہم کرتا ہے۔ پر مزید تفصیلات کے لیے AmazonTextractPDFLoader
، حوالہ دیتے ہیں لینگ چین دستاویزات Amazon Textract دستاویز لوڈر کو استعمال کرنے کے لیے، آپ اسے LangChain لائبریری سے درآمد کرکے شروع کرتے ہیں:
from langchain.document_loaders import AmazonTextractPDFLoader
https_loader = AmazonTextractPDFLoader("https://sample-website.com/sample-doc.pdf")
https_document = https_loader.load() s3_loader = AmazonTextractPDFLoader("s3://sample-bucket/sample-doc.pdf")
s3_document = s3_loader.load()
آپ Amazon S3 میں بھی دستاویزات کو اسٹور کر سکتے ہیں اور s3:// URL پیٹرن کا استعمال کرتے ہوئے ان کا حوالہ دے سکتے ہیں، جیسا کہ اس میں وضاحت کی گئی ہے۔ S3// کا استعمال کرتے ہوئے بالٹی تک رسائی، اور اس S3 راستے کو Amazon Textract PDF لوڈر تک منتقل کریں:
import boto3
textract_client = boto3.client('textract', region_name='us-east-2') file_path = "s3://amazon-textract-public-content/langchain/layout-parser-paper.pdf"
loader = AmazonTextractPDFLoader(file_path, client=textract_client)
documents = loader.load()
ایک کثیر صفحاتی دستاویز میں متن کے متعدد صفحات ہوں گے، جس تک دستاویزات آبجیکٹ کے ذریعے رسائی حاصل کی جاسکتی ہے، جو کہ صفحات کی فہرست ہے۔ مندرجہ ذیل کوڈ دستاویزات آبجیکٹ میں صفحات کے ذریعے لوپ کرتا ہے اور دستاویز کے متن کو پرنٹ کرتا ہے، جو اس کے ذریعے دستیاب ہے۔ page_content
وصف:
print(len(documents)) for document in documents: print(document.page_content)
Amazon Comprehend اور LLMs کو دستاویز کی درجہ بندی کے لیے مؤثر طریقے سے استعمال کیا جا سکتا ہے۔ Amazon Comprehend ایک قدرتی لینگویج پروسیسنگ (NLP) سروس ہے جو متن سے بصیرت نکالنے کے لیے ML کا استعمال کرتی ہے۔ Amazon Comprehend پی ڈی ایف، ورڈ، اور تصویری فارمیٹس جیسی دستاویزات پر لے آؤٹ آگاہی کے ساتھ حسب ضرورت درجہ بندی ماڈل ٹریننگ کی بھی حمایت کرتا ہے۔ Amazon Comprehend دستاویز کی درجہ بندی کے استعمال کے بارے میں مزید معلومات کے لیے، رجوع کریں۔ Amazon Comprehend دستاویز کا درجہ بندی اعلیٰ درستگی کے لیے لے آؤٹ سپورٹ کا اضافہ کرتا ہے۔.
جب LLMs کے ساتھ جوڑا بنایا جاتا ہے تو، دستاویزات کی درجہ بندی بڑی مقدار میں دستاویزات کے انتظام کے لیے ایک طاقتور طریقہ بن جاتی ہے۔ LLMs دستاویز کی درجہ بندی میں مددگار ہیں کیونکہ وہ قدرتی زبان کی تفہیم کا استعمال کرتے ہوئے دستاویز میں متن، نمونوں، اور متعلقہ عناصر کا تجزیہ کر سکتے ہیں۔ آپ انہیں مخصوص دستاویز کی کلاسوں کے لیے بھی ٹھیک کر سکتے ہیں۔ جب IDP پائپ لائن میں متعارف کرائی گئی ایک نئی دستاویز کی قسم کو درجہ بندی کی ضرورت ہوتی ہے، تو LLM متن پر کارروائی کر سکتا ہے اور کلاسوں کے ایک سیٹ سے دستاویز کی درجہ بندی کر سکتا ہے۔ درج ذیل ایک نمونہ کوڈ ہے جو دستاویز سے متن نکالنے اور دستاویز کی درجہ بندی کے لیے استعمال کرنے کے لیے Amazon Textract کے ذریعے چلنے والے LangChain دستاویز لوڈر کا استعمال کرتا ہے۔ ہم استعمال کرتے ہیں انتھروپک کلاڈ v2 درجہ بندی کو انجام دینے کے لیے ایمیزون بیڈرک کے ذریعے ماڈل۔
مندرجہ ذیل مثال میں، ہم سب سے پہلے مریض کے ڈسچارج رپورٹ سے متن نکالتے ہیں اور اس کی درجہ بندی کرنے کے لیے LLM کا استعمال کرتے ہیں جس میں تین مختلف دستاویز کی اقسام کی فہرست دی گئی ہے۔DISCHARGE_SUMMARY
, RECEIPT
، اور PRESCRIPTION
. درج ذیل اسکرین شاٹ ہماری رپورٹ کو ظاہر کرتا ہے۔
from langchain.document_loaders import AmazonTextractPDFLoader
from langchain.llms import Bedrock
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain loader = AmazonTextractPDFLoader("./samples/document.png")
document = loader.load() template = """ Given a list of classes, classify the document into one of these classes. Skip any preamble text and just give the class name. <classes>DISCHARGE_SUMMARY, RECEIPT, PRESCRIPTION</classes>
<document>{doc_text}<document>
<classification>""" prompt = PromptTemplate(template=template, input_variables=["doc_text"])
bedrock_llm = Bedrock(client=bedrock, model_id="anthropic.claude-v2") llm_chain = LLMChain(prompt=prompt, llm=bedrock_llm)
class_name = llm_chain.run(document[0].page_content) print(f"The provided document is = {class_name}")
خلاصہ میں کسی دیے گئے متن یا دستاویز کو اس کی اہم معلومات کو برقرار رکھتے ہوئے اسے مختصر ورژن میں گاڑھا کرنا شامل ہے۔ یہ تکنیک موثر معلومات کی بازیافت کے لیے فائدہ مند ہے، جو صارفین کو مکمل مواد کو پڑھے بغیر کسی دستاویز کے اہم نکات کو تیزی سے سمجھنے کے قابل بناتی ہے۔ اگرچہ Amazon Textract براہ راست متن کا خلاصہ نہیں کرتا، لیکن یہ دستاویزات سے پورے متن کو نکالنے کی بنیادی صلاحیتیں فراہم کرتا ہے۔ یہ نکالا ہوا متن متن کے خلاصے کے کاموں کو انجام دینے کے لیے ہمارے LLM ماڈل میں ایک ان پٹ کے طور پر کام کرتا ہے۔
ایک ہی نمونہ خارج ہونے والی رپورٹ کا استعمال کرتے ہوئے، ہم استعمال کرتے ہیں AmazonTextractPDFLoader
اس دستاویز سے متن نکالنے کے لیے۔ پہلے کی طرح، ہم Claude v2 ماڈل کو Amazon Bedrock کے ذریعے استعمال کرتے ہیں اور اسے ایک پرامپٹ کے ساتھ شروع کرتے ہیں جس میں متن کے ساتھ کیا کرنا ہے اس بارے میں ہدایات موجود ہیں (اس صورت میں، خلاصہ)۔ آخر میں، ہم دستاویز لوڈر سے نکالے گئے متن کو پاس کرکے ایل ایل ایم چین چلاتے ہیں۔ یہ LLM پر اس پرامپٹ کے ساتھ ایک انفرنس ایکشن چلاتا ہے جس میں خلاصہ کرنے کی ہدایات، اور دستاویز کے متن کو نشان زد کیا گیا ہے Document
. درج ذیل کوڈ دیکھیں:
کوڈ مریض کے ڈسچارج سمری رپورٹ کا خلاصہ تیار کرتا ہے:
پچھلی مثال نے خلاصہ انجام دینے کے لیے ایک صفحے کی دستاویز کا استعمال کیا ہے۔ تاہم، آپ ممکنہ طور پر متعدد صفحات پر مشتمل دستاویزات سے نمٹیں گے جن کے خلاصے کی ضرورت ہے۔ ایک سے زیادہ صفحات پر خلاصہ کرنے کا ایک عام طریقہ یہ ہے کہ پہلے متن کے چھوٹے ٹکڑوں پر خلاصے بنائیں اور پھر دستاویز کا حتمی خلاصہ حاصل کرنے کے لیے چھوٹے خلاصوں کو جوڑیں۔ نوٹ کریں کہ اس طریقہ کار کے لیے LLM کو متعدد کالز کی ضرورت ہے۔ اس کے لیے منطق آسانی سے تیار کی جا سکتی ہے۔ تاہم، LangChain ایک بلٹ ان سمرائز چین فراہم کرتا ہے جو بڑے متن کا خلاصہ کر سکتا ہے (کثیر صفحات پر مشتمل دستاویزات سے)۔ خلاصہ یا تو کے ذریعے ہو سکتا ہے map_reduce
یا کے ساتھ stuff
اختیارات، جو LLM کو متعدد کالوں کا انتظام کرنے کے اختیارات کے طور پر دستیاب ہیں۔ مندرجہ ذیل مثال میں، ہم استعمال کرتے ہیں map_reduce
ایک کثیر صفحاتی دستاویز کا خلاصہ کرنے کے لیے۔ مندرجہ ذیل تصویر ہمارے ورک فلو کو واضح کرتی ہے۔
آئیے سب سے پہلے دستاویز کو نکال کر شروع کریں اور فی صفحہ کل ٹوکن گنتی اور صفحات کی کل تعداد دیکھیں:
اگلا، ہم LangChain کا بلٹ ان استعمال کرتے ہیں۔ load_summarize_chain
پوری دستاویز کا خلاصہ کرنے کے لیے:
from langchain.chains.summarize import load_summarize_chain summary_chain = load_summarize_chain(llm=bedrock_llm, chain_type='map_reduce')
output = summary_chain.run(document)
print(output.strip())
معیاری کاری اور سوال و جواب
اس سیکشن میں، ہم معیار سازی اور سوال و جواب کے کاموں پر تبادلہ خیال کرتے ہیں۔
معیاری کاری
آؤٹ پٹ سٹینڈرڈائزیشن ایک ٹیکسٹ جنریشن کا کام ہے جہاں LLMs کو آؤٹ پٹ ٹیکسٹ کی مستقل فارمیٹنگ فراہم کرنے کے لیے استعمال کیا جاتا ہے۔ یہ کام خاص طور پر کلیدی ہستی نکالنے کے آٹومیشن کے لیے مفید ہے جس کے لیے آؤٹ پٹ کو مطلوبہ فارمیٹس کے ساتھ منسلک کرنے کی ضرورت ہوتی ہے۔ مثال کے طور پر، ہم تاریخوں کو MM/DD/YYYY فارمیٹ میں فارمیٹ کرنے کے لیے LLM کو ٹھیک کرنے کے لیے فوری انجینئرنگ کے بہترین طریقوں کی پیروی کر سکتے ہیں، جو ڈیٹا بیس کے DATE کالم کے ساتھ ہم آہنگ ہو سکتی ہے۔ مندرجہ ذیل کوڈ بلاک ایک مثال دکھاتا ہے کہ ایل ایل ایم اور پرامپٹ انجینئرنگ کا استعمال کرتے ہوئے یہ کیسے کیا جاتا ہے۔ نہ صرف ہم تاریخ کی قدروں کے لیے آؤٹ پٹ فارمیٹ کو معیاری بناتے ہیں، بلکہ ہم ماڈل کو JSON فارمیٹ میں حتمی آؤٹ پٹ بنانے کے لیے بھی کہتے ہیں تاکہ یہ ہماری ڈاؤن اسٹریم ایپلی کیشنز میں آسانی سے قابل استعمال ہو۔ ہم استعمال کرتے ہیں LangChain اظہار کی زبان (LCEL) دو اعمال کو ایک ساتھ جوڑنا۔ پہلی کارروائی LLM کو دستاویز سے صرف تاریخوں کا JSON فارمیٹ آؤٹ پٹ تیار کرنے کا اشارہ کرتی ہے۔ دوسری کارروائی JSON آؤٹ پٹ لیتی ہے اور تاریخ کی شکل کو معیاری بناتی ہے۔ نوٹ کریں کہ یہ دو قدمی کارروائی ایک ہی قدم میں مناسب پرامپٹ انجینئرنگ کے ساتھ بھی کی جا سکتی ہے، جیسا کہ ہم نارملائزیشن اور ٹیمپلیٹنگ میں دیکھیں گے۔
پچھلے کوڈ کے نمونے کا آؤٹ پٹ JSON ڈھانچہ ہے جس کی تاریخیں 07/09/2020 اور 08/09/2020 ہیں، جو DD/MM/YYYY کی شکل میں ہیں اور مریض کے ہسپتال سے داخل ہونے اور خارج ہونے کی تاریخ ہیں، بالترتیب، مطابق ڈسچارج سمری رپورٹ کے لیے۔
دوبارہ حاصل کرنے والی اگمینٹڈ جنریشن کے ساتھ سوال و جواب
LLMs حقائق پر مبنی معلومات کو برقرار رکھنے کے لیے جانا جاتا ہے، جسے اکثر ان کا عالمی علم یا عالمی نظریہ کہا جاتا ہے۔ جب ٹھیک بنایا جائے تو وہ جدید ترین نتائج پیدا کر سکتے ہیں۔ تاہم، اس میں رکاوٹیں ہیں کہ ایک LLM اس علم تک کس حد تک مؤثر طریقے سے رسائی اور ہیرا پھیری کر سکتا ہے۔ نتیجے کے طور پر، ایسے کاموں میں جو خاص علم پر بہت زیادہ انحصار کرتے ہیں، ان کی کارکردگی کچھ استعمال کے معاملات کے لیے بہترین نہیں ہو سکتی۔ مثال کے طور پر، سوال و جواب کے منظرناموں میں، ماڈل کے لیے یہ ضروری ہے کہ وہ دستاویز میں فراہم کردہ سیاق و سباق پر مکمل طور پر اپنے عالمی علم پر انحصار کیے بغیر سختی سے عمل کرے۔ اس سے انحراف غلط بیانی، غلطیاں، یا یہاں تک کہ غلط جوابات کا باعث بن سکتا ہے۔ اس مسئلے کو حل کرنے کے لیے سب سے زیادہ استعمال ہونے والا طریقہ کے طور پر جانا جاتا ہے۔ بازیافت اگمینٹڈ جنریشن (RAG)۔ یہ نقطہ نظر بازیافت کے ماڈلز اور زبان کے ماڈلز دونوں کی طاقتوں کو ہم آہنگ کرتا ہے، پیدا ہونے والے ردعمل کی درستگی اور معیار کو بڑھاتا ہے۔
ایل ایل ایم اپنی میموری کی رکاوٹوں اور ان کے چلنے والے ہارڈ ویئر کی حدود کی وجہ سے ٹوکن کی حدود بھی لگا سکتے ہیں۔ اس مسئلے سے نمٹنے کے لیے، چنکنگ جیسی تکنیکوں کا استعمال بڑی دستاویزات کو چھوٹے حصوں میں تقسیم کرنے کے لیے کیا جاتا ہے جو LLMs کی ٹوکن حدود میں فٹ ہوتے ہیں۔ دوسری طرف، این ایل پی میں ایمبیڈنگز کا استعمال بنیادی طور پر الفاظ کے معنوی معنی اور دوسرے الفاظ کے ساتھ ان کے تعلقات کو ایک اعلیٰ جہتی جگہ میں حاصل کرنے کے لیے کیا جاتا ہے۔ یہ سرایت الفاظ کو ویکٹر میں تبدیل کرتے ہیں، جس سے ماڈلز کو متنی ڈیٹا کو مؤثر طریقے سے پروسیس کرنے اور سمجھنے کی اجازت ملتی ہے۔ الفاظ اور فقروں کے درمیان معنوی باریکیوں کو سمجھ کر، ایمبیڈنگز LLMs کو مربوط اور سیاق و سباق سے متعلقہ نتائج پیدا کرنے کے قابل بناتی ہیں۔ درج ذیل کلیدی اصطلاحات کو نوٹ کریں:
- Chunking - یہ عمل دستاویزات سے متن کی بڑی مقدار کو متن کے چھوٹے، معنی خیز حصوں میں تقسیم کرتا ہے۔
- سرایت - یہ ہر ایک حصے کی فکسڈ ڈائمینشنل ویکٹر ٹرانسفارمیشنز ہیں جو ٹکڑوں سے معنوی معلومات کو برقرار رکھتی ہیں۔ یہ سرایت بعد میں ایک ویکٹر ڈیٹا بیس میں لوڈ کی جاتی ہیں۔
- ویکٹر ڈیٹا بیس - یہ الفاظ کی سرایت یا ویکٹر کا ڈیٹا بیس ہے جو الفاظ کے سیاق و سباق کی نمائندگی کرتا ہے۔ یہ ایک علمی ذریعہ کے طور پر کام کرتا ہے جو NLP کے کاموں کو دستاویز کی پروسیسنگ پائپ لائنوں میں مدد کرتا ہے۔ یہاں ویکٹر ڈیٹا بیس کا فائدہ یہ ہے کہ یہ متن کی تخلیق کے دوران ایل ایل ایم کو صرف ضروری سیاق و سباق فراہم کرنے کی اجازت دیتا ہے، جیسا کہ ہم مندرجہ ذیل حصے میں بیان کرتے ہیں۔
RAG بازیافت کے مرحلے کے دوران متعلقہ دستاویز کے حصوں کو سمجھنے اور بازیافت کرنے کے لیے سرایت کرنے کی طاقت کا استعمال کرتا ہے۔ ایسا کرنے سے، RAG LLMs کی نشانی حدود کے اندر کام کر سکتا ہے، اس بات کو یقینی بناتا ہے کہ نسل کے لیے انتہائی مناسب معلومات کا انتخاب کیا گیا ہے، جس کے نتیجے میں زیادہ درست اور سیاق و سباق سے متعلقہ نتائج برآمد ہوتے ہیں۔
مندرجہ ذیل خاکہ LLMs میں ان پٹ کو تیار کرنے کے لیے ان تکنیکوں کے انضمام کی وضاحت کرتا ہے، ان کی سیاق و سباق کی تفہیم کو بڑھاتا ہے اور سیاق و سباق میں مزید متعلقہ جوابات کو فعال کرتا ہے۔ ایک نقطہ نظر میں مماثلت کی تلاش شامل ہے، ویکٹر ڈیٹا بیس اور چنکنگ دونوں کا استعمال۔ ویکٹر ڈیٹا بیس لفظی معلومات کی نمائندگی کرنے والے ایمبیڈنگز کو اسٹور کرتا ہے، اور چنکنگ متن کو قابل انتظام حصوں میں تقسیم کرتا ہے۔ مماثلت کی تلاش سے اس سیاق و سباق کو استعمال کرتے ہوئے، LLMs سوالوں کے جوابات اور ڈومین کے لیے مخصوص آپریشن جیسے درجہ بندی اور افزودگی جیسے کام چلا سکتے ہیں۔
اس پوسٹ کے لیے، ہم دستاویزات کے ساتھ سیاق و سباق کے سوال و جواب کو انجام دینے کے لیے RAG پر مبنی طریقہ استعمال کرتے ہیں۔ درج ذیل کوڈ کے نمونے میں، ہم دستاویز سے متن نکالتے ہیں اور پھر دستاویز کو متن کے چھوٹے حصوں میں تقسیم کرتے ہیں۔ چنکنگ کی ضرورت ہے کیونکہ ہمارے پاس کثیر صفحات پر مشتمل بڑی دستاویزات ہو سکتی ہیں اور ہمارے LLM میں ٹوکن کی حد ہو سکتی ہے۔ یہ ٹکڑوں کو بعد کے مراحل میں مماثلت کی تلاش کے لیے ویکٹر ڈیٹا بیس میں لوڈ کیا جاتا ہے۔ مندرجہ ذیل مثال میں، ہم Amazon Titan Embed Text v1 ماڈل استعمال کرتے ہیں، جو دستاویز کے ٹکڑوں کی ویکٹر ایمبیڈنگ کرتا ہے:
کوڈ متن کے ٹکڑوں کا استعمال کرتے ہوئے LLM کے لیے ایک متعلقہ سیاق و سباق بناتا ہے جو ویکٹر ڈیٹا بیس سے مماثلت کی تلاش کی کارروائی کے ذریعے واپس کیے جاتے ہیں۔ اس مثال کے لیے، ہم ایک اوپن سورس استعمال کرتے ہیں۔ FAISS ویکٹر اسٹور متن کے ہر حصے کے ویکٹر ایمبیڈنگز کو ذخیرہ کرنے کے لیے بطور نمونہ ویکٹر ڈیٹا بیس۔ اس کے بعد ہم ویکٹر ڈیٹا بیس کی تعریف a LangChain بازیافت کرنے والا، جو میں منتقل کیا جاتا ہے۔ RetrievalQA
زنجیر یہ اندرونی طور پر ویکٹر ڈیٹا بیس پر ایک مماثلت کی تلاش کا استفسار چلاتا ہے جو سوال سے متعلقہ متن کے سب سے اوپر n (جہاں n=3 ہماری مثال میں) واپس کرتا ہے۔ آخر میں، LLM سلسلہ متعلقہ سیاق و سباق (متعلقہ حصوں کا ایک گروپ) اور LLM کے جواب کے لیے سوال کے ساتھ چلایا جاتا ہے۔ RAG کے ساتھ سوال و جواب کے قدم بہ قدم کوڈ واک تھرو کے لیے، پر Python نوٹ بک دیکھیں GitHub کے.
FAISS کے متبادل کے طور پر، آپ بھی استعمال کر سکتے ہیں۔ ایمیزون اوپن سرچ سروس ویکٹر ڈیٹا بیس کی صلاحیتیں۔, Amazon Relational Database Service (Amazon RDS) PostgreSQL کے لیے کے ساتھ pgvector ویکٹر ڈیٹا بیس، یا اوپن سورس کروما ڈیٹا بیس کے بطور توسیع۔
ٹیبلر ڈیٹا کے ساتھ سوال و جواب
دستاویزات کے اندر ٹیبلر ڈیٹا LLMs کے لیے اس کی ساختی پیچیدگی کی وجہ سے پراسیس کرنا مشکل ہو سکتا ہے۔ Amazon Textract کو LLMs کے ساتھ بڑھایا جا سکتا ہے کیونکہ یہ صفحہ، ٹیبل، اور سیلز جیسے عناصر کے نیسٹڈ فارمیٹ میں دستاویزات سے ٹیبل نکالنے کے قابل بناتا ہے۔ ٹیبلر ڈیٹا کے ساتھ سوال و جواب کرنا ایک کثیر مرحلہ عمل ہے، اور اس کے ذریعے حاصل کیا جا سکتا ہے۔ خود سے پوچھ گچھ. مندرجہ ذیل اقدامات کا ایک جائزہ ہے:
- Amazon Textract کا استعمال کرتے ہوئے دستاویزات سے ٹیبل نکالیں۔ Amazon Textract کے ساتھ، ٹیبلر ڈھانچہ (قطاریں، کالم، ہیڈر) کسی دستاویز سے نکالا جا سکتا ہے۔
- ٹیبلر ڈیٹا کو ویکٹر ڈیٹا بیس میں میٹا ڈیٹا کی معلومات کے ساتھ اسٹور کریں، جیسے ہیڈر کے نام اور ہر ہیڈر کی تفصیل۔
- ٹیبل سے ڈیٹا اخذ کرنے کے لیے، LLM کا استعمال کرتے ہوئے، ایک سٹرکچرڈ استفسار بنانے کے لیے پرامپٹ کا استعمال کریں۔
- ویکٹر ڈیٹا بیس سے متعلقہ ٹیبل ڈیٹا نکالنے کے لیے استفسار کا استعمال کریں۔
مثال کے طور پر، ایک بینک اسٹیٹمنٹ میں، "$1000 سے زیادہ ڈپازٹس والے لین دین کیا ہیں" کے پرامپٹ کو دیکھتے ہوئے، LLM مندرجہ ذیل مراحل کو مکمل کرے گا:
- ایک سوال تیار کریں، جیسے
“Query: transactions” , “filter: greater than (Deposit$)”
. - استفسار کو ایک منظم استفسار میں تبدیل کریں۔
- ساختی استفسار کو ویکٹر ڈیٹا بیس پر لاگو کریں جہاں ہمارا ٹیبل ڈیٹا محفوظ ہے۔
ٹیبلر کے ساتھ سوال و جواب کے مرحلہ وار نمونہ کوڈ واک تھرو کے لیے، اس میں پائیتھن نوٹ بک دیکھیں GitHub کے.
ٹیمپلیٹنگ اور نارملائزیشن
اس سیکشن میں، ہم دیکھتے ہیں کہ کس طرح پرامپٹ انجینئرنگ تکنیک اور LangChain کے بلٹ ان میکانزم کا استعمال کرتے ہوئے ایک مخصوص اسکیما میں کسی دستاویز سے اخراج کے ساتھ آؤٹ پٹ تیار کیا جائے۔ ہم پہلے زیر بحث تکنیکوں کا استعمال کرتے ہوئے نکالے گئے ڈیٹا پر کچھ معیاری کاری بھی کرتے ہیں۔ ہم اپنے مطلوبہ آؤٹ پٹ کے لیے ایک ٹیمپلیٹ کی وضاحت کرکے شروع کرتے ہیں۔ یہ ایک اسکیما کے طور پر کام کرے گا اور ہر ایک ہستی کے بارے میں تفصیلات کو سمیٹے گا جسے ہم دستاویز کے متن سے نکالنا چاہتے ہیں۔
نوٹ کریں کہ ہر ایک ہستی کے لیے، ہم یہ وضاحت کرنے کے لیے استعمال کرتے ہیں کہ وہ ہستی کیا ہے تاکہ دستاویز کے متن سے قدر نکالنے میں LLM کی مدد کی جا سکے۔ مندرجہ ذیل نمونہ کوڈ میں، ہم اس ٹیمپلیٹ کا استعمال کرتے ہوئے دستاویز سے نکالے گئے متن کے ساتھ ایل ایل ایم کے لیے اپنا پرامپٹ تیار کرنے کے لیے استعمال کرتے ہیں۔ AmazonTextractPDFLoader
اور اس کے بعد ماڈل کے ساتھ اندازہ لگائیں:
آپ دیکھ سکتے ہیں، {keys}
پرامپٹ کا حصہ ہماری ٹیمپلیٹ کی کلیدیں ہیں، اور {details}
ان کی تفصیل کے ساتھ چابیاں ہیں۔ اس صورت میں، ہم JSON فارمیٹ میں آؤٹ پٹ جنریٹ کرنے کی ہدایات میں وضاحت کرنے کے علاوہ آؤٹ پٹ کے فارمیٹ کے ساتھ ماڈل کو واضح طور پر نہیں بتاتے ہیں۔ یہ سب سے زیادہ حصہ کے لئے کام کرتا ہے؛ تاہم، چونکہ LLMs سے آؤٹ پٹ غیر متعین ٹیکسٹ جنریشن ہے، ہم پرامپٹ میں ہدایات کے حصے کے طور پر فارمیٹ کو واضح طور پر بیان کرنا چاہتے ہیں۔ اس کو حل کرنے کے لیے، ہم LangChain's استعمال کر سکتے ہیں۔ تشکیل شدہ آؤٹ پٹ پارسر خودکار پرامپٹ انجینئرنگ کا فائدہ اٹھانے کے لیے ماڈیول جو ہمارے ٹیمپلیٹ کو فارمیٹ انسٹرکشن پرامپٹ میں تبدیل کرنے میں مدد کرتا ہے۔ ہم مندرجہ ذیل فارمیٹ انسٹرکشن پرامپٹ بنانے کے لیے پہلے بیان کردہ ٹیمپلیٹ کا استعمال کرتے ہیں:
اس کے بعد ہم اس متغیر کو اپنے اصل پرامپٹ کے اندر LLM کے لیے ایک ہدایات کے طور پر استعمال کرتے ہیں تاکہ یہ ہمارے پرامپٹ میں ایک چھوٹی سی ترمیم کر کے مطلوبہ اسکیما میں آؤٹ پٹ کو نکال کر فارمیٹ کرے:
اب تک، ہم نے صرف مطلوبہ اسکیما میں دستاویز سے ڈیٹا نکالا ہے۔ تاہم، ہمیں ابھی بھی کچھ معیاری کاری کرنے کی ضرورت ہے۔ مثال کے طور پر، ہم چاہتے ہیں کہ مریض کی داخلے کی تاریخ اور ڈسچارج کی تاریخ DD/MM/YYYY فارمیٹ میں نکالی جائے۔ اس صورت میں، ہم اضافہ کرتے ہیں description
فارمیٹنگ کی ہدایات کے ساتھ کلید کا:
میں پائیتھن نوٹ بک کا حوالہ دیں۔ GitHub کے ایک مکمل قدم بہ قدم واک تھرو اور وضاحت کے لیے۔
املا کی جانچ اور تصحیح
LLMs نے انسان نما متن کو سمجھنے اور تخلیق کرنے میں قابل ذکر صلاحیتوں کا مظاہرہ کیا ہے۔ LLMs کی کم زیر بحث لیکن بے حد مفید ایپلی کیشنز میں سے ایک ان کی گرائمیکل جانچ اور دستاویزات میں جملے کی اصلاح کی صلاحیت ہے۔ روایتی گرائمر چیکرس کے برعکس جو پہلے سے طے شدہ اصولوں کے ایک سیٹ پر انحصار کرتے ہیں، ایل ایل ایم ایسے نمونوں کا استعمال کرتے ہیں جن کی انہوں نے متنی اعداد و شمار کی وسیع مقدار سے شناخت کی ہے تاکہ یہ تعین کیا جا سکے کہ صحیح یا روانی کی زبان کیا ہے۔ اس کا مطلب ہے کہ وہ ان باریکیوں، سیاق و سباق اور باریکیوں کا پتہ لگا سکتے ہیں جو اصول پر مبنی نظام سے چھوٹ سکتے ہیں۔
مریض کے ڈسچارج سمری سے نکالے گئے متن کا تصور کریں جس میں لکھا ہے "مریض جون ڈو، جسے نمونیا کے ساتھ داخل کیا گیا تھا، میں نمایاں بہتری آئی ہے اور اسے محفوظ طریقے سے ڈسچارج کیا جا سکتا ہے۔ فالو اپ اگلے ہفتے کے لیے طے شدہ ہیں۔ ایک روایتی ہجے چیک کرنے والا شاید "اعتراف،" "نمونیا،" "بہتری،" اور "nex" کو غلطیوں کے طور پر پہچان سکتا ہے۔ تاہم، ان غلطیوں کا سیاق و سباق مزید غلطیاں یا عمومی تجاویز کا باعث بن سکتا ہے۔ ایک LLM، جو اس کی وسیع تربیت سے لیس ہے، تجویز کر سکتا ہے: "مریض جان ڈو، جو شدید نمونیا کے ساتھ داخل تھا، میں نمایاں بہتری آئی ہے اور اسے بحفاظت ڈسچارج کیا جا سکتا ہے۔ فالو اپ اگلے ہفتے کے لئے طے شدہ ہیں۔
ذیل میں ایک ناقص ہاتھ سے لکھا ہوا نمونہ دستاویز ہے جس میں وہی متن ہے جیسا کہ پہلے بیان کیا گیا ہے۔
ہم Amazon Textract دستاویز لوڈر کے ساتھ دستاویز کو نکالتے ہیں اور پھر LLM کو پرامپٹ انجینئرنگ کے ذریعے ہدایت دیتے ہیں کہ نکالے گئے متن کو درست کرنے کے لیے ہجے اور یا گرامر کی غلطیوں کو درست کریں:
پچھلے کوڈ کا آؤٹ پٹ دستاویز لوڈر کے ذریعہ نکالا گیا اصل متن دکھاتا ہے جس کے بعد LLM کے ذریعہ تیار کردہ درست متن:
ذہن میں رکھیں کہ LLM جتنے طاقتور ہیں، ان کی تجاویز کو صرف اسی طرح دیکھنا ضروری ہے۔ اگرچہ وہ زبان کی پیچیدگیوں کو متاثر کن طریقے سے گرفت میں لیتے ہیں، لیکن وہ غلط نہیں ہیں۔ کچھ تجاویز اصل متن کے مطلوبہ معنی یا لہجے کو تبدیل کر سکتی ہیں۔ لہذا، انسانی جائزہ لینے والوں کے لیے یہ بہت ضروری ہے کہ وہ LLM سے تیار کردہ اصلاحات کو بطور رہنما استعمال کریں، نہ کہ مطلق۔ LLM صلاحیتوں کے ساتھ انسانی بصیرت کا اشتراک ایک ایسے مستقبل کا وعدہ کرتا ہے جہاں ہمارا تحریری مواصلت نہ صرف غلطی سے پاک ہے، بلکہ مزید امیر اور زیادہ اہم بھی ہے۔
نتیجہ
جنریٹو AI تبدیل کر رہا ہے کہ آپ IDP کے ساتھ بصیرت حاصل کرنے کے لیے دستاویزات پر کیسے کارروائی کر سکتے ہیں۔ پوسٹ میں جنریٹو AI کے ساتھ AWS ذہین دستاویز پروسیسنگ کو بڑھانا، ہم نے پائپ لائن کے مختلف مراحل پر تبادلہ خیال کیا اور کس طرح AWS کسٹمر Ricoh LLMs کے ساتھ اپنی IDP پائپ لائن کو بڑھا رہا ہے۔ اس پوسٹ میں، ہم نے LLMs کے ساتھ Amazon Bedrock، Amazon Textract، اور مقبول LangChain فریم ورک کے ذریعے IDP ورک فلو کو بڑھانے کے مختلف طریقہ کار پر تبادلہ خیال کیا۔ آپ آج ہی LangChain کے ساتھ نئے Amazon Textract Document لوڈر کے ساتھ شروع کر سکتے ہیں جو ہمارے میں دستیاب نمونہ نوٹ بکس کا استعمال کر سکتے ہیں۔ GitHub ذخیرہ. AWS پر جنریٹیو AI کے ساتھ کام کرنے کے بارے میں مزید معلومات کے لیے، رجوع کریں۔ AWS پر جنریٹیو AI کے ساتھ تعمیر کے لیے نئے ٹولز کا اعلان.
مصنفین کے بارے میں
سونالی ساہو AWS میں AI/ML سروسز ٹیم کے ساتھ ذہین دستاویز پراسیسنگ کی قیادت کر رہا ہے۔ وہ ایک مصنف، سوچنے والی رہنما، اور پرجوش ٹیکنولوجسٹ ہیں۔ اس کی توجہ کا بنیادی شعبہ AI اور ML ہے، اور وہ اکثر دنیا بھر میں AI اور ML کانفرنسوں اور ملاقاتوں میں بولتی ہے۔ اس کے پاس صحت کی دیکھ بھال، مالیاتی شعبے اور انشورنس میں صنعت کی مہارت کے ساتھ ٹیکنالوجی اور ٹیکنالوجی کی صنعت میں وسیع اور گہرائی کا تجربہ ہے۔
انجان بسواس اے آئی/ایم ایل اور ڈیٹا اینالیٹکس پر توجہ کے ساتھ ایک سینئر AI سروسز سلوشنز آرکیٹیکٹ ہے۔ انجان دنیا بھر کی AI سروسز ٹیم کا حصہ ہے اور صارفین کے ساتھ کام کرتا ہے تاکہ وہ AI اور ML کے ساتھ کاروباری مسائل کو سمجھنے اور ان کے حل کو تیار کرنے میں مدد کریں۔ انجان کے پاس عالمی سپلائی چین، مینوفیکچرنگ، اور ریٹیل تنظیموں کے ساتھ کام کرنے کا 14 سال سے زیادہ کا تجربہ ہے، اور وہ صارفین کو AWS AI خدمات شروع کرنے اور اسکیل کرنے میں فعال طور پر مدد کر رہا ہے۔
چنمئی رانے ایمیزون ویب سروسز میں ایک AI/ML ماہر حل آرکیٹیکٹ ہے۔ وہ لاگو ریاضی اور مشین لرننگ کے بارے میں پرجوش ہے۔ وہ AWS صارفین کے لیے ذہین دستاویز پروسیسنگ اور جنریٹیو AI سلوشن ڈیزائن کرنے پر توجہ مرکوز کرتی ہے۔ کام سے باہر، وہ سالسا اور بچتا ڈانس سے لطف اندوز ہوتی ہے۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://aws.amazon.com/blogs/machine-learning/intelligent-document-processing-with-amazon-textract-amazon-bedrock-and-langchain/
- : ہے
- : ہے
- : نہیں
- :کہاں
- .nex
- $1000
- $UP
- 1
- 10
- 100
- 11
- 12
- 13
- 14
- 15٪
- 16
- 22
- 23
- 33
- 35٪
- 7
- 9
- a
- صلاحیتوں
- ہمارے بارے میں
- مطلق
- تک رسائی حاصل
- رسائی
- کے مطابق
- درستگی
- درست
- حاصل کیا
- کے پار
- عمل
- اعمال
- فعال طور پر
- سرگرمی
- کام کرتا ہے
- Ad
- پتہ
- جوڑتا ہے
- مان لیا
- تسلیم
- اعتراف کیا
- ترقی
- فائدہ
- آمد
- عمر
- ایجنٹ
- AI
- AI خدمات
- AI / ML
- منسلک
- تمام
- اجازت دے رہا ہے
- کی اجازت دیتا ہے
- ساتھ
- بھی
- متبادل
- اگرچہ
- ایمیزون
- ایمیزون کی تعریف
- ایمیزون آر ڈی ایس
- ایمیزون ٹیکسٹ
- ایمیزون ویب سروسز
- مقدار
- an
- تجزیاتی
- تجزیے
- اور
- جواب
- بشری
- کوئی بھی
- APIs
- ایپلی کیشنز
- اطلاقی
- تقرری
- نقطہ نظر
- فن تعمیر
- کیا
- رقبہ
- ارد گرد
- فن
- مصنوعی
- مصنوعی ذہانت
- مصنوعی انٹیلی جنس (AI)
- AS
- پہلو
- مدد
- اسسٹنٹ
- At
- اضافہ
- اضافہ
- مصنف
- خود کار طریقے سے
- آٹومیٹڈ
- خود کار طریقے سے
- میشن
- دستیاب
- کے بارے میں شعور
- AWS
- AWS کسٹمر
- بینک
- BE
- کیونکہ
- ہو جاتا ہے
- رہا
- اس سے پہلے
- فائدہ مند
- فائدہ
- BEST
- بہترین طریقوں
- کے درمیان
- بلاک
- بلاکس
- دونوں
- چوڑائی
- توڑ
- وقفے
- تعمیر
- عمارت
- تعمیر میں
- کاروبار
- کاروبار
- لیکن
- by
- کالز
- کر سکتے ہیں
- حاصل کر سکتے ہیں
- صلاحیتوں
- قبضہ
- کیس
- مقدمات
- خلیات
- کچھ
- چین
- زنجیروں
- چیلنج
- چیلنج
- تبدیل
- تبدیلیاں
- تبدیل کرنے
- چیک
- انتخاب
- دعوے
- طبقے
- کلاس
- درجہ بندی
- درجہ بندی کرنا۔
- کوڈ
- مربوط
- تعاون
- کالم
- کالم
- مجموعہ
- جمع
- آتا ہے
- کامن
- عام طور پر
- مواصلات
- ہم آہنگ
- مکمل
- پیچیدہ
- پیچیدگی
- سمجھو
- جامع
- کانفرنسوں
- مربوط
- متواتر
- مشتمل
- رکاوٹوں
- تعمیر
- پر مشتمل ہے
- پر مشتمل ہے
- پر مشتمل ہے
- مواد
- سیاق و سباق
- متعلقہ
- تبدیل
- کور
- درست
- درست کیا
- اصلاحات
- سکتا ہے
- شلپ
- تیار کیا
- پیدا
- اہم
- اپنی مرضی کے
- گاہک
- گاہکوں
- رقص
- اعداد و شمار
- ڈیٹا تجزیات
- ڈیٹا بیس
- ڈیٹا بیس
- تاریخ
- تواریخ
- نمٹنے کے
- گہری
- گہرے
- وضاحت
- کی وضاحت
- وضاحت
- demonstrated,en
- منحصر ہے
- ذخائر
- گہرائی
- بیان کیا
- تفصیل
- ڈیزائننگ
- مطلوبہ
- تفصیل
- تفصیلی
- تفصیلات
- کا پتہ لگانے کے
- اس بات کا تعین
- ترقی
- ڈویلپرز
- غذا
- مختلف
- براہ راست
- بات چیت
- بات چیت
- ڈوبکی
- تقسیم
- تقسیم ہوتا ہے
- do
- ڈاکٹر
- دستاویز
- دستاویزات
- دستاویزات
- ڈو
- نہیں کرتا
- کر
- ڈان
- کیا
- نہیں
- نیچے
- ڈرامائی طور پر
- دو
- کے دوران
- متحرک
- e
- ہر ایک
- اس سے قبل
- آسانی سے
- استعمال میں آسان
- مؤثر طریقے
- کارکردگی
- ہنر
- مؤثر طریقے سے
- کوششوں
- یا تو
- عناصر
- یمبیڈ
- ملازم
- بااختیار بنانا
- کو چالو کرنے کے
- کے قابل بناتا ہے
- کو فعال کرنا
- آخر
- انجنیئرنگ
- بڑھانے کے
- بہتر
- بڑھانے
- کو یقینی بنانے کے
- کو یقینی بنانے ہے
- پوری
- اداروں
- ہستی
- لیس
- نقائص
- ضروری
- بھی
- مثال کے طور پر
- اس کے علاوہ
- رعایت
- موجودہ
- تجربہ
- مہارت
- وضاحت
- وضاحت کی
- بیان کرتا ہے
- وضاحت
- واضح طور پر
- اظہار
- توسیع
- مدت ملازمت میں توسیع
- وسیع
- نکالنے
- نکالنے
- نچوڑ۔
- گر
- جھوٹی
- دور
- تھکاوٹ
- قطعات
- اعداد و شمار
- فائنل
- آخر
- مالی
- مالیاتی شعبے
- پہلا
- فٹ
- توجہ مرکوز
- توجہ مرکوز
- پر عمل کریں
- پیچھے پیچھے
- کے بعد
- مندرجہ ذیل ہے
- کے لئے
- فارمیٹ
- فارم
- ملا
- فاؤنڈیشن
- فریم ورک
- مفت
- اکثر
- سے
- فرنٹیئر
- مکمل
- مکمل طور پر
- مزید
- مستقبل
- جنرل
- پیدا
- پیدا
- پیدا ہوتا ہے
- پیدا کرنے والے
- نسل
- پیداواری
- پیداواری AI۔
- حاصل
- دے دو
- دی
- گلوبل
- گرائمر
- سمجھو
- زیادہ سے زیادہ
- گروپ
- رہنمائی
- ہاتھ
- ہینڈل
- ہو
- ہو رہا ہے۔
- ہارڈ ویئر
- ہے
- ہیڈر
- صحت کی دیکھ بھال
- بھاری
- مدد
- مدد گار
- مدد
- مدد کرتا ہے
- اس کی
- یہاں
- اعلی سطحی
- اعلی کارکردگی
- اعلی
- کی ڈگری حاصل کی
- ہسپتال
- کس طرح
- کیسے
- تاہم
- HTML
- HTTPS
- انسانی
- i
- ID
- کی نشاندہی
- if
- وضاحت کرتا ہے
- تصویر
- بے حد
- اثر
- درآمد
- اہم
- درآمد
- نافذ کریں
- بہتری
- in
- سمیت
- انڈکس
- صنعت
- معلومات
- معلومات عمر
- جدت طرازی
- ان پٹ
- بصیرت
- مثال کے طور پر
- ہدایات
- انشورنس
- ضم
- ضم
- انضمام کرنا
- انضمام
- انٹیلی جنس
- انٹیلجنٹ
- ذہین دستاویز پروسیسنگ
- ارادہ
- اندرونی طور پر
- میں
- پیچیدگیاں
- متعارف کرانے
- متعارف
- متعارف کرواتا ہے
- IT
- میں
- جیکسن
- جان
- جان ڈو
- جان
- فوٹو
- JSON
- صرف
- کلیدی
- چابیاں
- جان
- علم
- جانا جاتا ہے
- زبان
- بڑے
- لے آؤٹ
- قیادت
- رہنما
- معروف
- سیکھنے
- چھوڑ کر
- لائبریری
- کی طرح
- امکان
- حدود
- حدود
- لسٹ
- ایل ایل ایم
- لوڈ
- بارک
- منطق
- دیکھو
- بہت
- مشین
- مشین لرننگ
- بنانا
- انتظام
- قابل انتظام
- میں کامیاب
- مینیجنگ
- دستی
- مینوفیکچرنگ
- نشان لگا دیا گیا
- ریاضی
- مئی..
- me
- مطلب
- بامعنی
- کا مطلب ہے کہ
- میکانزم
- نظام
- ملاقاتیں
- یاد داشت
- میٹا
- میٹا ڈیٹا
- طریقہ
- طریقوں
- شاید
- برا
- یاد آتی ہے
- غلطیوں
- ML
- ماڈل
- ماڈل
- ماڈیول
- زیادہ
- رہن
- سب سے زیادہ
- ایک سے زیادہ
- نام
- نام
- قدرتی
- قدرتی زبان عملیات
- ضروری
- ضرورت ہے
- ضرورت
- ضروریات
- نئی
- اگلے
- اگلے ہفتے
- ویزا
- نوٹ بک
- اب
- شیڈنگ
- تعداد
- اعتراض
- اشیاء
- of
- تجویز
- اکثر
- on
- ایک
- صرف
- اوپن سورس
- آپریشنز
- مواقع
- زیادہ سے زیادہ
- آپشنز کے بھی
- or
- تنظیمیں
- اصل
- دیگر
- دوسری صورت میں
- ہمارے
- باہر
- نتائج
- پیداوار
- نتائج
- باہر
- پر
- مجموعی جائزہ
- پیکجوں کے
- صفحہ
- صفحات
- درد
- جوڑا
- جوڑے
- حصہ
- خاص طور پر
- منظور
- منظور
- پاسنگ
- جذباتی
- راستہ
- مریض
- پاٹرن
- پیٹرن
- فی
- انجام دیں
- کارکردگی
- کارکردگی
- کارکردگی کا مظاہرہ
- کارکردگی کا مظاہرہ
- مرحلہ
- پی ایچ ڈی
- جملے
- پائپ لائن
- منصوبہ
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- مہربانی کرکے
- نمونیا
- پوائنٹس
- مقبول
- ممکن
- پوسٹ
- ممکنہ
- طاقت
- طاقت
- طاقتور
- طریقوں
- ٹھیک ہے
- صحت سے متعلق
- کو ترجیح دی
- حال (-)
- پہلے
- بنیادی طور پر
- پرنٹ
- پرنٹس
- مسئلہ
- مسائل
- عمل
- عملدرآمد
- پروسیسنگ
- پیدا
- وعدہ کیا ہے
- مناسب
- فراہم
- فراہم
- فراہم کنندہ
- فراہم کرتا ہے
- ازگر
- سوال و جواب
- معیار
- سوال
- فوری
- جلدی سے
- خام
- پڑھنا
- تسلیم
- کو کم کرنے
- کا حوالہ دیتے ہیں
- حوالہ
- کہا جاتا ہے
- تعلقات
- متعلقہ
- انحصار کرو
- یقین ہے
- قابل ذکر
- رپورٹ
- کی نمائندگی
- نمائندگی
- ضرورت
- کی ضرورت ہے
- بالترتیب
- جوابات
- پابندی
- نتیجہ
- نتیجے
- نتائج کی نمائش
- خوردہ
- برقرار رکھنے
- برقرار رکھنے
- واپسی
- امیر
- کمرہ
- قوانین
- رن
- چلتا ہے
- s
- محفوظ طریقے سے
- اسی
- کا کہنا ہے کہ
- پیمانے
- منظرنامے
- شیڈول کے مطابق
- تلاش کریں
- دوسری
- سیکشن
- سیکشنز
- شعبے
- دیکھنا
- حصوں
- منتخب
- سینئر
- سزا
- سیریز
- خدمت
- کام کرتا ہے
- سروس
- سروسز
- مقرر
- شدید
- وہ
- مختصر
- ہونا چاہئے
- دکھایا گیا
- شوز
- اہم
- ایک
- چھوٹے
- چھوٹے
- ٹکڑا
- So
- مکمل طور پر
- حل
- حل
- کچھ
- ماخذ
- خلا
- بولی
- ماہر
- مخصوص
- خاص طور پر
- مخصوص
- املا
- تقسیم
- مراحل
- معیاری کاری
- شروع کریں
- شروع
- ریاستی آرٹ
- بیان
- مرحلہ
- مراحل
- ابھی تک
- ذخیرہ
- ذخیرہ
- پردہ
- طاقت
- سلک
- ساختی
- ساخت
- منظم
- جدوجہد
- بعد میں
- بعد میں
- اس طرح
- مشورہ
- مختصر
- خلاصہ
- فراہمی
- فراہمی کا سلسلہ
- حمایت
- کی حمایت کرتا ہے
- مطابقت
- سسٹمز
- ٹیبل
- لے لو
- لیتا ہے
- ٹاسک
- کاموں
- ٹیم
- تکنیک
- تکنیک
- تکنیکی ماہر
- ٹیکنالوجی
- سانچے
- شرائط
- متن
- متنی
- سے
- کہ
- ۔
- دنیا
- ان
- ان
- تو
- وہاں.
- لہذا
- یہ
- وہ
- اس
- سوچا
- تین
- کے ذریعے
- ٹائٹین
- کرنے کے لئے
- آج
- آج کا
- مل کر
- ٹوکن
- ٹوکن
- سر
- اوزار
- سب سے اوپر
- کل
- روایتی
- پشت بندی
- ٹریننگ
- معاملات
- تبدیل
- تبدیلی
- سچ
- کوشش
- دو
- قسم
- اقسام
- سمجھ
- افہام و تفہیم
- برعکس
- نقاب کشائی
- URL
- استعمال کی شرائط
- استعمال کیس
- استعمال کیا جاتا ہے
- صارفین
- استعمال
- کا استعمال کرتے ہوئے
- استعمال کیا
- استعمال کرنا۔
- v1
- قیمت
- اقدار
- متغیر
- مختلف
- وسیع
- ورسٹائل
- ورژن
- کی طرف سے
- لنک
- جلد
- واک تھرو
- چاہتے ہیں
- تھا
- راستہ..
- we
- ویب
- ویب خدمات
- ہفتے
- اچھا ہے
- کیا
- جب
- جس
- جبکہ
- ڈبلیو
- گے
- ساتھ
- کے اندر
- بغیر
- گواہ
- لفظ
- الفاظ
- کام
- کام کا بہاؤ
- کام کے بہاؤ
- کام کر
- کام کرتا ہے
- دنیا
- گا
- لکھا
- X
- سال
- تم
- زیفیرنیٹ