Intelligent Document Processing With Amazon Textract, Amazon Bedrock, And LangChain

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

آج کے معلوماتی دور میں، بے شمار دستاویزات میں موجود ڈیٹا کی وسیع مقدار کاروبار کے لیے ایک چیلنج اور ایک موقع دونوں پیش کرتی ہے۔ روایتی دستاویز پراسیسنگ کے طریقے اکثر کارکردگی اور درستگی میں کم ہوتے ہیں، جس سے جدت، لاگت کی کارکردگی، اور اصلاح کی گنجائش باقی رہ جاتی ہے۔ انٹیلجنٹ ڈاکومنٹ پروسیسنگ (IDP) کی آمد کے ساتھ دستاویزی پروسیسنگ میں نمایاں پیش رفت ہوئی ہے۔ IDP کے ساتھ، کاروبار مختلف دستاویزات کی اقسام سے غیر ساختہ ڈیٹا کو ساختی، قابل عمل بصیرت میں تبدیل کر سکتے ہیں، ڈرامائی طور پر کارکردگی کو بڑھا سکتے ہیں اور دستی کوششوں کو کم کر سکتے ہیں۔ تاہم، صلاحیت وہیں ختم نہیں ہوتی۔ تخلیقی مصنوعی ذہانت (AI) کو اس عمل میں ضم کرکے، ہم IDP کی صلاحیتوں کو مزید بڑھا سکتے ہیں۔ جنریٹو اے آئی نہ صرف دستاویز کی پروسیسنگ میں بہتر صلاحیتوں کو متعارف کراتا ہے، بلکہ یہ ڈیٹا کے پیٹرن کو تبدیل کرنے کے لیے متحرک موافقت بھی متعارف کراتا ہے۔ یہ پوسٹ آپ کو IDP اور جنریٹیو AI کی ہم آہنگی کے ذریعے لے جاتی ہے، اس بات کی نقاب کشائی کرتی ہے کہ وہ دستاویز کی کارروائی میں اگلے محاذ کی نمائندگی کیسے کرتے ہیں۔

ہم IDP پر تفصیل سے اپنی سیریز میں AWS AI خدمات کے ساتھ انٹیلیجنٹ دستاویز پروسیسنگ (حصہ 1 اور حصہ 2)۔ اس پوسٹ میں، ہم بحث کرتے ہیں کہ بڑے لینگویج ماڈلز (LLMs) کے ساتھ نئے یا موجودہ IDP فن تعمیر کو کیسے بڑھایا جائے۔ مزید خاص طور پر، ہم بحث کرتے ہیں کہ ہم کس طرح ضم کر سکتے ہیں۔ ایمیزون ٹیکسٹ ساتھ لینگ چین بطور دستاویز لوڈر اور ایمیزون بیڈرک مختلف IDP مراحل میں دستاویزات سے ڈیٹا نکالنے اور تخلیقی AI صلاحیتوں کو استعمال کرنے کے لیے۔

Amazon Textract ایک مشین لرننگ (ML) سروس ہے جو خودکار طور پر سکین شدہ دستاویزات سے ٹیکسٹ، ہینڈ رائٹنگ اور ڈیٹا نکالتی ہے۔ Amazon Bedrock ایک مکمل طور پر منظم سروس ہے جو استعمال میں آسان APIs کے ذریعے اعلیٰ کارکردگی کا مظاہرہ کرنے والے فاؤنڈیشن ماڈلز (FMs) کا انتخاب پیش کرتی ہے۔

مندرجہ ذیل خاکہ ایک اعلیٰ سطحی ریفرنس آرکیٹیکچر ہے جو بتاتا ہے کہ آپ فاؤنڈیشن ماڈلز کے ساتھ IDP ورک فلو کو مزید کیسے بڑھا سکتے ہیں۔ استعمال کے کیس اور مطلوبہ نتائج کے لحاظ سے آپ IDP کے ایک یا تمام مراحل میں LLM استعمال کر سکتے ہیں۔

مندرجہ ذیل حصوں میں، ہم اس بات کی گہرائی میں غوطہ لگاتے ہیں کہ ان مخصوص کاموں میں سے ہر ایک کے لیے دستاویزات پر کارروائی کرنے کے لیے LangChain کا استعمال کرتے ہوئے Amazon Textract کو کس طرح تخلیقی AI ورک فلو میں ضم کیا جاتا ہے۔ یہاں فراہم کردہ کوڈ بلاکس کو اختصار کے لیے تراش دیا گیا ہے۔ ہماری طرف رجوع کریں۔ GitHub ذخیرہ تفصیلی Python نوٹ بک اور قدم بہ قدم واک تھرو کے لیے۔

جب LLMs کے ساتھ دستاویزات پر کارروائی کی بات آتی ہے تو دستاویزات سے متن نکالنا ایک اہم پہلو ہے۔ آپ دستاویزات سے غیر ساختہ خام متن نکالنے کے لیے Amazon Textract کا استعمال کر سکتے ہیں اور دستاویز میں موجود کلیدی قدر کے جوڑے اور میزیں جیسی اصلی نیم ساختہ یا ساختی اشیاء کو محفوظ کر سکتے ہیں۔ صحت کی دیکھ بھال اور انشورنس کے دعوے یا رہن جیسے دستاویزی پیکج پیچیدہ شکلوں پر مشتمل ہوتے ہیں جن میں ساختی، نیم ساختہ، اور غیر ساختہ فارمیٹس میں بہت ساری معلومات ہوتی ہیں۔ دستاویز نکالنا یہاں ایک اہم قدم ہے کیونکہ ایل ایل ایم زیادہ درست اور متعلقہ ردعمل پیدا کرنے کے لیے بھرپور مواد سے فائدہ اٹھاتے ہیں، جو بصورت دیگر ایل ایل ایم کے آؤٹ پٹ کے معیار کو متاثر کر سکتے ہیں۔

LangChain LLMs کے ساتھ انضمام کے لیے ایک طاقتور اوپن سورس فریم ورک ہے۔ عام طور پر LLMs ورسٹائل ہوتے ہیں لیکن ڈومین سے متعلق مخصوص کاموں کے ساتھ جدوجہد کر سکتے ہیں جہاں گہرے سیاق و سباق اور باریک ردعمل کی ضرورت ہوتی ہے۔ LangChain ایسے حالات میں ڈویلپرز کو ایسے ایجنٹوں کی تعمیر کے لیے بااختیار بناتا ہے جو پیچیدہ کاموں کو چھوٹے ذیلی کاموں میں توڑ سکتے ہیں۔ ذیلی کام اس کے بعد ایل ایل ایم پرامپٹس کو جوڑ کر اور زنجیر بنا کر سیاق و سباق اور میموری کو ایل ایل ایم میں متعارف کرا سکتے ہیں۔

LangChain پیشکش کرتا ہے۔ دستاویز لوڈرز جو دستاویزات سے ڈیٹا کو لوڈ اور تبدیل کر سکتا ہے۔ آپ انہیں دستاویزات کو ترجیحی فارمیٹس میں ڈھانچے کے لیے استعمال کر سکتے ہیں جن پر LLMs کے ذریعے کارروائی کی جا سکتی ہے۔ دی AmazonTextractPDFLloader ایک سروس لوڈر قسم کا دستاویز لوڈر ہے جو LangChain کے ساتھ مل کر Amazon Textract کا استعمال کرکے دستاویز کی پروسیسنگ کو خودکار کرنے کا فوری طریقہ فراہم کرتا ہے۔ پر مزید تفصیلات کے لیے AmazonTextractPDFLoader، حوالہ دیتے ہیں لینگ چین دستاویزات Amazon Textract دستاویز لوڈر کو استعمال کرنے کے لیے، آپ اسے LangChain لائبریری سے درآمد کرکے شروع کرتے ہیں:

from langchain.document_loaders import AmazonTextractPDFLoader

https_loader = AmazonTextractPDFLoader("https://sample-website.com/sample-doc.pdf")
https_document = https_loader.load() s3_loader = AmazonTextractPDFLoader("s3://sample-bucket/sample-doc.pdf")
s3_document = s3_loader.load()

آپ Amazon S3 میں بھی دستاویزات کو اسٹور کر سکتے ہیں اور s3:// URL پیٹرن کا استعمال کرتے ہوئے ان کا حوالہ دے سکتے ہیں، جیسا کہ اس میں وضاحت کی گئی ہے۔ S3// کا استعمال کرتے ہوئے بالٹی تک رسائی، اور اس S3 راستے کو Amazon Textract PDF لوڈر تک منتقل کریں:

import boto3
textract_client = boto3.client('textract', region_name='us-east-2') file_path = "s3://amazon-textract-public-content/langchain/layout-parser-paper.pdf"
loader = AmazonTextractPDFLoader(file_path, client=textract_client)
documents = loader.load()

ایک کثیر صفحاتی دستاویز میں متن کے متعدد صفحات ہوں گے، جس تک دستاویزات آبجیکٹ کے ذریعے رسائی حاصل کی جاسکتی ہے، جو کہ صفحات کی فہرست ہے۔ مندرجہ ذیل کوڈ دستاویزات آبجیکٹ میں صفحات کے ذریعے لوپ کرتا ہے اور دستاویز کے متن کو پرنٹ کرتا ہے، جو اس کے ذریعے دستیاب ہے۔ page_content وصف:

print(len(documents)) for document in documents: print(document.page_content)

Amazon Comprehend اور LLMs کو دستاویز کی درجہ بندی کے لیے مؤثر طریقے سے استعمال کیا جا سکتا ہے۔ Amazon Comprehend ایک قدرتی لینگویج پروسیسنگ (NLP) سروس ہے جو متن سے بصیرت نکالنے کے لیے ML کا استعمال کرتی ہے۔ Amazon Comprehend پی ڈی ایف، ورڈ، اور تصویری فارمیٹس جیسی دستاویزات پر لے آؤٹ آگاہی کے ساتھ حسب ضرورت درجہ بندی ماڈل ٹریننگ کی بھی حمایت کرتا ہے۔ Amazon Comprehend دستاویز کی درجہ بندی کے استعمال کے بارے میں مزید معلومات کے لیے، رجوع کریں۔ Amazon Comprehend دستاویز کا درجہ بندی اعلیٰ درستگی کے لیے لے آؤٹ سپورٹ کا اضافہ کرتا ہے۔.

جب LLMs کے ساتھ جوڑا بنایا جاتا ہے تو، دستاویزات کی درجہ بندی بڑی مقدار میں دستاویزات کے انتظام کے لیے ایک طاقتور طریقہ بن جاتی ہے۔ LLMs دستاویز کی درجہ بندی میں مددگار ہیں کیونکہ وہ قدرتی زبان کی تفہیم کا استعمال کرتے ہوئے دستاویز میں متن، نمونوں، اور متعلقہ عناصر کا تجزیہ کر سکتے ہیں۔ آپ انہیں مخصوص دستاویز کی کلاسوں کے لیے بھی ٹھیک کر سکتے ہیں۔ جب IDP پائپ لائن میں متعارف کرائی گئی ایک نئی دستاویز کی قسم کو درجہ بندی کی ضرورت ہوتی ہے، تو LLM متن پر کارروائی کر سکتا ہے اور کلاسوں کے ایک سیٹ سے دستاویز کی درجہ بندی کر سکتا ہے۔ درج ذیل ایک نمونہ کوڈ ہے جو دستاویز سے متن نکالنے اور دستاویز کی درجہ بندی کے لیے استعمال کرنے کے لیے Amazon Textract کے ذریعے چلنے والے LangChain دستاویز لوڈر کا استعمال کرتا ہے۔ ہم استعمال کرتے ہیں انتھروپک کلاڈ v2 درجہ بندی کو انجام دینے کے لیے ایمیزون بیڈرک کے ذریعے ماڈل۔

مندرجہ ذیل مثال میں، ہم سب سے پہلے مریض کے ڈسچارج رپورٹ سے متن نکالتے ہیں اور اس کی درجہ بندی کرنے کے لیے LLM کا استعمال کرتے ہیں جس میں تین مختلف دستاویز کی اقسام کی فہرست دی گئی ہے۔DISCHARGE_SUMMARY, RECEIPT، اور PRESCRIPTION. درج ذیل اسکرین شاٹ ہماری رپورٹ کو ظاہر کرتا ہے۔

from langchain.document_loaders import AmazonTextractPDFLoader
from langchain.llms import Bedrock
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain loader = AmazonTextractPDFLoader("./samples/document.png")
document = loader.load() template = """ Given a list of classes, classify the document into one of these classes. Skip any preamble text and just give the class name. <classes>DISCHARGE_SUMMARY, RECEIPT, PRESCRIPTION</classes>
<document>{doc_text}<document>
<classification>""" prompt = PromptTemplate(template=template, input_variables=["doc_text"])
bedrock_llm = Bedrock(client=bedrock, model_id="anthropic.claude-v2") llm_chain = LLMChain(prompt=prompt, llm=bedrock_llm)
class_name = llm_chain.run(document[0].page_content) print(f"The provided document is = {class_name}")

خلاصہ میں کسی دیے گئے متن یا دستاویز کو اس کی اہم معلومات کو برقرار رکھتے ہوئے اسے مختصر ورژن میں گاڑھا کرنا شامل ہے۔ یہ تکنیک موثر معلومات کی بازیافت کے لیے فائدہ مند ہے، جو صارفین کو مکمل مواد کو پڑھے بغیر کسی دستاویز کے اہم نکات کو تیزی سے سمجھنے کے قابل بناتی ہے۔ اگرچہ Amazon Textract براہ راست متن کا خلاصہ نہیں کرتا، لیکن یہ دستاویزات سے پورے متن کو نکالنے کی بنیادی صلاحیتیں فراہم کرتا ہے۔ یہ نکالا ہوا متن متن کے خلاصے کے کاموں کو انجام دینے کے لیے ہمارے LLM ماڈل میں ایک ان پٹ کے طور پر کام کرتا ہے۔

ایک ہی نمونہ خارج ہونے والی رپورٹ کا استعمال کرتے ہوئے، ہم استعمال کرتے ہیں AmazonTextractPDFLoader اس دستاویز سے متن نکالنے کے لیے۔ پہلے کی طرح، ہم Claude v2 ماڈل کو Amazon Bedrock کے ذریعے استعمال کرتے ہیں اور اسے ایک پرامپٹ کے ساتھ شروع کرتے ہیں جس میں متن کے ساتھ کیا کرنا ہے اس بارے میں ہدایات موجود ہیں (اس صورت میں، خلاصہ)۔ آخر میں، ہم دستاویز لوڈر سے نکالے گئے متن کو پاس کرکے ایل ایل ایم چین چلاتے ہیں۔ یہ LLM پر اس پرامپٹ کے ساتھ ایک انفرنس ایکشن چلاتا ہے جس میں خلاصہ کرنے کی ہدایات، اور دستاویز کے متن کو نشان زد کیا گیا ہے Document. درج ذیل کوڈ دیکھیں:

from langchain.document_loaders import AmazonTextractPDFLoader
from langchain.llms import Bedrock
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain loader = AmazonTextractPDFLoader("./samples/discharge-summary.png")
document = loader.load() template = """ Given a full document, give me a concise summary. Skip any preamble text and just give the summary. <document>{doc_text}</document>
<summary>""" prompt = PromptTemplate(template=template, input_variables=["doc_text"])
bedrock_llm = Bedrock(client=bedrock, model_id="anthropic.claude-v2") num_tokens = bedrock_llm.get_num_tokens(document[0].page_content)
print (f"Our prompt has {num_tokens} tokens nn=========================n") llm_chain = LLMChain(prompt=prompt, llm=bedrock_llm)
summary = llm_chain.run(document[0].page_content) print(summary.replace("</summary>","").strip())

کوڈ مریض کے ڈسچارج سمری رپورٹ کا خلاصہ تیار کرتا ہے:

Our prompt has 797 tokens =========================
35 yo M admitted for epigastric abdominal pain, nausea, fatigue. Found to likely have ulcer. Discharged with activity restrictions, antibiotics, diet changes, and follow up.

پچھلی مثال نے خلاصہ انجام دینے کے لیے ایک صفحے کی دستاویز کا استعمال کیا ہے۔ تاہم، آپ ممکنہ طور پر متعدد صفحات پر مشتمل دستاویزات سے نمٹیں گے جن کے خلاصے کی ضرورت ہے۔ ایک سے زیادہ صفحات پر خلاصہ کرنے کا ایک عام طریقہ یہ ہے کہ پہلے متن کے چھوٹے ٹکڑوں پر خلاصے بنائیں اور پھر دستاویز کا حتمی خلاصہ حاصل کرنے کے لیے چھوٹے خلاصوں کو جوڑیں۔ نوٹ کریں کہ اس طریقہ کار کے لیے LLM کو متعدد کالز کی ضرورت ہے۔ اس کے لیے منطق آسانی سے تیار کی جا سکتی ہے۔ تاہم، LangChain ایک بلٹ ان سمرائز چین فراہم کرتا ہے جو بڑے متن کا خلاصہ کر سکتا ہے (کثیر صفحات پر مشتمل دستاویزات سے)۔ خلاصہ یا تو کے ذریعے ہو سکتا ہے map_reduce یا کے ساتھ stuff اختیارات، جو LLM کو متعدد کالوں کا انتظام کرنے کے اختیارات کے طور پر دستیاب ہیں۔ مندرجہ ذیل مثال میں، ہم استعمال کرتے ہیں map_reduce ایک کثیر صفحاتی دستاویز کا خلاصہ کرنے کے لیے۔ مندرجہ ذیل تصویر ہمارے ورک فلو کو واضح کرتی ہے۔

Intelligent document processing with Amazon Textract, Amazon Bedrock, and LangChain | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

آئیے سب سے پہلے دستاویز کو نکال کر شروع کریں اور فی صفحہ کل ٹوکن گنتی اور صفحات کی کل تعداد دیکھیں:

from langchain.document_loaders import AmazonTextractPDFLoader
from langchain.llms import Bedrock bedrock_llm = Bedrock(client=bedrock, model_id="anthropic.claude-v2") loader = AmazonTextractPDFLoader(f"s3://{data_bucket}/bedrock-sample/health_plan.pdf")
document = loader.load()
num_docs = len(document)
print (f"There are {num_docs} pages in the document")
for index, doc in enumerate(document): num_tokens_first_doc = bedrock_llm.get_num_tokens(doc.page_content) print (f"Page {index+1} has approx. {num_tokens_first_doc} tokens") There are 5 pages in the document
Page 1 has approx. 533 tokens
Page 2 has approx. 1323 tokens
Page 3 has approx. 997 tokens
Page 4 has approx. 1643 tokens
Page 5 has approx. 867 tokens

اگلا، ہم LangChain کا بلٹ ان استعمال کرتے ہیں۔ load_summarize_chain پوری دستاویز کا خلاصہ کرنے کے لیے:

from langchain.chains.summarize import load_summarize_chain summary_chain = load_summarize_chain(llm=bedrock_llm, chain_type='map_reduce')
output = summary_chain.run(document)
print(output.strip())

معیاری کاری اور سوال و جواب

اس سیکشن میں، ہم معیار سازی اور سوال و جواب کے کاموں پر تبادلہ خیال کرتے ہیں۔

معیاری کاری

آؤٹ پٹ سٹینڈرڈائزیشن ایک ٹیکسٹ جنریشن کا کام ہے جہاں LLMs کو آؤٹ پٹ ٹیکسٹ کی مستقل فارمیٹنگ فراہم کرنے کے لیے استعمال کیا جاتا ہے۔ یہ کام خاص طور پر کلیدی ہستی نکالنے کے آٹومیشن کے لیے مفید ہے جس کے لیے آؤٹ پٹ کو مطلوبہ فارمیٹس کے ساتھ منسلک کرنے کی ضرورت ہوتی ہے۔ مثال کے طور پر، ہم تاریخوں کو MM/DD/YYYY فارمیٹ میں فارمیٹ کرنے کے لیے LLM کو ٹھیک کرنے کے لیے فوری انجینئرنگ کے بہترین طریقوں کی پیروی کر سکتے ہیں، جو ڈیٹا بیس کے DATE کالم کے ساتھ ہم آہنگ ہو سکتی ہے۔ مندرجہ ذیل کوڈ بلاک ایک مثال دکھاتا ہے کہ ایل ایل ایم اور پرامپٹ انجینئرنگ کا استعمال کرتے ہوئے یہ کیسے کیا جاتا ہے۔ نہ صرف ہم تاریخ کی قدروں کے لیے آؤٹ پٹ فارمیٹ کو معیاری بناتے ہیں، بلکہ ہم ماڈل کو JSON فارمیٹ میں حتمی آؤٹ پٹ بنانے کے لیے بھی کہتے ہیں تاکہ یہ ہماری ڈاؤن اسٹریم ایپلی کیشنز میں آسانی سے قابل استعمال ہو۔ ہم استعمال کرتے ہیں LangChain اظہار کی زبان (LCEL) دو اعمال کو ایک ساتھ جوڑنا۔ پہلی کارروائی LLM کو دستاویز سے صرف تاریخوں کا JSON فارمیٹ آؤٹ پٹ تیار کرنے کا اشارہ کرتی ہے۔ دوسری کارروائی JSON آؤٹ پٹ لیتی ہے اور تاریخ کی شکل کو معیاری بناتی ہے۔ نوٹ کریں کہ یہ دو قدمی کارروائی ایک ہی قدم میں مناسب پرامپٹ انجینئرنگ کے ساتھ بھی کی جا سکتی ہے، جیسا کہ ہم نارملائزیشن اور ٹیمپلیٹنگ میں دیکھیں گے۔

from langchain.document_loaders import AmazonTextractPDFLoader
from langchain.llms import Bedrock
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain loader = AmazonTextractPDFLoader("./samples/discharge-summary.png")
document = loader.load() bedrock_llm = Bedrock(client=bedrock, model_id="anthropic.claude-v2") template1 = """ Given a full document, answer the question and format the output in the format specified. Skip any preamble text and just generate the JSON. <format>
{{ "key_name":"key_value"
}}
</format>
<document>{doc_text}</document>
<question>{question}</question>""" template2 = """ Given a JSON document, format the dates in the value fields precisely in the provided format. Skip any preamble text and just generate the JSON. <format>DD/MM/YYYY</format>
<json_document>{json_doc}</json_document> """ prompt1 = PromptTemplate(template=template1, input_variables=["doc_text", "question"])
llm_chain = LLMChain(prompt=prompt1, llm=bedrock_llm, verbose=True) prompt2 = PromptTemplate(template=template2, input_variables=["json_doc"])
llm_chain2 = LLMChain(prompt=prompt2, llm=bedrock_llm, verbose=True) chain = ( llm_chain | {'json_doc': lambda x: x['text'] } | llm_chain2
) std_op = chain.invoke({ "doc_text": document[0].page_content, "question": "Can you give me the patient admitted and discharge dates?"}) print(std_op['text']) { "admit_date":"07/09/2020", "discharge_date":"08/09/2020"
}

پچھلے کوڈ کے نمونے کا آؤٹ پٹ JSON ڈھانچہ ہے جس کی تاریخیں 07/09/2020 اور 08/09/2020 ہیں، جو DD/MM/YYYY کی شکل میں ہیں اور مریض کے ہسپتال سے داخل ہونے اور خارج ہونے کی تاریخ ہیں، بالترتیب، مطابق ڈسچارج سمری رپورٹ کے لیے۔

دوبارہ حاصل کرنے والی اگمینٹڈ جنریشن کے ساتھ سوال و جواب

LLMs حقائق پر مبنی معلومات کو برقرار رکھنے کے لیے جانا جاتا ہے، جسے اکثر ان کا عالمی علم یا عالمی نظریہ کہا جاتا ہے۔ جب ٹھیک بنایا جائے تو وہ جدید ترین نتائج پیدا کر سکتے ہیں۔ تاہم، اس میں رکاوٹیں ہیں کہ ایک LLM اس علم تک کس حد تک مؤثر طریقے سے رسائی اور ہیرا پھیری کر سکتا ہے۔ نتیجے کے طور پر، ایسے کاموں میں جو خاص علم پر بہت زیادہ انحصار کرتے ہیں، ان کی کارکردگی کچھ استعمال کے معاملات کے لیے بہترین نہیں ہو سکتی۔ مثال کے طور پر، سوال و جواب کے منظرناموں میں، ماڈل کے لیے یہ ضروری ہے کہ وہ دستاویز میں فراہم کردہ سیاق و سباق پر مکمل طور پر اپنے عالمی علم پر انحصار کیے بغیر سختی سے عمل کرے۔ اس سے انحراف غلط بیانی، غلطیاں، یا یہاں تک کہ غلط جوابات کا باعث بن سکتا ہے۔ اس مسئلے کو حل کرنے کے لیے سب سے زیادہ استعمال ہونے والا طریقہ کے طور پر جانا جاتا ہے۔ بازیافت اگمینٹڈ جنریشن (RAG)۔ یہ نقطہ نظر بازیافت کے ماڈلز اور زبان کے ماڈلز دونوں کی طاقتوں کو ہم آہنگ کرتا ہے، پیدا ہونے والے ردعمل کی درستگی اور معیار کو بڑھاتا ہے۔

ایل ایل ایم اپنی میموری کی رکاوٹوں اور ان کے چلنے والے ہارڈ ویئر کی حدود کی وجہ سے ٹوکن کی حدود بھی لگا سکتے ہیں۔ اس مسئلے سے نمٹنے کے لیے، چنکنگ جیسی تکنیکوں کا استعمال بڑی دستاویزات کو چھوٹے حصوں میں تقسیم کرنے کے لیے کیا جاتا ہے جو LLMs کی ٹوکن حدود میں فٹ ہوتے ہیں۔ دوسری طرف، این ایل پی میں ایمبیڈنگز کا استعمال بنیادی طور پر الفاظ کے معنوی معنی اور دوسرے الفاظ کے ساتھ ان کے تعلقات کو ایک اعلیٰ جہتی جگہ میں حاصل کرنے کے لیے کیا جاتا ہے۔ یہ سرایت الفاظ کو ویکٹر میں تبدیل کرتے ہیں، جس سے ماڈلز کو متنی ڈیٹا کو مؤثر طریقے سے پروسیس کرنے اور سمجھنے کی اجازت ملتی ہے۔ الفاظ اور فقروں کے درمیان معنوی باریکیوں کو سمجھ کر، ایمبیڈنگز LLMs کو مربوط اور سیاق و سباق سے متعلقہ نتائج پیدا کرنے کے قابل بناتی ہیں۔ درج ذیل کلیدی اصطلاحات کو نوٹ کریں:

Chunking - یہ عمل دستاویزات سے متن کی بڑی مقدار کو متن کے چھوٹے، معنی خیز حصوں میں تقسیم کرتا ہے۔
سرایت - یہ ہر ایک حصے کی فکسڈ ڈائمینشنل ویکٹر ٹرانسفارمیشنز ہیں جو ٹکڑوں سے معنوی معلومات کو برقرار رکھتی ہیں۔ یہ سرایت بعد میں ایک ویکٹر ڈیٹا بیس میں لوڈ کی جاتی ہیں۔
ویکٹر ڈیٹا بیس - یہ الفاظ کی سرایت یا ویکٹر کا ڈیٹا بیس ہے جو الفاظ کے سیاق و سباق کی نمائندگی کرتا ہے۔ یہ ایک علمی ذریعہ کے طور پر کام کرتا ہے جو NLP کے کاموں کو دستاویز کی پروسیسنگ پائپ لائنوں میں مدد کرتا ہے۔ یہاں ویکٹر ڈیٹا بیس کا فائدہ یہ ہے کہ یہ متن کی تخلیق کے دوران ایل ایل ایم کو صرف ضروری سیاق و سباق فراہم کرنے کی اجازت دیتا ہے، جیسا کہ ہم مندرجہ ذیل حصے میں بیان کرتے ہیں۔

RAG بازیافت کے مرحلے کے دوران متعلقہ دستاویز کے حصوں کو سمجھنے اور بازیافت کرنے کے لیے سرایت کرنے کی طاقت کا استعمال کرتا ہے۔ ایسا کرنے سے، RAG LLMs کی نشانی حدود کے اندر کام کر سکتا ہے، اس بات کو یقینی بناتا ہے کہ نسل کے لیے انتہائی مناسب معلومات کا انتخاب کیا گیا ہے، جس کے نتیجے میں زیادہ درست اور سیاق و سباق سے متعلقہ نتائج برآمد ہوتے ہیں۔

مندرجہ ذیل خاکہ LLMs میں ان پٹ کو تیار کرنے کے لیے ان تکنیکوں کے انضمام کی وضاحت کرتا ہے، ان کی سیاق و سباق کی تفہیم کو بڑھاتا ہے اور سیاق و سباق میں مزید متعلقہ جوابات کو فعال کرتا ہے۔ ایک نقطہ نظر میں مماثلت کی تلاش شامل ہے، ویکٹر ڈیٹا بیس اور چنکنگ دونوں کا استعمال۔ ویکٹر ڈیٹا بیس لفظی معلومات کی نمائندگی کرنے والے ایمبیڈنگز کو اسٹور کرتا ہے، اور چنکنگ متن کو قابل انتظام حصوں میں تقسیم کرتا ہے۔ مماثلت کی تلاش سے اس سیاق و سباق کو استعمال کرتے ہوئے، LLMs سوالوں کے جوابات اور ڈومین کے لیے مخصوص آپریشن جیسے درجہ بندی اور افزودگی جیسے کام چلا سکتے ہیں۔

Intelligent document processing with Amazon Textract, Amazon Bedrock, and LangChain | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

اس پوسٹ کے لیے، ہم دستاویزات کے ساتھ سیاق و سباق کے سوال و جواب کو انجام دینے کے لیے RAG پر مبنی طریقہ استعمال کرتے ہیں۔ درج ذیل کوڈ کے نمونے میں، ہم دستاویز سے متن نکالتے ہیں اور پھر دستاویز کو متن کے چھوٹے حصوں میں تقسیم کرتے ہیں۔ چنکنگ کی ضرورت ہے کیونکہ ہمارے پاس کثیر صفحات پر مشتمل بڑی دستاویزات ہو سکتی ہیں اور ہمارے LLM میں ٹوکن کی حد ہو سکتی ہے۔ یہ ٹکڑوں کو بعد کے مراحل میں مماثلت کی تلاش کے لیے ویکٹر ڈیٹا بیس میں لوڈ کیا جاتا ہے۔ مندرجہ ذیل مثال میں، ہم Amazon Titan Embed Text v1 ماڈل استعمال کرتے ہیں، جو دستاویز کے ٹکڑوں کی ویکٹر ایمبیڈنگ کرتا ہے:

from langchain.text_splitter import RecursiveCharacterTextSplitter from langchain.embeddings import BedrockEmbeddings
from langchain.vectorstores import FAISS
from langchain.document_loaders import AmazonTextractPDFLoader
from langchain.chains import RetrievalQA loader = AmazonTextractPDFLoader("amazon_10k.pdf")
document = loader.load() text_splitter = RecursiveCharacterTextSplitter(chunk_size=400, separators=["nn", "n", ".", "!", "?", ",", " ", ""], chunk_overlap=0)
texts = text_splitter.split_documents(document)
embeddings = BedrockEmbeddings(client=bedrock, model_id="amazon.titan-embed-text-v1")
db = FAISS.from_documents(documents=texts, embedding=embeddings) retriever = db.as_retriever(search_type='mmr', search_kwargs={"k": 3}) template = """ Answer the question as truthfully as possible strictly using only the provided text, and if the answer is not contained within the text, say "I don't know". Skip any preamble text and reasoning and give just the answer. <text>{context}</text>
<question>{question}</question>
<answer>""" # define the prompt template
qa_prompt = PromptTemplate(template=template, input_variables=["context","question"]) chain_type_kwargs = { "prompt": qa_prompt, "verbose": False } # change verbose to True if you need to see what's happening bedrock_llm = Bedrock(client=bedrock, model_id="anthropic.claude-v2")
qa = RetrievalQA.from_chain_type( llm=bedrock_llm, chain_type="stuff", retriever=retriever, chain_type_kwargs=chain_type_kwargs, verbose=False # change verbose to True if you need to see what's happening
) question="Who is the administrator for this plan?"
result = qa.run(question)
print(result.strip())

کوڈ متن کے ٹکڑوں کا استعمال کرتے ہوئے LLM کے لیے ایک متعلقہ سیاق و سباق بناتا ہے جو ویکٹر ڈیٹا بیس سے مماثلت کی تلاش کی کارروائی کے ذریعے واپس کیے جاتے ہیں۔ اس مثال کے لیے، ہم ایک اوپن سورس استعمال کرتے ہیں۔ FAISS ویکٹر اسٹور متن کے ہر حصے کے ویکٹر ایمبیڈنگز کو ذخیرہ کرنے کے لیے بطور نمونہ ویکٹر ڈیٹا بیس۔ اس کے بعد ہم ویکٹر ڈیٹا بیس کی تعریف a LangChain بازیافت کرنے والا، جو میں منتقل کیا جاتا ہے۔ RetrievalQA زنجیر یہ اندرونی طور پر ویکٹر ڈیٹا بیس پر ایک مماثلت کی تلاش کا استفسار چلاتا ہے جو سوال سے متعلقہ متن کے سب سے اوپر n (جہاں n=3 ہماری مثال میں) واپس کرتا ہے۔ آخر میں، LLM سلسلہ متعلقہ سیاق و سباق (متعلقہ حصوں کا ایک گروپ) اور LLM کے جواب کے لیے سوال کے ساتھ چلایا جاتا ہے۔ RAG کے ساتھ سوال و جواب کے قدم بہ قدم کوڈ واک تھرو کے لیے، پر Python نوٹ بک دیکھیں GitHub کے.

FAISS کے متبادل کے طور پر، آپ بھی استعمال کر سکتے ہیں۔ ایمیزون اوپن سرچ سروس ویکٹر ڈیٹا بیس کی صلاحیتیں۔, Amazon Relational Database Service (Amazon RDS) PostgreSQL کے لیے کے ساتھ pgvector ویکٹر ڈیٹا بیس، یا اوپن سورس کروما ڈیٹا بیس کے بطور توسیع۔

ٹیبلر ڈیٹا کے ساتھ سوال و جواب

دستاویزات کے اندر ٹیبلر ڈیٹا LLMs کے لیے اس کی ساختی پیچیدگی کی وجہ سے پراسیس کرنا مشکل ہو سکتا ہے۔ Amazon Textract کو LLMs کے ساتھ بڑھایا جا سکتا ہے کیونکہ یہ صفحہ، ٹیبل، اور سیلز جیسے عناصر کے نیسٹڈ فارمیٹ میں دستاویزات سے ٹیبل نکالنے کے قابل بناتا ہے۔ ٹیبلر ڈیٹا کے ساتھ سوال و جواب کرنا ایک کثیر مرحلہ عمل ہے، اور اس کے ذریعے حاصل کیا جا سکتا ہے۔ خود سے پوچھ گچھ. مندرجہ ذیل اقدامات کا ایک جائزہ ہے:

Amazon Textract کا استعمال کرتے ہوئے دستاویزات سے ٹیبل نکالیں۔ Amazon Textract کے ساتھ، ٹیبلر ڈھانچہ (قطاریں، کالم، ہیڈر) کسی دستاویز سے نکالا جا سکتا ہے۔
ٹیبلر ڈیٹا کو ویکٹر ڈیٹا بیس میں میٹا ڈیٹا کی معلومات کے ساتھ اسٹور کریں، جیسے ہیڈر کے نام اور ہر ہیڈر کی تفصیل۔
ٹیبل سے ڈیٹا اخذ کرنے کے لیے، LLM کا استعمال کرتے ہوئے، ایک سٹرکچرڈ استفسار بنانے کے لیے پرامپٹ کا استعمال کریں۔
ویکٹر ڈیٹا بیس سے متعلقہ ٹیبل ڈیٹا نکالنے کے لیے استفسار کا استعمال کریں۔

مثال کے طور پر، ایک بینک اسٹیٹمنٹ میں، "$1000 سے زیادہ ڈپازٹس والے لین دین کیا ہیں" کے پرامپٹ کو دیکھتے ہوئے، LLM مندرجہ ذیل مراحل کو مکمل کرے گا:

ایک سوال تیار کریں، جیسے “Query: transactions” , “filter: greater than (Deposit$)”.
استفسار کو ایک منظم استفسار میں تبدیل کریں۔
ساختی استفسار کو ویکٹر ڈیٹا بیس پر لاگو کریں جہاں ہمارا ٹیبل ڈیٹا محفوظ ہے۔

ٹیبلر کے ساتھ سوال و جواب کے مرحلہ وار نمونہ کوڈ واک تھرو کے لیے، اس میں پائیتھن نوٹ بک دیکھیں GitHub کے.

ٹیمپلیٹنگ اور نارملائزیشن

اس سیکشن میں، ہم دیکھتے ہیں کہ کس طرح پرامپٹ انجینئرنگ تکنیک اور LangChain کے بلٹ ان میکانزم کا استعمال کرتے ہوئے ایک مخصوص اسکیما میں کسی دستاویز سے اخراج کے ساتھ آؤٹ پٹ تیار کیا جائے۔ ہم پہلے زیر بحث تکنیکوں کا استعمال کرتے ہوئے نکالے گئے ڈیٹا پر کچھ معیاری کاری بھی کرتے ہیں۔ ہم اپنے مطلوبہ آؤٹ پٹ کے لیے ایک ٹیمپلیٹ کی وضاحت کرکے شروع کرتے ہیں۔ یہ ایک اسکیما کے طور پر کام کرے گا اور ہر ایک ہستی کے بارے میں تفصیلات کو سمیٹے گا جسے ہم دستاویز کے متن سے نکالنا چاہتے ہیں۔

output_template= { "doctor_name":{ "type": "string", "description": "The doctor or provider's full name" }, "provider_id":{ "type": "string", "description": "The doctor or provider's ID" }, "patient_name":{ "type": "string", "description": "The patient's full name" }, …
}

نوٹ کریں کہ ہر ایک ہستی کے لیے، ہم یہ وضاحت کرنے کے لیے استعمال کرتے ہیں کہ وہ ہستی کیا ہے تاکہ دستاویز کے متن سے قدر نکالنے میں LLM کی مدد کی جا سکے۔ مندرجہ ذیل نمونہ کوڈ میں، ہم اس ٹیمپلیٹ کا استعمال کرتے ہوئے دستاویز سے نکالے گئے متن کے ساتھ ایل ایل ایم کے لیے اپنا پرامپٹ تیار کرنے کے لیے استعمال کرتے ہیں۔ AmazonTextractPDFLoader اور اس کے بعد ماڈل کے ساتھ اندازہ لگائیں:

from langchain.llms import Bedrock
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain template = """ You are a helpful assistant. Please extract the following details from the document and format the output as JSON using the keys. Skip any preamble text and generate the final answer. <details>
{details}
</details> <keys>
{keys}
</keys> <document>
{doc_text}
<document> <final_answer>""" details = "n".join([f"{key}: {value['description']}" for key, value in output_template.items()])
keys = "n".join([f"{key}" for key, value in output_template.items()]) prompt = PromptTemplate(template=template, input_variables=["details", "keys", "doc_text"])
bedrock_llm = Bedrock(client=bedrock, model_id="anthropic.claude-v2") llm_chain = LLMChain(prompt=prompt, llm=bedrock_llm)
output = llm_chain.run({"doc_text": full_text, "details": details, "keys": keys}) print(output) { "doctor_name": "Mateo Jackson, Phd", "provider_id": "XA/7B/00338763", "patient_name": "John Doe", … }

آپ دیکھ سکتے ہیں، {keys} پرامپٹ کا حصہ ہماری ٹیمپلیٹ کی کلیدیں ہیں، اور {details} ان کی تفصیل کے ساتھ چابیاں ہیں۔ اس صورت میں، ہم JSON فارمیٹ میں آؤٹ پٹ جنریٹ کرنے کی ہدایات میں وضاحت کرنے کے علاوہ آؤٹ پٹ کے فارمیٹ کے ساتھ ماڈل کو واضح طور پر نہیں بتاتے ہیں۔ یہ سب سے زیادہ حصہ کے لئے کام کرتا ہے؛ تاہم، چونکہ LLMs سے آؤٹ پٹ غیر متعین ٹیکسٹ جنریشن ہے، ہم پرامپٹ میں ہدایات کے حصے کے طور پر فارمیٹ کو واضح طور پر بیان کرنا چاہتے ہیں۔ اس کو حل کرنے کے لیے، ہم LangChain's استعمال کر سکتے ہیں۔ تشکیل شدہ آؤٹ پٹ پارسر خودکار پرامپٹ انجینئرنگ کا فائدہ اٹھانے کے لیے ماڈیول جو ہمارے ٹیمپلیٹ کو فارمیٹ انسٹرکشن پرامپٹ میں تبدیل کرنے میں مدد کرتا ہے۔ ہم مندرجہ ذیل فارمیٹ انسٹرکشن پرامپٹ بنانے کے لیے پہلے بیان کردہ ٹیمپلیٹ کا استعمال کرتے ہیں:

from langchain.output_parsers import ResponseSchema
from langchain.output_parsers import StructuredOutputParser response_schems = list() for key, value in output_template.items(): schema = ResponseSchema(name=key, description=value['description'], type=value['type']) response_schems.append(schema)
output_parser = StructuredOutputParser.from_response_schemas(response_schems)
format_instructions= output_parser.get_format_instructions()
print(format_instructions)

۔ format_instructions متغیر اب فارمیٹ انسٹرکشن پرامپٹ رکھتا ہے:

The output should be a markdown code snippet formatted in the following schema, including the leading and trailing "```json" and "```": ```json
{ "doctor_name": string // The doctor or provider's full name "provider_id": string // The doctor or provider's ID "patient_name": string // The patient's full name …
}
```

اس کے بعد ہم اس متغیر کو اپنے اصل پرامپٹ کے اندر LLM کے لیے ایک ہدایات کے طور پر استعمال کرتے ہیں تاکہ یہ ہمارے پرامپٹ میں ایک چھوٹی سی ترمیم کر کے مطلوبہ اسکیما میں آؤٹ پٹ کو نکال کر فارمیٹ کرے:

template = """ You are a helpful assistant. Please extract the following details from the document and strictly follow the instructions described in the format instructions to format the output. Skip any preamble text and generate the final answer. Do not generate incomplete answer. <details>
{details}
</details> <format_instructions>
{format_instructions}
</format_instructions> <document>
{doc_text}
<document> <final_answer>"""

اب تک، ہم نے صرف مطلوبہ اسکیما میں دستاویز سے ڈیٹا نکالا ہے۔ تاہم، ہمیں ابھی بھی کچھ معیاری کاری کرنے کی ضرورت ہے۔ مثال کے طور پر، ہم چاہتے ہیں کہ مریض کی داخلے کی تاریخ اور ڈسچارج کی تاریخ DD/MM/YYYY فارمیٹ میں نکالی جائے۔ اس صورت میں، ہم اضافہ کرتے ہیں description فارمیٹنگ کی ہدایات کے ساتھ کلید کا:

new_output_template= { … "admitted_date":{ "type": "string", "description": "Date the patient was admitted to the hospital, this should be formatted in DD/MM/YYYY format." }, "discharge_date":{ "type": "string", "description": "Date the patient was discharged from the hospital, this should be formatted in DD/MM/YYYY format." …
}

میں پائیتھن نوٹ بک کا حوالہ دیں۔ GitHub کے ایک مکمل قدم بہ قدم واک تھرو اور وضاحت کے لیے۔

املا کی جانچ اور تصحیح

LLMs نے انسان نما متن کو سمجھنے اور تخلیق کرنے میں قابل ذکر صلاحیتوں کا مظاہرہ کیا ہے۔ LLMs کی کم زیر بحث لیکن بے حد مفید ایپلی کیشنز میں سے ایک ان کی گرائمیکل جانچ اور دستاویزات میں جملے کی اصلاح کی صلاحیت ہے۔ روایتی گرائمر چیکرس کے برعکس جو پہلے سے طے شدہ اصولوں کے ایک سیٹ پر انحصار کرتے ہیں، ایل ایل ایم ایسے نمونوں کا استعمال کرتے ہیں جن کی انہوں نے متنی اعداد و شمار کی وسیع مقدار سے شناخت کی ہے تاکہ یہ تعین کیا جا سکے کہ صحیح یا روانی کی زبان کیا ہے۔ اس کا مطلب ہے کہ وہ ان باریکیوں، سیاق و سباق اور باریکیوں کا پتہ لگا سکتے ہیں جو اصول پر مبنی نظام سے چھوٹ سکتے ہیں۔

مریض کے ڈسچارج سمری سے نکالے گئے متن کا تصور کریں جس میں لکھا ہے "مریض جون ڈو، جسے نمونیا کے ساتھ داخل کیا گیا تھا، میں نمایاں بہتری آئی ہے اور اسے محفوظ طریقے سے ڈسچارج کیا جا سکتا ہے۔ فالو اپ اگلے ہفتے کے لیے طے شدہ ہیں۔ ایک روایتی ہجے چیک کرنے والا شاید "اعتراف،" "نمونیا،" "بہتری،" اور "nex" کو غلطیوں کے طور پر پہچان سکتا ہے۔ تاہم، ان غلطیوں کا سیاق و سباق مزید غلطیاں یا عمومی تجاویز کا باعث بن سکتا ہے۔ ایک LLM، جو اس کی وسیع تربیت سے لیس ہے، تجویز کر سکتا ہے: "مریض جان ڈو، جو شدید نمونیا کے ساتھ داخل تھا، میں نمایاں بہتری آئی ہے اور اسے بحفاظت ڈسچارج کیا جا سکتا ہے۔ فالو اپ اگلے ہفتے کے لئے طے شدہ ہیں۔

ذیل میں ایک ناقص ہاتھ سے لکھا ہوا نمونہ دستاویز ہے جس میں وہی متن ہے جیسا کہ پہلے بیان کیا گیا ہے۔

Intelligent document processing with Amazon Textract, Amazon Bedrock, and LangChain | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

ہم Amazon Textract دستاویز لوڈر کے ساتھ دستاویز کو نکالتے ہیں اور پھر LLM کو پرامپٹ انجینئرنگ کے ذریعے ہدایت دیتے ہیں کہ نکالے گئے متن کو درست کرنے کے لیے ہجے اور یا گرامر کی غلطیوں کو درست کریں:

from langchain.document_loaders import AmazonTextractPDFLoader
from langchain.llms import Bedrock
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain loader = AmazonTextractPDFLoader("./samples/hand_written_note.pdf")
document = loader.load() template = """ Given a detailed 'Document', perform spelling and grammatical corrections. Ensure the output is coherent, polished, and free from errors. Skip any preamble text and give the answer. <document>{doc_text}</<document>
<answer> """ prompt = PromptTemplate(template=template, input_variables=["doc_text"])
llm = Bedrock(client=bedrock, model_id="anthropic.claude-v2")
llm_chain = LLMChain(prompt=prompt, llm=llm) try: txt = document[0].page_content std_op = llm_chain.run({"doc_text": txt}) print("Extracted text") print("==============") print(txt) print("nCorrected text") print("==============") print(std_op.strip()) print("n")
except Exception as e: print(str(e))

پچھلے کوڈ کا آؤٹ پٹ دستاویز لوڈر کے ذریعہ نکالا گیا اصل متن دکھاتا ہے جس کے بعد LLM کے ذریعہ تیار کردہ درست متن:

Extracted text
==============
Patient John Doe, who was ad mitta with sever pnequonia, has shown Signif i art improumet & can be safely discharged. Follow w/s are scheduled for nen week. Patient John Doe, who was ad mitta with sever pnequonia, has shown Signif i art improumet & can be safely discharged. Follow w/s are scheduled for nen week. Corrected text
==============
Patient John Doe, who was admitted with severe pneumonia, has shown significant improvement and can be safely discharged. Follow-up appointments are scheduled for next week.

ذہن میں رکھیں کہ LLM جتنے طاقتور ہیں، ان کی تجاویز کو صرف اسی طرح دیکھنا ضروری ہے۔ اگرچہ وہ زبان کی پیچیدگیوں کو متاثر کن طریقے سے گرفت میں لیتے ہیں، لیکن وہ غلط نہیں ہیں۔ کچھ تجاویز اصل متن کے مطلوبہ معنی یا لہجے کو تبدیل کر سکتی ہیں۔ لہذا، انسانی جائزہ لینے والوں کے لیے یہ بہت ضروری ہے کہ وہ LLM سے تیار کردہ اصلاحات کو بطور رہنما استعمال کریں، نہ کہ مطلق۔ LLM صلاحیتوں کے ساتھ انسانی بصیرت کا اشتراک ایک ایسے مستقبل کا وعدہ کرتا ہے جہاں ہمارا تحریری مواصلت نہ صرف غلطی سے پاک ہے، بلکہ مزید امیر اور زیادہ اہم بھی ہے۔

نتیجہ

جنریٹو AI تبدیل کر رہا ہے کہ آپ IDP کے ساتھ بصیرت حاصل کرنے کے لیے دستاویزات پر کیسے کارروائی کر سکتے ہیں۔ پوسٹ میں جنریٹو AI کے ساتھ AWS ذہین دستاویز پروسیسنگ کو بڑھانا، ہم نے پائپ لائن کے مختلف مراحل پر تبادلہ خیال کیا اور کس طرح AWS کسٹمر Ricoh LLMs کے ساتھ اپنی IDP پائپ لائن کو بڑھا رہا ہے۔ اس پوسٹ میں، ہم نے LLMs کے ساتھ Amazon Bedrock، Amazon Textract، اور مقبول LangChain فریم ورک کے ذریعے IDP ورک فلو کو بڑھانے کے مختلف طریقہ کار پر تبادلہ خیال کیا۔ آپ آج ہی LangChain کے ساتھ نئے Amazon Textract Document لوڈر کے ساتھ شروع کر سکتے ہیں جو ہمارے میں دستیاب نمونہ نوٹ بکس کا استعمال کر سکتے ہیں۔ GitHub ذخیرہ. AWS پر جنریٹیو AI کے ساتھ کام کرنے کے بارے میں مزید معلومات کے لیے، رجوع کریں۔ AWS پر جنریٹیو AI کے ساتھ تعمیر کے لیے نئے ٹولز کا اعلان.

مصنفین کے بارے میں

Intelligent document processing with Amazon Textract, Amazon Bedrock, and LangChain | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. سونالی ساہو AWS میں AI/ML سروسز ٹیم کے ساتھ ذہین دستاویز پراسیسنگ کی قیادت کر رہا ہے۔ وہ ایک مصنف، سوچنے والی رہنما، اور پرجوش ٹیکنولوجسٹ ہیں۔ اس کی توجہ کا بنیادی شعبہ AI اور ML ہے، اور وہ اکثر دنیا بھر میں AI اور ML کانفرنسوں اور ملاقاتوں میں بولتی ہے۔ اس کے پاس صحت کی دیکھ بھال، مالیاتی شعبے اور انشورنس میں صنعت کی مہارت کے ساتھ ٹیکنالوجی اور ٹیکنالوجی کی صنعت میں وسیع اور گہرائی کا تجربہ ہے۔

Intelligent document processing with Amazon Textract, Amazon Bedrock, and LangChain | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. انجان بسواس اے آئی/ایم ایل اور ڈیٹا اینالیٹکس پر توجہ کے ساتھ ایک سینئر AI سروسز سلوشنز آرکیٹیکٹ ہے۔ انجان دنیا بھر کی AI سروسز ٹیم کا حصہ ہے اور صارفین کے ساتھ کام کرتا ہے تاکہ وہ AI اور ML کے ساتھ کاروباری مسائل کو سمجھنے اور ان کے حل کو تیار کرنے میں مدد کریں۔ انجان کے پاس عالمی سپلائی چین، مینوفیکچرنگ، اور ریٹیل تنظیموں کے ساتھ کام کرنے کا 14 سال سے زیادہ کا تجربہ ہے، اور وہ صارفین کو AWS AI خدمات شروع کرنے اور اسکیل کرنے میں فعال طور پر مدد کر رہا ہے۔

Intelligent document processing with Amazon Textract, Amazon Bedrock, and LangChain | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. چنمئی رانے ایمیزون ویب سروسز میں ایک AI/ML ماہر حل آرکیٹیکٹ ہے۔ وہ لاگو ریاضی اور مشین لرننگ کے بارے میں پرجوش ہے۔ وہ AWS صارفین کے لیے ذہین دستاویز پروسیسنگ اور جنریٹیو AI سلوشن ڈیزائن کرنے پر توجہ مرکوز کرتی ہے۔ کام سے باہر، وہ سالسا اور بچتا ڈانس سے لطف اندوز ہوتی ہے۔