قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة

أمازون كندرا هي خدمة بحث ذكية مدعومة بالتعلم الآلي (ML). تعيد Amazon Kendra تخيل البحث عن مواقع الويب والتطبيقات الخاصة بك حتى يتمكن موظفوك وعملائك من العثور بسهولة على المحتوى الذي يبحثون عنه ، حتى عندما يكون منتشرًا عبر مواقع متعددة ومستودعات المحتوى داخل مؤسستك.

يدعم Amazon Kendra مجموعة متنوعة من تنسيقات المستندات ، مثل Microsoft Word و PDF والنص. أثناء العمل مع عميل Edtech رائد ، طُلب منا إنشاء حل بحث مؤسسي يستخدم أيضًا الصور وملفات PPT. يركز هذا المنشور على توسيع نطاق دعم المستندات في Amazon Kendra حتى تتمكن من المعالجة المسبقة للصور النصية والمستندات الممسوحة ضوئيًا (تنسيق JPEG أو PNG أو PDF) لجعلها قابلة للبحث. يجمع الحل أمازون تيكستراك للمعالجة المسبقة للمستندات والتعرف البصري على الأحرف (OCR) ، و Amazon Kendra للبحث الذكي.

باستخدام ميزة Custom Document Enrichment الجديدة في Amazon Kendra ، يمكنك الآن معالجة مستنداتك مسبقًا أثناء الاستيعاب وزيادة مستنداتك ببيانات وصفية جديدة. يتيح لك Custom Document Enrichment الاتصال بخدمات خارجية مثل فهم الأمازونو Amazon Textract و الأمازون النسخ لاستخراج نص من الصور ونسخ الصوت وتحليل الفيديو. لمزيد من المعلومات حول استخدام إثراء المستندات المخصصة ، يرجى الرجوع إلى قم بإثراء المحتوى والبيانات الوصفية لتحسين تجربة البحث الخاصة بك من خلال إثراء المستندات المخصصة في Amazon Kendra.

في هذا المنشور ، نقترح طريقة بديلة للمعالجة المسبقة للمحتوى قبل استدعاء عملية الابتلاع في Amazon Kendra.

حل نظرة عامة

Amazon Textract هي خدمة تعلُّم آلي تستخرج تلقائيًا النصوص والكتابة اليدوية والبيانات من المستندات الممسوحة ضوئيًا وتتجاوز التعرف الضوئي على الحروف الأساسي لتعريف البيانات وفهمها واستخراجها من النماذج والجداول. اليوم ، تستخرج العديد من الشركات البيانات يدويًا من المستندات الممسوحة ضوئيًا مثل ملفات PDF والصور والجداول والنماذج من خلال برنامج OCR الأساسي الذي يتطلب تكوينًا يدويًا ، والذي يتطلب غالبًا إعادة التكوين عندما يتغير النموذج.

للتغلب على هذه العمليات اليدوية والمكلفة ، تستخدم Amazon Textract التعلم الآلي لقراءة مجموعة كبيرة من المستندات ومعالجتها ، واستخراج النص والكتابة اليدوية والجداول والبيانات الأخرى بدقة دون أي جهد يدوي. يمكنك أتمتة معالجة المستندات بسرعة واتخاذ إجراءات بشأن المعلومات المستخرجة ، سواء أكانت معالجة القروض تلقائيًا أو استخراج المعلومات من الفواتير والإيصالات.

أمازون كندرا هي خدمة بحث مؤسسية سهلة الاستخدام تتيح لك إضافة إمكانات بحث إلى تطبيقاتك بحيث يمكن للمستخدمين النهائيين العثور بسهولة على المعلومات المخزنة في مصادر بيانات مختلفة داخل شركتك. يمكن أن يشمل ذلك الفواتير ووثائق العمل والأدلة الفنية وتقارير المبيعات ومسارد الشركات والمواقع الداخلية والمزيد. يمكنك حصاد هذه المعلومات من حلول التخزين مثل خدمة تخزين أمازون البسيطة (Amazon S3) و OneDrive ؛ تطبيقات مثل Salesforce و SharePoint و ServiceNow ؛ أو قواعد البيانات العلائقية مثل خدمة قاعدة بيانات الأمازون (أمازون آر دي إس).

يمكّنك الحل المقترح من فتح إمكانات البحث في المستندات الممسوحة ضوئيًا ، مما يوسع قدرة Amazon Kendra على العثور على إجابات دقيقة في نطاق أوسع من أنواع المستندات. يتضمن سير العمل الخطوات التالية:

  1. قم بتحميل مستند (أو مستندات من أنواع مختلفة) إلى Amazon S3.
  2. يؤدي الحدث إلى تشغيل ملف AWS لامدا وظيفة تستخدم واجهة برمجة تطبيقات Amazon Textract المتزامنة (DetectDocumentText).
  3. يقرأ Amazon Textract المستند في Amazon S3 ويستخرج النص منه ويعيد النص المستخرج إلى وظيفة Lambda.
  4. يجب إعادة فهرسة مصدر البيانات في الملف النصي الجديد.
  5. عند اكتمال إعادة الفهرسة ، يمكنك البحث في مجموعة البيانات الجديدة إما عبر وحدة تحكم Amazon Kendra أو واجهة برمجة التطبيقات.

يوضح الرسم البياني التالي بنية الحل.

قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

في الأقسام التالية ، نوضح كيفية تكوين وظيفة Lambda ، وإنشاء مشغل الحدث ، ومعالجة مستند ، ثم إعادة فهرسة البيانات.

تكوين وظيفة Lambda

لتكوين وظيفة Lambda الخاصة بك ، أضف الكود التالي إلى وظيفة محرر Python:

import urllib
import boto3 textract = boto3.client('textract')
def handler(event, context): source_bucket = event['Records'][0]['s3']['bucket']['name'] object_key = urllib.parse.unquote_plus(event['Records'][0]['s3']['object']['key']) textract_result = textract.detect_document_text( Document={ 'S3Object': { 'Bucket': source_bucket, 'Name': object_key } }) page="" blocks = [x for x in textract_result['Blocks'] if x['BlockType'] == "LINE"] for block in blocks: page += " " + block['Text'] print(page) s3 = boto3.resource('s3') object = s3.Object('demo-kendra-test', 'text/apollo11-summary.txt') object.put(Body=page)

نستخدم DetectDocumentText API لاستخراج النص من صورة (JPEG أو PNG) تم استردادها في Amazon S3.

أنشئ حدثًا مشغلاً في Amazon S3

في هذه الخطوة ، نقوم بإنشاء مشغل حدث لبدء وظيفة Lambda عند تحميل مستند جديد إلى حاوية معينة. تُظهر لقطة الشاشة التالية وظيفتنا الجديدة على وحدة التحكم Amazon S3.

قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

يمكنك أيضًا التحقق من مشغل الحدث على وحدة تحكم Lambda.

قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

معالجة وثيقة

لاختبار العملية ، نقوم بتحميل صورة إلى المجلد S3 الذي حددناه لمشغل حدث S3. نستخدم الصورة النموذجية التالية.

قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

عندما تكتمل وظيفة Lambda ، يمكننا الانتقال إلى ملف الأمازون CloudWatch وحدة للتحقق من الإخراج. تُظهر لقطة الشاشة التالية النص المستخرج ، مما يؤكد تشغيل وظيفة Lambda بنجاح.

قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

أعد فهرسة البيانات باستخدام Amazon Kendra

يمكننا الآن إعادة فهرسة بياناتنا.

  1. على وحدة تحكم Amazon Kendra ، تحت إدارة البيانات في جزء التنقل ، اختر مصادر البيانات.
  2. حدد مصدر البيانات demo-s3-datasource.
  3. اختار زامن الآن "لنقل البيانات.

تتغير حالة المزامنة إلى Synching - crawling.

قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

عند اكتمال المزامنة ، تتغير حالة المزامنة إلى Succeeded وتتغير حالة المزامنة إلى Idle.

قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

يمكننا الآن العودة إلى وحدة تحكم البحث ومشاهدة بحثنا الأوجه عمليًا.

  1. في جزء التنقل ، اختر البحث وحدة التحكم.
    قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

أضفنا بيانات وصفية لبضعة عناصر ؛ اثنان منهم هما خوارزميات ML XGBoost و BlazingText.

  1. دعنا نحاول البحث عن Sagemaker.
    قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

كان بحثنا ناجحًا ، وحصلنا على قائمة بالنتائج. دعونا نرى ما لدينا من جوانب.

  1. وسع تصفية نتائج البحث.

لدينا category و tags الأوجه التي كانت جزءًا من البيانات الوصفية للعناصر.

  1. اختار BlazingText لتصفية النتائج لتلك الخوارزمية فقط.
    قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.
  2. لنقم الآن بالبحث عن ملفات الصور التي تم تحميلها حديثًا. تُظهر لقطة الشاشة التالية البحث في المستندات الجديدة المعالجة مسبقًا.
    قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

وفي الختام

ستكون هذه المدونة مفيدة في تحسين فعالية نتائج البحث وتجربة البحث. يمكنك استخدام Amazon Textract لاستخراج النص من الصور الممسوحة ضوئيًا والتي تمت إضافتها كبيانات وصفية والمتاحة لاحقًا كواجهة للتفاعل مع نتائج البحث. هذا مجرد توضيح لكيفية استخدام خدمات AWS الأصلية لإنشاء تجربة بحث مميزة لمستخدميك. يساعد هذا أيضًا في إطلاق الإمكانات الكاملة لأصول المعرفة الخاصة بك.

للتعمق في ما يمكنك تحقيقه من خلال الجمع بين خدمات AWS الأخرى مع Amazon Kendra ، يرجى الرجوع إلى اجعل ملفات الصوت والفيديو الخاصة بك قابلة للبحث باستخدام Amazon Transcribe و Amazon Kendraبناء حل بحث ذكي مع إثراء المحتوى الآلي، والمشاركات الأخرى على مدونة أمازون كندرا.


حول المؤلف

قم بتمكين بحث Amazon Kendra عن مستند نصي ممسوح ضوئيًا أو مستندًا إلى صورة PlatoBlockchain Data Intelligence. البحث العمودي. عاي.سانجاي تيواري هو مهندس حلول متخصص AI / ML. يقضي وقته في العمل مع العملاء الاستراتيجيين لتحديد متطلبات العمل ، وتقديم جلسات L300 حول حالات استخدام محددة ، وتصميم تطبيقات وخدمات ML تكون قابلة للتطوير وموثوقة وذات أداء. لقد ساعد في إطلاق وتوسيع خدمة Amazon SageMaker التي تدعم الذكاء الاصطناعي / التعلم الآلي وقام بتنفيذ العديد من البراهين على المفهوم باستخدام خدمات Amazon AI. كما طور منصة التحليلات المتقدمة كجزء من رحلة التحول الرقمي.

الطابع الزمني:

اكثر من التعلم الآلي من AWS