دعم تنسيق بيانات موسع جديد في Amazon Kendra

دعم تنسيق بيانات موسع جديد في Amazon Kendra

تتطلع الشركات في جميع أنحاء العالم إلى استخدام مصادر بيانات متعددة لتنفيذ تجربة بحث موحدة لموظفيها وعملائها النهائيين. بالنظر إلى الحجم الكبير من البيانات التي يجب فحصها وفهرستها ، تصبح سرعة الاسترداد وقابلية تطوير الحلول وأداء البحث عوامل رئيسية يجب مراعاتها عند اختيار حل بحث ذكي للمؤسسة. بالإضافة إلى ذلك ، تشتمل مصادر البيانات الفريدة هذه على مستودعات المحتوى المهيكلة وغير المهيكلة - بما في ذلك أنواع الملفات المختلفة - والتي قد تسبب مشكلات في التوافق.

أمازون كندرا هي خدمة بحث عالية الدقة وذكية تمكن المستخدمين من البحث عن إجابات لأسئلتهم من بياناتك غير المهيكلة والمنظمة باستخدام معالجة اللغة الطبيعية وخوارزميات البحث المتقدمة. يعرض إجابات محددة على الأسئلة ، مما يمنح المستخدمين تجربة قريبة من التفاعل مع خبير بشري.

أطلقت Amazon Kendra اليوم سبعة خيارات إضافية لدعم تنسيق البيانات لتستخدمها. يتيح لك ذلك دمج مصادر البيانات الحالية بسهولة كما هي وإجراء بحث ذكي عبر مستودعات محتوى متعددة.

في هذا المنشور ، نناقش تنسيقات البيانات المدعومة الجديدة وكيفية استخدامها.

تنسيقات البيانات الجديدة المدعومة

سابقًا ، أمازون كندرا المستندات المدعومة التي تضمنت نصًا منظمًا في شكل أسئلة وأجوبة متكررة ، بالإضافة إلى نص غير منظم في شكل ملفات HTML وعروض Microsoft PowerPoint التقديمية ومستندات Microsoft Word ومستندات ذات نص عادي وملفات PDF.

مع هذا الإطلاق ، تقدم Amazon Kendra الآن دعمًا لسبعة تنسيقات بيانات إضافية:

  • تنسيق نص منسق (RTF)
  • تدوين كائن جافا سكريبت (JSON)
  • تخفيض السعر (MD)
  • قيم مفصولة بفواصل (CSV)
  • مايكروسوفت اكسل (مس اكسل)
  • لغة الترميز الموسعة
  • تحويلات لغة ورقة الأنماط الموسعة (XSLT)

يمكن لمستخدمي Amazon Kendra استيعاب هذه المستندات بتنسيقات بيانات مختلفة لفهرسهم بالطريقتين التاليتين:

حل نظرة عامة

في الأقسام التالية ، نتصفح خطوات إضافة مستندات من مصدر بيانات وإجراء بحث على تلك المستندات.

يوضح الرسم البياني التالي بنية الحل لدينا.

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

لاختبار هذا الحل لأي من التنسيقات المدعومة ، تحتاج إلى استخدام بياناتك الخاصة. يمكنك الاختبار عن طريق تحميل مستندات من نفس التنسيقات أو تنسيقات مختلفة إلى حاوية S3.

أنشئ فهرس Amazon Kendra

للحصول على إرشادات حول إنشاء فهرس Amazon Kendra الخاص بك ، يرجى الرجوع إلى إنشاء فهرس.

يمكنك تخطي هذه الخطوة إذا كان لديك فهرس موجود مسبقًا لاستخدامه في هذا العرض التوضيحي.

قم بتحميل المستندات إلى حاوية S3 واستوعبها إلى الفهرس باستخدام موصل S3

أكمل الخطوات التالية لتوصيل حاوية S3 بالفهرس الخاص بك:

  1. قم بإنشاء دلو S3 لتخزين المستندات الخاصة بك.
  2. قم بإنشاء مجلد بيانات العينة المسماة.
  3. قم بتحميل المستندات التي تريد اختبارها إلى المجلد.
  4. في وحدة تحكم Amazon Kendra ، انتقل إلى الفهرس الخاص بك واختر مصادر البيانات.
  5. اختار أضف مصدر البيانات.
  6. تحت مصادر البيانات المتاحة، حدد S3 واختر أضف موصل.
  7. أدخل اسمًا للموصل الخاص بك (مثل Demo_S3_connector) و اختار التالى.
  8. اختار تصفح S3 واختر حاوية S3 حيث قمت بتحميل المستندات.
  9. في حالة دور IAM، أنشئ دورًا جديدًا.
  10. في حالة تعيين جدول تشغيل المزامنة، حدد تعمل حسب الطلب.
  11. اختار التالى.
  12. على مراجعة وإنشاء الصفحة ، اختر أضف مصدر البيانات.
  13. بعد اكتمال عملية الإنشاء ، اختر زامن الآن "لنقل البيانات.

الآن بعد أن استوعبت بعض المستندات ، يمكنك الانتقال إلى وحدة تحكم البحث المدمجة لاختبار الاستعلامات.

ابحث في مستنداتك باستخدام وحدة تحكم البحث في Amazon Kendra

في وحدة تحكم Amazon Kendra ، اختر البحث في المحتوى المفهرس في جزء التنقل.

فيما يلي أمثلة لنتائج البحث عن أنواع مستندات مختلفة:

  • RTF - تم تحميل بيانات الإدخال بتنسيق RTF إلى حاوية S3 ومزامنة مصدر البيانات:

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

تُظهر لقطة الشاشة التالية نتائج البحث.

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

  • JSON - تم تحميل بيانات الإدخال بتنسيق JSON إلى حاوية S3 ومزامنة مصدر البيانات:

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

تُظهر لقطة الشاشة التالية نتائج البحث.

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

  • تخفيض السعر - بيانات الإدخال بتنسيق MD تم تحميلها إلى حاوية S3 ومزامنة مصدر البيانات:

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

تُظهر لقطة الشاشة التالية نتائج البحث.

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

  • CSV - تم تحميل بيانات الإدخال بتنسيق CSV إلى حاوية S3 ومزامنة مصدر البيانات:

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

تُظهر لقطة الشاشة التالية نتائج البحث.

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

  • Excel - بيانات الإدخال بتنسيق Excel التي تم تحميلها إلى حاوية S3 ومزامنة مصدر البيانات:

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

تُظهر لقطة الشاشة التالية نتائج البحث.

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

  • XML - بيانات الإدخال بتنسيق XML التي تم تحميلها إلى حاوية S3 ومزامنة مصدر البيانات:

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

تُظهر لقطة الشاشة التالية نتائج البحث.

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

  • XSLT - تم تحميل بيانات الإدخال بتنسيق XSLT إلى حاوية S3 ومزامنة مصدر البيانات:

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

تُظهر لقطة الشاشة التالية نتائج البحث.

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

تنظيف

لتجنب تكبد تكاليف مستقبلية ، قم بتنظيف الموارد التي قمت بإنشائها كجزء من هذا الحل باستخدام الخطوات التالية:

  1. في وحدة تحكم Amazon Kendra ، اختر الفهارس في جزء التنقل.
  2. اختر الفهرس الذي يحتوي على مصدر البيانات المراد حذفه.
  3. في جزء التنقل ، اختر مصادر البيانات.
  4. اختر مصدر البيانات المراد إزالته ، ثم اختر حذف.

عندما تحذف مصدر بيانات ، تزيل Amazon Kendra جميع المعلومات المخزنة حول مصدر البيانات. يقوم Amazon Kendra بإزالة جميع بيانات المستند المخزنة في الفهرس ، وتشغيل جميع السجلات والمقاييس المرتبطة بمصدر البيانات. لا يؤدي حذف مصدر البيانات إلى إزالة المستندات الأصلية من التخزين لديك.

  1. في وحدة تحكم Amazon Kendra ، اختر الفهارس في جزء التنقل.
  2. اختر الفهرس المراد حذفه ، ثم اختر حذف.

الرجوع إلى حذف فهرس ومصدر بيانات لمزيد من التفاصيل.

  1. في وحدة تحكم Amazon S3 ، اختر الدلاء في جزء التنقل.
  2. حدد الحاوية التي تريد حذفها ، ثم اختر حذف.
  3. أدخل اسم الحاوية لتأكيد الحذف ، ثم اختر حذف دلو.

إذا كانت الحاوية تحتوي على أي كائنات ، فستتلقى تنبيهًا بالخطأ. قم بإفراغ الحاوية قبل حذفها عن طريق اختيار الارتباط الموجود في رسالة الخطأ واتباع الإرشادات الموجودة في ملف سلة فارغة صفحة. ثم ارجع إلى ملف حذف دلو الصفحة وحذف الدلو.

  1. للتحقق من قيامك بحذف الحاوية ، افتح ملف الدلاء الصفحة وأدخل اسم الحاوية التي قمت بحذفها. إذا تعذر العثور على الحاوية ، فهذا يعني أن الحذف قد نجح.

الرجوع إلى حذف صفحة دلو لمزيد من التفاصيل.

وفي الختام

في هذا المنشور ، ناقشنا تنسيقات البيانات الجديدة التي تدعمها Amazon Kendra الآن. بالإضافة إلى ذلك ، ناقشنا كيفية استخدام Amazon Kendra لاستيعاب أنواع المستندات الجديدة هذه وإجراء بحث عنها في حاوية S3. لمعرفة المزيد حول تنسيقات البيانات المختلفة المدعومة ، ارجع إلى أنواع المستندات.

قدمنا ​​لك الأساسيات ، ولكن هناك العديد من الميزات الإضافية التي لم نغطيها في هذا المنشور ، مثل ما يلي:

  • يمكنك تمكين التحكم في الوصول المستند إلى المستخدم لمؤشر Amazon Kendra الخاص بك وتقييد الوصول إلى المستخدمين والمجموعات التي تقوم بتكوينها.
  • يمكنك تعيين حقول إضافية لسمات فهرس Amazon Kendra وتمكينها من الظهور والبحث والعرض في نتائج البحث.
  • يمكنك دمج موصلات مصدر بيانات مختلفة تابعة لجهات خارجية مثل Service Now و Salesforce مع إمكانية Custom Document Enrichment (CDE) في Amazon Kendra لتنفيذ منطق تعيين السمات الإضافي وحتى تحويل المحتوى المخصص أثناء الاستيعاب. للحصول على قائمة كاملة بالموصلات المدعومة ، ارجع إلى الموصلات.

لمعرفة المزيد عن هذه الاحتمالات وأكثر ، راجع دليل مطور أمازون كندرا.


عن المؤلفين

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.ريشابه ياداف مهندس حلول الشركاء في AWS مع خلفية واسعة في DevOps وعروض الأمان في AWS. إنه يعمل مع شركاء ASEAN لتقديم إرشادات حول اعتماد السحابة المؤسسية ومراجعات البنية جنبًا إلى جنب مع بناء ممارسات AWS من خلال تنفيذ إطار عمل جيد التصميم. خارج العمل ، يحب قضاء وقته في المجال الرياضي وألعاب التصويب من منظور الشخص الأول.

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.كروثي جاياسيمها راو هو مهندس حلول شريك مع التركيز على الذكاء الاصطناعي وتعلم الآلة. تقدم إرشادات تقنية لشركاء AWS في اتباع أفضل الممارسات لبناء حلول آمنة ومرنة ومتاحة للغاية في سحابة AWS.

دعم تنسيق البيانات الموسع الجديد في Amazon Kendra PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.كيرثي كومار كالور هو مهندس تطوير برمجيات في AWS. لقد عمل مع فريق AWS Kendra منذ العامين الماضيين وعمل على العديد من الميزات بالإضافة إلى العملاء. في أوقات فراغه ، يحب القيام بأنشطة في الهواء الطلق مثل المشي لمسافات طويلة والرياضات مثل الكرة الطائرة.

الطابع الزمني:

اكثر من التعلم الآلي من AWS