تتطلع الشركات في جميع أنحاء العالم إلى استخدام مصادر بيانات متعددة لتنفيذ تجربة بحث موحدة لموظفيها وعملائها النهائيين. بالنظر إلى الحجم الكبير من البيانات التي يجب فحصها وفهرستها ، تصبح سرعة الاسترداد وقابلية تطوير الحلول وأداء البحث عوامل رئيسية يجب مراعاتها عند اختيار حل بحث ذكي للمؤسسة. بالإضافة إلى ذلك ، تشتمل مصادر البيانات الفريدة هذه على مستودعات المحتوى المهيكلة وغير المهيكلة - بما في ذلك أنواع الملفات المختلفة - والتي قد تسبب مشكلات في التوافق.
أمازون كندرا هي خدمة بحث عالية الدقة وذكية تمكن المستخدمين من البحث عن إجابات لأسئلتهم من بياناتك غير المهيكلة والمنظمة باستخدام معالجة اللغة الطبيعية وخوارزميات البحث المتقدمة. يعرض إجابات محددة على الأسئلة ، مما يمنح المستخدمين تجربة قريبة من التفاعل مع خبير بشري.
أطلقت Amazon Kendra اليوم سبعة خيارات إضافية لدعم تنسيق البيانات لتستخدمها. يتيح لك ذلك دمج مصادر البيانات الحالية بسهولة كما هي وإجراء بحث ذكي عبر مستودعات محتوى متعددة.
في هذا المنشور ، نناقش تنسيقات البيانات المدعومة الجديدة وكيفية استخدامها.
تنسيقات البيانات الجديدة المدعومة
سابقًا ، أمازون كندرا المستندات المدعومة التي تضمنت نصًا منظمًا في شكل أسئلة وأجوبة متكررة ، بالإضافة إلى نص غير منظم في شكل ملفات HTML وعروض Microsoft PowerPoint التقديمية ومستندات Microsoft Word ومستندات ذات نص عادي وملفات PDF.
مع هذا الإطلاق ، تقدم Amazon Kendra الآن دعمًا لسبعة تنسيقات بيانات إضافية:
- تنسيق نص منسق (RTF)
- تدوين كائن جافا سكريبت (JSON)
- تخفيض السعر (MD)
- قيم مفصولة بفواصل (CSV)
- مايكروسوفت اكسل (مس اكسل)
- لغة الترميز الموسعة
- تحويلات لغة ورقة الأنماط الموسعة (XSLT)
يمكن لمستخدمي Amazon Kendra استيعاب هذه المستندات بتنسيقات بيانات مختلفة لفهرسهم بالطريقتين التاليتين:
حل نظرة عامة
في الأقسام التالية ، نتصفح خطوات إضافة مستندات من مصدر بيانات وإجراء بحث على تلك المستندات.
يوضح الرسم البياني التالي بنية الحل لدينا.
لاختبار هذا الحل لأي من التنسيقات المدعومة ، تحتاج إلى استخدام بياناتك الخاصة. يمكنك الاختبار عن طريق تحميل مستندات من نفس التنسيقات أو تنسيقات مختلفة إلى حاوية S3.
أنشئ فهرس Amazon Kendra
للحصول على إرشادات حول إنشاء فهرس Amazon Kendra الخاص بك ، يرجى الرجوع إلى إنشاء فهرس.
يمكنك تخطي هذه الخطوة إذا كان لديك فهرس موجود مسبقًا لاستخدامه في هذا العرض التوضيحي.
قم بتحميل المستندات إلى حاوية S3 واستوعبها إلى الفهرس باستخدام موصل S3
أكمل الخطوات التالية لتوصيل حاوية S3 بالفهرس الخاص بك:
- قم بإنشاء دلو S3 لتخزين المستندات الخاصة بك.
- قم بإنشاء مجلد بيانات العينة المسماة.
- قم بتحميل المستندات التي تريد اختبارها إلى المجلد.
- في وحدة تحكم Amazon Kendra ، انتقل إلى الفهرس الخاص بك واختر مصادر البيانات.
- اختار أضف مصدر البيانات.
- تحت مصادر البيانات المتاحة، حدد S3 واختر أضف موصل.
- أدخل اسمًا للموصل الخاص بك (مثل
Demo_S3_connector
) و اختار التالى. - اختار تصفح S3 واختر حاوية S3 حيث قمت بتحميل المستندات.
- في حالة دور IAM، أنشئ دورًا جديدًا.
- في حالة تعيين جدول تشغيل المزامنة، حدد تعمل حسب الطلب.
- اختار التالى.
- على مراجعة وإنشاء الصفحة ، اختر أضف مصدر البيانات.
- بعد اكتمال عملية الإنشاء ، اختر زامن الآن "لنقل البيانات.
الآن بعد أن استوعبت بعض المستندات ، يمكنك الانتقال إلى وحدة تحكم البحث المدمجة لاختبار الاستعلامات.
ابحث في مستنداتك باستخدام وحدة تحكم البحث في Amazon Kendra
في وحدة تحكم Amazon Kendra ، اختر البحث في المحتوى المفهرس في جزء التنقل.
فيما يلي أمثلة لنتائج البحث عن أنواع مستندات مختلفة:
- RTF - تم تحميل بيانات الإدخال بتنسيق RTF إلى حاوية S3 ومزامنة مصدر البيانات:
تُظهر لقطة الشاشة التالية نتائج البحث.
- JSON - تم تحميل بيانات الإدخال بتنسيق JSON إلى حاوية S3 ومزامنة مصدر البيانات:
تُظهر لقطة الشاشة التالية نتائج البحث.
- تخفيض السعر - بيانات الإدخال بتنسيق MD تم تحميلها إلى حاوية S3 ومزامنة مصدر البيانات:
تُظهر لقطة الشاشة التالية نتائج البحث.
- CSV - تم تحميل بيانات الإدخال بتنسيق CSV إلى حاوية S3 ومزامنة مصدر البيانات:
تُظهر لقطة الشاشة التالية نتائج البحث.
- Excel - بيانات الإدخال بتنسيق Excel التي تم تحميلها إلى حاوية S3 ومزامنة مصدر البيانات:
تُظهر لقطة الشاشة التالية نتائج البحث.
- XML - بيانات الإدخال بتنسيق XML التي تم تحميلها إلى حاوية S3 ومزامنة مصدر البيانات:
تُظهر لقطة الشاشة التالية نتائج البحث.
- XSLT - تم تحميل بيانات الإدخال بتنسيق XSLT إلى حاوية S3 ومزامنة مصدر البيانات:
تُظهر لقطة الشاشة التالية نتائج البحث.
تنظيف
لتجنب تكبد تكاليف مستقبلية ، قم بتنظيف الموارد التي قمت بإنشائها كجزء من هذا الحل باستخدام الخطوات التالية:
- في وحدة تحكم Amazon Kendra ، اختر الفهارس في جزء التنقل.
- اختر الفهرس الذي يحتوي على مصدر البيانات المراد حذفه.
- في جزء التنقل ، اختر مصادر البيانات.
- اختر مصدر البيانات المراد إزالته ، ثم اختر حذف.
عندما تحذف مصدر بيانات ، تزيل Amazon Kendra جميع المعلومات المخزنة حول مصدر البيانات. يقوم Amazon Kendra بإزالة جميع بيانات المستند المخزنة في الفهرس ، وتشغيل جميع السجلات والمقاييس المرتبطة بمصدر البيانات. لا يؤدي حذف مصدر البيانات إلى إزالة المستندات الأصلية من التخزين لديك.
- في وحدة تحكم Amazon Kendra ، اختر الفهارس في جزء التنقل.
- اختر الفهرس المراد حذفه ، ثم اختر حذف.
الرجوع إلى حذف فهرس ومصدر بيانات لمزيد من التفاصيل.
- في وحدة تحكم Amazon S3 ، اختر الدلاء في جزء التنقل.
- حدد الحاوية التي تريد حذفها ، ثم اختر حذف.
- أدخل اسم الحاوية لتأكيد الحذف ، ثم اختر حذف دلو.
إذا كانت الحاوية تحتوي على أي كائنات ، فستتلقى تنبيهًا بالخطأ. قم بإفراغ الحاوية قبل حذفها عن طريق اختيار الارتباط الموجود في رسالة الخطأ واتباع الإرشادات الموجودة في ملف سلة فارغة صفحة. ثم ارجع إلى ملف حذف دلو الصفحة وحذف الدلو.
- للتحقق من قيامك بحذف الحاوية ، افتح ملف الدلاء الصفحة وأدخل اسم الحاوية التي قمت بحذفها. إذا تعذر العثور على الحاوية ، فهذا يعني أن الحذف قد نجح.
الرجوع إلى حذف صفحة دلو لمزيد من التفاصيل.
وفي الختام
في هذا المنشور ، ناقشنا تنسيقات البيانات الجديدة التي تدعمها Amazon Kendra الآن. بالإضافة إلى ذلك ، ناقشنا كيفية استخدام Amazon Kendra لاستيعاب أنواع المستندات الجديدة هذه وإجراء بحث عنها في حاوية S3. لمعرفة المزيد حول تنسيقات البيانات المختلفة المدعومة ، ارجع إلى أنواع المستندات.
قدمنا لك الأساسيات ، ولكن هناك العديد من الميزات الإضافية التي لم نغطيها في هذا المنشور ، مثل ما يلي:
- يمكنك تمكين التحكم في الوصول المستند إلى المستخدم لمؤشر Amazon Kendra الخاص بك وتقييد الوصول إلى المستخدمين والمجموعات التي تقوم بتكوينها.
- يمكنك تعيين حقول إضافية لسمات فهرس Amazon Kendra وتمكينها من الظهور والبحث والعرض في نتائج البحث.
- يمكنك دمج موصلات مصدر بيانات مختلفة تابعة لجهات خارجية مثل Service Now و Salesforce مع إمكانية Custom Document Enrichment (CDE) في Amazon Kendra لتنفيذ منطق تعيين السمات الإضافي وحتى تحويل المحتوى المخصص أثناء الاستيعاب. للحصول على قائمة كاملة بالموصلات المدعومة ، ارجع إلى الموصلات.
لمعرفة المزيد عن هذه الاحتمالات وأكثر ، راجع دليل مطور أمازون كندرا.
عن المؤلفين
ريشابه ياداف مهندس حلول الشركاء في AWS مع خلفية واسعة في DevOps وعروض الأمان في AWS. إنه يعمل مع شركاء ASEAN لتقديم إرشادات حول اعتماد السحابة المؤسسية ومراجعات البنية جنبًا إلى جنب مع بناء ممارسات AWS من خلال تنفيذ إطار عمل جيد التصميم. خارج العمل ، يحب قضاء وقته في المجال الرياضي وألعاب التصويب من منظور الشخص الأول.
كروثي جاياسيمها راو هو مهندس حلول شريك مع التركيز على الذكاء الاصطناعي وتعلم الآلة. تقدم إرشادات تقنية لشركاء AWS في اتباع أفضل الممارسات لبناء حلول آمنة ومرنة ومتاحة للغاية في سحابة AWS.
كيرثي كومار كالور هو مهندس تطوير برمجيات في AWS. لقد عمل مع فريق AWS Kendra منذ العامين الماضيين وعمل على العديد من الميزات بالإضافة إلى العملاء. في أوقات فراغه ، يحب القيام بأنشطة في الهواء الطلق مثل المشي لمسافات طويلة والرياضات مثل الكرة الطائرة.
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- بلاتوبلوكشين. Web3 Metaverse Intelligence. تضخيم المعرفة. الوصول هنا.
- المصدر https://aws.amazon.com/blogs/machine-learning/new-expanded-data-format-support-in-amazon-kendra/
- 10
- 100
- 7
- a
- من نحن
- الوصول
- دقيق
- في
- أنشطة
- إضافة
- إضافي
- وبالإضافة إلى ذلك
- تبني
- متقدم
- AI
- ملاحظه
- خوارزميات
- الكل
- يسمح
- أمازون
- أمازون كندرا
- و
- الأجوبة
- هندسة معمارية
- آسيان
- أسوشيتد
- سمات
- متاح
- AWS
- خلفية
- الأساسيات
- أصبح
- قبل
- أفضل
- أفضل الممارسات
- نساعدك في بناء
- ابني
- مدمج
- سبب
- اختار
- اختيار
- اغلاق
- سحابة
- اعتماد السحابة
- التوافق
- إكمال
- أكد
- التواصل
- نظر
- النظر
- كنسولات
- يحتوي
- محتوى
- مراقبة
- التكاليف
- بهيكل
- خلق
- خلق
- خلق
- خلق
- على
- العملاء
- البيانات
- تفاصيل
- المطور
- التطوير التجاري
- مختلف
- بحث
- ناقش
- العرض
- وثيقة
- وثائق
- أثناء
- بسهولة
- الموظفين
- تمكين
- تمكن
- مهندس
- أدخل
- مشروع
- خطأ
- حتى
- أمثلة
- Excel
- القائمة
- موسع
- الخبره في مجال الغطس
- خبير
- واسع
- العوامل
- المميزات
- حقل
- مجال
- قم بتقديم
- ملفات
- تركز
- متابعيك
- النموذج المرفق
- شكل
- وجدت
- إطارا في الثانية
- الإطار
- كثيرا
- تبدأ من
- مستقبل
- الألعاب
- إعطاء
- العالم
- Go
- مجموعات
- جدا
- كيفية
- كيفية
- HTML
- HTTPS
- الانسان
- تنفيذ
- التنفيذ
- in
- شامل
- مؤشر
- معلومات
- إدخال
- تعليمات
- دمج
- ذكي
- التفاعل
- أدخلت
- مسائل
- IT
- جسون
- القفل
- لغة
- كبير
- إطلاق
- أطلقت
- تعلم
- LINK
- قائمة
- أبحث
- كثير
- رسم خريطة
- رسم الخرائط
- الرسالة
- المقاييس
- مایکروسافت
- ML
- الأكثر من ذلك
- MS
- متعدد
- الاسم
- عين
- طبيعي
- معالجة اللغات الطبيعية
- التنقل
- قائمة الإختيارات
- حاجة
- إحتياجات
- جديد
- موضوع
- الأجسام
- عروض
- عروض
- جاكيت
- مزيد من الخيارات
- أصلي
- في الخارج
- الخاصة
- خبز
- جزء
- الشريكة
- شركاء
- الماضي
- نفذ
- أداء
- أداء
- عادي
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- إمكانيات
- منشور
- ممارسة
- الممارسات
- بريزنتشين
- عملية المعالجة
- معالجة
- تزود
- ويوفر
- الأسئلة المتكررة
- تسلم
- إزالة
- مرن
- الموارد
- بتقييد
- النتائج
- عائد أعلى
- عائدات
- التعليقات
- النوع
- يجري
- SALESFORCE
- نفسه
- التدرجية
- بحث
- أقسام
- تأمين
- أمن
- الخدمة
- سبعة
- يظهر
- منذ
- تطبيقات الكمبيوتر
- تطوير البرمجيات
- حل
- الحلول
- بعض
- مصدر
- مصادر
- محدد
- سرعة
- أنفق
- رياضة
- خطوة
- خطوات
- تخزين
- متجر
- تخزين
- منظم
- ناجح
- هذه
- الدعم
- مدعومة
- الدعم
- فريق
- تقني
- تجربه بالعربي
- الاختبار
- •
- أساسيات
- من مشاركة
- طرف ثالث
- عبر
- الوقت
- إلى
- تحول
- التحولات
- أنواع
- موحد
- فريد من نوعه
- تم التحميل
- تحميل
- تستخدم
- المستخدمين
- الاستفادة من
- القيم
- مختلف
- تحقق من
- حجم
- طرق
- كلمة
- للعمل
- عمل
- أعمال
- XML
- XSLT
- سنوات
- أنت
- حل متجر العقارات الشامل الخاص بك في جورجيا
- زفيرنت