أمازون كندرا هي خدمة بحث ذكية سهلة الاستخدام تسمح لك بدمج إمكانات البحث مع تطبيقاتك حتى يتمكن المستخدمون من العثور على المعلومات المخزنة عبر مصادر البيانات مثل خدمة تخزين أمازون البسيطة و OneDrive و Google Drive ؛ تطبيقات مثل SalesForce و SharePoint و Service Now ؛ وقواعد البيانات العلائقية مثل خدمة قاعدة بيانات الأمازون (Amazon RDS). يتيح لك استخدام موصلات Amazon Kendra مزامنة البيانات من مستودعات محتوى متعددة مع فهرس Amazon Kendra الخاص بك. عندما يطرح المستخدمون النهائيون أسئلة حول اللغة الطبيعية ، تستخدم Amazon Kendra خوارزميات التعلم الآلي (ML) لفهم السياق وعرض الإجابات الأكثر صلة.
يدعم موصل S3 الخاص بـ Amazon Kendra فهرسة المستندات والبيانات الوصفية المرتبطة بها المخزنة في حاوية S3. غالبًا ما تريد التأكد من أن التطبيقات التي تعمل داخل VPC لها حق الوصول فقط إلى حاويات S3 محددة وفي كثير من الحالات يجب ألا يجتاز الاتصال الإنترنت للوصول إلى نقاط النهاية العامة. ومع ذلك ، يمتلك العديد من العملاء حاويات S3 متعددة ، يمكن الوصول إلى بعضها بواسطة نقاط نهاية VPC لـ Amazon S3. في هذا المنشور ، نصف كيفية استخدام موصل Amazon Kendra S3 المحدث مع دعم VPC لاستخدام نقاط نهاية VPC.
يوفر هذا المنشور الخطوات لمساعدتك في إنشاء محرك بحث مؤسسي على AWS باستخدام Amazon Kendra من خلال ربط المستندات المخزنة في حاوية S3 التي يمكن الوصول إليها فقط من داخل VPC. لمزيد من المعلومات، راجع تحسين البحث عن المؤسسات باستخدام Amazon Kendra. يوضح المنشور أيضًا كيفية تكوين الموصل الخاص بك لـ Amazon S3 وتكوين كيفية مزامنة الفهرس مع مصدر البيانات عندما يتغير محتوى مصدر البيانات.
نظرة عامة على الحل
هناك ثلاثة تحسينات رئيسية على موصل Amazon Kendra S3 :
- دعم VPC - يدعم الموصل الآن استخدام ملف سحابة أمازون الافتراضية الخاصة (Amazon VPC). يمكنك الآن الاتصال بأمان بخدمة Amazon S3 باستخدام نقاط نهاية VPC لـ Amazon S3 من خلال تحديد اتصال VPC والشبكة الفرعية ومجموعات الأمان.
- وضعان للمزامنة - عندما تقوم بجدولة مزامنة مصدر بيانات في Amazon S3 إلى فهرس Amazon Kendra ، يمكنك الآن اختيار التشغيل في وضع المزامنة الكاملة أو وضع مزامنة المستندات الجديد والمعدل والمحذوف. في وضع المزامنة الكاملة ، في كل مرة يتم تشغيل المزامنة ، تقوم بمسح الكائنات في كل مجلد ضمن المسار الجذر الذي تم تكوينه للزحف إلى جميع المستندات وإعادة إدخالها. يمكّنك التحديث الكامل من إعادة تعيين الفهرس دون الحاجة إلى حذف مصدر بيانات جديد وإنشاءه. في وضع مزامنة المستند الجديد والمعدّل والمحذوف ، في كل مرة يتم تشغيل وظيفة المزامنة ، فإنها تعالج الكائنات التي تمت إضافتها أو تعديلها أو حذفها منذ آخر عملية تتبع ارتباطات فقط. يمكن أن تقلل عمليات الزحف المتزايدة وقت التشغيل والتكلفة عند استخدامها مع مجموعات البيانات التي تلحق كائنات جديدة بمصادر البيانات الحالية بشكل منتظم.
- أنماط إدراج واستبعاد إضافية للوثائق: بالإضافة إلى البادئات ، نقدم أنماطًا لتضمين المستندات أو استبعادها من الفهرس الخاص بك. نوعان من الأنماط المدعومة هما نمط يونكس glob أو أنواع الملفات. يمكنك الآن إضافة نمط تعبير عادي لتضمين مجلدات محددة أو استبعاد مجلدات أو أنواع ملفات أو ملفات معينة من مصدر بياناتك. يمكن أن يكون هذا مفيدًا لمستودعات البيانات المشتركة التي تحتوي على محتوى ينتمي إلى فئات وتصنيفات وأنواع ملفات مختلفة.
المتطلبات الأساسية المسبقة
في هذا الدليل ، يجب أن يكون لديك المتطلبات الأساسية التالية:
قم بإنشاء وتكوين مستودع المستندات الخاص بك
قبل أن تتمكن من إنشاء فهرس في Amazon Kendra ، تحتاج إلى تحميل المستندات في دلو S3. يحتوي هذا القسم على تعليمات لإنشاء دلو S3 ، والحصول على الملفات ، وتحميلها في الدلو. بعد إكمال جميع الخطوات في هذا القسم ، لديك مصدر بيانات يمكن أن يستخدمه Amazon Kendra.
- على وحدة تحكم إدارة AWS، في قائمة المنطقة ، اختر شرق الولايات المتحدة (شمال فيرجينيا) أو أي منطقة من اختيارك أمازون كندرا متاح في.
- اختار خدماتنا.
- تحت الخزائن ، اختر S3.
- في وحدة تحكم Amazon S3 ، اختر إنشاء دلو.
- تحت التكوين العام، قدم المعلومات التالية:
- لاسم الجرافة, أدخل
kendrapost-{your account id}.
- بالنسبة للمنطقة ، اختر نفس المنطقة التي تستخدمها لنشر فهرس Amazon Kendra (يستخدم هذا المنشور
us-east-1
). - تحت إعدادات الجرافة ، For حظر الوصول العاماترك كل شيء مع القيم الافتراضية.
- لاسم الجرافة, أدخل
- تحت الإعدادات المتقدمةاترك كل شيء مع القيم الافتراضية.
- اختار إنشاء دلو.
- تحميل AWS_Whitepapers.zip وفك ضغط الملفات.
- في وحدة تحكم Amazon S3 ، حدد المجموعة التي قمت بإنشائها للتو واخترها تحميل.
- قم بتحميل المجلدات
Best Practices
,Databases
,General
وMachine Learning
من الملف الذي تم فك ضغطه.
داخل دلو الخاص بك ، يجب أن ترى الآن أربعة مجلدات.
أضف مصدر بيانات
A مصدر البيانات هو موقع يقوم بتخزين المستندات للفهرسة. يمكنك مزامنة مصادر البيانات تلقائيًا مع فهرس Amazon Kendra للتأكد من أن عمليات البحث تعكس بشكل صحيح المستندات الجديدة أو المحدثة أو المحذوفة في مستودعات المصدر.
بعد إكمال جميع الخطوات الواردة في هذا القسم ، سيكون لديك مصدر بيانات مرتبط بـ Amazon Kendra. لمزيد من المعلومات، راجع إضافة وثائق من مصدر بيانات.
قبل المتابعة ، تأكد من اكتمال إنشاء الفهرس وأن الفهرس يظهر على شكل النشطه. لمزيد من المعلومات، راجع إنشاء فهرس.
- في وحدة تحكم Amazon Kendra ، انتقل إلى الفهرس الخاص بك (بالنسبة لهذا المنشور ،
kendra-blog-index
). - على
kendra-blog-index
الصفحة ، اختر أضف مصادر البيانات. - ضمن Amazon S3 ، اختر أضف موصل.
لمزيد من المعلومات حول مصادر البيانات المختلفة التي يدعمها Amazon Kendra ، راجع إضافة وثائق من مصدر بيانات.
- في مجلة حدد تفاصيل مصدر البيانات القسم ل اسم مصدر البيانات، أدخل
aws_white_paper
. - في حالة الوصف، أدخل
AWS White Paper documentation
. - اختار التالى.
الآن تقوم بإنشاء ملف إدارة الهوية والوصول AWS دور (IAM) لأمازون كندرا.
- في مجلة تحديد الوصول والأمان صفحة ، لـ دور IAM القسم، اختر قم بإنشاء دور جديد.
- بالنسبة لاسم الدور ، أدخل
source-role
(اسم دورك مسبوق بـAmazonKendra-
). - في مجلة تكوين VPC والأمان ، اختر الخاص بك VPC ، وأدخل الخاص بك الشبكات الفرعية ومجموعات الأمان VPC.
لمزيد من المعلومات حول توصيل Amazon Kendra الخاص بك بـ Amazon Virtual Private Cloud ، راجع تكوين Amazon Kendra لاستخدام VPC.
- اختار التالى.
- في مجلة تكوين إعدادات المزامنة صفحة ، لـ أدخل موقع مصدر البيانات، أدخل مجموعة S3 التي أنشأتها:
kendrapost-{your account id}
. - يترك موقع مجلد بادئة ملفات البيانات الوصفية فارغا.
بشكل افتراضي ، يتم تخزين ملفات البيانات الوصفية في نفس الدليل مثل المستندات. إذا كنت تريد وضع هذه الملفات في مجلد مختلف ، يمكنك إضافة بادئة. لمزيد من المعلومات، راجع بيانات تعريف مستند Amazon S3.
- في حالة حدد مفتاح فك التشفيراتركه بدون تحديد.
- في حالة تكوين إضافي، يمكنك إضافة نمط لتضمين أو استبعاد مجلدات أو ملفات معينة. لهذا المنشور ، احتفظ بالقيم الافتراضية.
- في حالة وضع المزامنة اختر مزامنة المستندات الجديدة أو المعدلة أو المحذوفة.
- في حالة تردد، اختر تعمل حسب الطلب.
تحدد هذه الخطوة معدل تكرار مزامنة مصدر البيانات مع فهرس Amazon Kendra.
- اختار التالى.
- في مجلة تعيين تعيينات الحقول الصفحة ، احتفظ بالقيم الافتراضية.
- اختار التالى.
- على مراجعة وإنشاء الصفحة ، اختر أضف مصدر البيانات.
- انتقل مرة أخرى إلى فهرس Kendra الخاص بك.
- اختيار الخاصة بك مصدر البيانات، ثم اختر زامن الآن "لنقل البيانات لمزامنة المستندات مع فهرس Amazon Kendra.
تعتمد مدة هذه العملية على عدد المستندات التي تقوم بفهرستها. بالنسبة لحالة الاستخدام هذه ، قد يستغرق الأمر 15 دقيقة ، وبعد ذلك سترى رسالة تفيد بأن المزامنة كانت ناجحة. في قسم محفوظات تشغيل المزامنة ، يمكنك رؤية أنه تمت مزامنة 40 وثيقة.
أصبح فهرس Amazon Kendra جاهزًا الآن لاستعلامات اللغة الطبيعية. عندما تبحث في الفهرس الخاص بك ، تستخدم Amazon Kendra جميع البيانات والبيانات الوصفية المقدمة لإرجاع أكثر الإجابات دقة لاستعلام البحث الخاص بك. في وحدة تحكم Amazon Kendra ، اختر البحث في المحتوى المفهرس. في حقل الاستعلام ، ابدأ باستعلام مثل "أي خدمة AWS بها 11 تسعة من المتانة؟"
لمزيد من المعلومات حول الاستعلام عن الفهرس ، راجع الاستعلام عن فهرس
مزامنة تغييرات مصدر البيانات للبحث في الفهرس
تم إعداد مصدر البيانات الخاص بك لمزامنة أي بيانات جديدة أو معدلة أو محذوفة. قبل أن تتمكن من مزامنة مصدر بياناتك بشكل تدريجي مع فهرس في Amazon Kendra ، تحتاج إلى تحميل مستندات جديدة في حاوية S3.
- في وحدة تحكم Amazon S3 ، حدد المجموعة التي قمت بإنشائها للتو واخترها تحميل.
- قم بتحميل المجلدات
Security
وWell_Architected
من الملف الذي تم فك ضغطه.
يمكنك الآن مزامنة المستندات الجديدة المضافة إلى حاوية S3:
- في وحدة تحكم Amazon Kendra ، اختر مصادر البيانات ثم حدد مصدر بيانات S3 الخاص بك.
- اختار زامن الآن "لنقل البيانات.
تعتمد مدة هذه العملية على عدد المستندات التي تقوم بفهرستها. بالنسبة لحالة الاستخدام هذه ، قد يستغرق الأمر 15 دقيقة ، وبعد ذلك سترى رسالة تفيد بأن المزامنة كانت ناجحة.
في مجلة سجل تشغيل المزامنة القسم ، يمكنك أن ترى أن 20 وثيقة متزامنة.
أعد فهرسة مصدر البيانات
في سيناريو يحتوي فيه مصدر البيانات على معلومات قديمة ، يمكنك الآن إعادة فهرسة مصدر البيانات دون الحاجة إلى حذف مصدر بيانات جديد وإنشائه. لتعديل وضع المزامنة وإعادة فهرسة مصدر البيانات ، أكمل الخطوات التالية:
- في وحدة تحكم Amazon Kendra ، اختر مصادر البيانات ثم حدد مصدر بيانات S3 الخاص بك.
- على الإجراءات القائمة، اختر تحرير.
- اختار التالى لتنتقل إلى الخطوة 3 - تكوين صفحة إعدادات المزامنة.
- بالنسبة لوضع المزامنة ، حدد مزامنة كاملة.
- في حالة تردد، اختر تعمل حسب الطلب.
- اختار التالى.
- في مجلة تعيين تعيينات الحقول الصفحة ، احتفظ بالقيم الافتراضية.
- اختار التالى.
- على مراجعة وإنشاء الصفحة ، اختر تحديث.
يمكنك الآن مزامنة المستندات الجديدة المضافة إلى حاوية S3.
- في وحدة تحكم Amazon Kendra ، اختر مصادر البيانات ثم حدد مصدر بيانات S3 الخاص بك.
- اختار زامن الآن "لنقل البيانات.
في مجلة سجل تشغيل المزامنة ، يمكنك أن ترى أنه تمت مزامنة جميع المستندات بغض النظر عن حالة المزامنة السابقة ضمن العمود المعدل.
تنظيف
لتجنب تكبد رسوم في المستقبل وتنظيف الأدوار والسياسات غير المستخدمة ، احذف الموارد التي أنشأتها:
- في فهرس Amazon Kendra ، اختر الفهارس في جزء التنقل.
- حدد الفهرس الذي قمت بإنشائه وعلى الإجراءات القائمة، اختر حذف.
- لتأكيد الحذف ، أدخل حذف عند المطالبة واختر حذف.
انتظر حتى تحصل على رسالة التأكيد ؛ يمكن أن تستغرق العملية ما يصل إلى 15 دقيقة.
- على وحدة تحكم Amazon S3 ، احذف حاوية S3.
- على وحدة تحكم IAM ، حذف أدوار IAM المقابلة.
وفي الختام
في هذا المنشور ، تعلمت كيفية استخدام Amazon Kendra لنشر خدمة بحث مؤسسية باستخدام اتصال آمن بـ Amazon S3 لا يتطلب بوابة إنترنت أو جهاز ترجمة عنوان الشبكة (NAT). يمكنك تمكين عمليات المزامنة السريعة للمستندات الخاصة بك باستخدام وضع المزامنة.
هناك العديد من الميزات الإضافية التي لم نغطيها. على سبيل المثال:
- يمكنك تمكين التحكم في الوصول المستند إلى المستخدم لمؤشر Amazon Kendra الخاص بك ، وتقييد الوصول إلى المستندات بناءً على عناصر التحكم في الوصول التي قمت بتكوينها بالفعل.
- يمكنك تعيين سمات الكائن إلى سمات فهرس Amazon Kendra ، وتمكينها من الظهور والبحث والعرض في نتائج البحث.
- يمكنك العثور بسرعة على معلومات من صفحات الويب (جداول HTML) باستخدام البحث الجدولي Amazon Kendra
لمعرفة المزيد عن أمازون كندرا ، يرجى الرجوع دليل مطور أمازون كندرا.
حول المؤلف
ماران شاندراسيكاران هو مهندس حلول أول في Amazon Web Services ، ويعمل مع عملاء مؤسستنا. خارج العمل ، يحب السفر.
أرجون أغراوال هو مهندس برمجيات في AWS ، ويعمل حاليًا مع فريق Amazon Kendra في محرك بحث للمؤسسات. إنه متحمس للتكنولوجيا الجديدة وحل مشاكل العالم الحقيقي. خارج العمل ، يحب التنزه والسفر.
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- بلاتوبلوكشين. Web3 Metaverse Intelligence. تضخيم المعرفة. الوصول هنا.
- المصدر https://aws.amazon.com/blogs/machine-learning/search-for-answers-accurately-using-amazon-kendra-s3-connector-with-vpc-support/
- 10
- 100
- 11
- 7
- a
- من نحن
- الوصول
- يمكن الوصول
- حسابي
- دقيق
- بدقة
- في
- وأضاف
- إضافة
- إضافي
- العنوان
- بعد
- خوارزميات
- الكل
- يسمح
- سابقا
- أمازون
- أمازون كندرا
- أمازون RDS
- أمازون ويب سيرفيسز
- و
- الأجوبة
- التطبيقات
- أسوشيتد
- سمات
- تلقائيا
- متاح
- AWS
- الى الخلف
- على أساس
- أساس
- قبل
- قدرات
- حقيبة
- الحالات
- الفئات
- معين
- التغييرات
- اسعارنا محددة من قبل وزارة العمل
- خيار
- اختار
- تصنيف
- سحابة
- عمود
- إكمال
- الانتهاء
- أكد
- التواصل
- الرابط
- صلة
- كنسولات
- تحتوي على
- يحتوي
- محتوى
- سياق الكلام
- استمرار
- مراقبة
- ضوابط
- المقابلة
- التكلفة
- بهيكل
- خلق
- خلق
- خلق
- حاليا
- العملاء
- البيانات
- قاعدة البيانات
- قواعد البيانات
- قواعد البيانات
- الترتيب
- يعرف
- يوضح
- يعتمد
- نشر
- وصف
- المطور
- جهاز
- مختلف
- العرض
- وثيقة
- وثائق
- لا
- قيادة
- متانة
- الشرق
- سهلة الاستخدام
- تمكين
- تمكن
- محرك
- مهندس
- أدخل
- مشروع
- كل
- كل شىء
- مثال
- القائمة
- المميزات
- حقل
- قم بتقديم
- ملفات
- متابعيك
- تردد
- تبدأ من
- بالإضافة إلى
- مستقبل
- بوابة
- دولار فقط واحصل على خصم XNUMX% على جميع
- شراء مراجعات جوجل
- مجموعات
- وجود
- مساعدة
- رفع
- تاريخ
- كيفية
- كيفية
- لكن
- HTML
- HTTPS
- هوية
- تحسينات
- in
- تتضمن
- إدراجه
- مؤشر
- معلومات
- تعليمات
- دمج
- ذكي
- Internet
- إدخال
- بغض النظر
- IT
- وظيفة
- احتفظ
- لغة
- اسم العائلة
- تعلم
- تعلم
- تعلم
- يترك
- مرتبط
- قائمة
- تحميل
- موقع
- آلة
- آلة التعلم
- الرئيسية
- جعل
- إدارة
- كثير
- رسم خريطة
- القائمة
- الرسالة
- البيانات الوصفية
- دقيقة
- ML
- موضة
- وسائط
- تم التعديل
- تعديل
- الأكثر من ذلك
- أكثر
- خطوة
- متعدد
- الاسم
- طبيعي
- التنقل
- قائمة الإختيارات
- حاجة
- شبكة
- الشبكات
- جديد
- عدد
- موضوع
- الأجسام
- في الخارج
- الخاصة
- خبز
- ورق
- عاطفي
- مسار
- نمط
- أنماط
- المكان
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- سياسات الخصوصية والبيع
- منشور
- الشروط
- سابق
- خاص
- مشاكل
- عملية المعالجة
- العمليات
- تزود
- المقدمة
- ويوفر
- جمهور
- الأسئلة المتكررة
- أسرع
- بسرعة
- الوصول
- استعداد
- العالم الحقيقي
- تخفيض
- تعكس
- منطقة
- منتظم
- ذات الصلة
- تطلب
- الموارد
- بتقييد
- النتائج
- عائد أعلى
- النوع
- الأدوار
- جذر
- يجري
- تشغيل
- SALESFORCE
- نفسه
- سيناريو
- جدول
- بحث
- محرك البحث
- القسم
- تأمين
- آمن
- أمن
- كبير
- الخدمة
- خدماتنا
- طقم
- إعدادات
- شاركت
- ينبغي
- يظهر
- الاشارات
- منذ
- So
- تطبيقات الكمبيوتر
- مهندس البرمجيات
- الحلول
- حل
- بعض
- مصدر
- مصادر
- محدد
- بداية
- الحالة
- خطوة
- خطوات
- تخزين
- تخزين
- فروعنا
- نمط
- الشبكة الفرعية
- الشبكات الفرعية
- ناجح
- هذه
- الدعم
- مدعومة
- الدعم
- تزامن
- أخذ
- فريق
- تكنولوجيا
- •
- المصدر
- من مشاركة
- ثلاثة
- الوقت
- إلى
- خدمات ترجمة
- سفر
- أنواع
- مع
- فهم
- يونيكس
- غير المستخدمة
- تحديث
- us
- تستخدم
- حالة الاستخدام
- المستخدمين
- القيم
- فرجينيا
- افتراضي
- تجول
- الويب
- خدمات ويب
- التي
- أبيض
- ورقة بيضاء
- في غضون
- بدون
- للعمل
- عامل
- أنت
- حل متجر العقارات الشامل الخاص بك في جورجيا
- زفيرنت
- الرمز البريدي