شرکت ها در سرتاسر جهان به دنبال استفاده از منابع داده های متعدد برای پیاده سازی یک تجربه جستجوی یکپارچه برای کارمندان و مشتریان نهایی خود هستند. با توجه به حجم زیادی از داده هایی که نیاز به بررسی و نمایه سازی دارند، سرعت بازیابی، مقیاس پذیری راه حل، و عملکرد جستجو به عوامل کلیدی تبدیل می شوند که هنگام انتخاب راه حل جستجوی هوشمند سازمانی باید در نظر گرفته شوند. علاوه بر این، این منابع داده منحصربفرد شامل مخازن محتوای ساختاریافته و بدون ساختار - از جمله انواع فایلهای مختلف - است که ممکن است باعث مشکلات سازگاری شود.
آمازون کندرا یک سرویس جستجوی بسیار دقیق و هوشمند است که کاربران را قادر میسازد تا با استفاده از پردازش زبان طبیعی و الگوریتمهای جستجوی پیشرفته، پاسخ سؤالات خود را از دادههای ساختاریافته و ساختاریافته شما جستجو کنند. پاسخهای مشخصی را به سؤالات ارائه میدهد و تجربهای را به کاربران ارائه میدهد که نزدیک به تعامل با یک متخصص انسانی است.
امروز، آمازون کندرا هفت گزینه پشتیبانی فرمت داده اضافی را برای استفاده شما راه اندازی کرد. این به شما امکان می دهد منابع داده موجود خود را به راحتی ادغام کنید و جستجوی هوشمند را در چندین مخزن محتوا انجام دهید.
در این پست، ما در مورد فرمت های جدید داده های پشتیبانی شده و نحوه استفاده از آنها بحث می کنیم.
فرمت های جدید داده های پشتیبانی شده
قبلا آمازون کندرا اسناد پشتیبانی شده که شامل متن ساختاریافته در قالب پرسشها و پاسخهای متداول، و همچنین متن بدون ساختار به شکل فایلهای HTML، ارائههای مایکروسافت پاورپوینت، اسناد مایکروسافت ورد، اسناد متنی ساده و فایلهای PDF بود.
با این راه اندازی، آمازون کندرا اکنون از هفت فرمت داده اضافی پشتیبانی می کند:
- فرمت متن غنی (RTF)
- نمادگذاری شی جاوا اسکریپت (JSON)
- مارک داون (MD)
- مقادیر جدا شده با کاما (CSV)
- مایکروسافت اکسل (MS Excel)
- زبان نشانه گذاری قابل توسعه (XML)
- تغییر شکلهای صفحه سبک سبک (XSLT)
کاربران آمازون کندرا می توانند این اسناد را با فرمت های داده های مختلف به دو روش زیر در فهرست خود وارد کنند:
بررسی اجمالی راه حل
در بخشهای بعدی، مراحل افزودن اسناد از یک منبع داده و انجام جستجو در آن اسناد را طی میکنیم.
نمودار زیر معماری راه حل ما را نشان می دهد.
برای آزمایش این راه حل برای هر یک از فرمت های پشتیبانی شده، باید از داده های خود استفاده کنید. می توانید با آپلود اسناد با فرمت های مشابه یا متفاوت در سطل S3 آزمایش کنید.
یک نمایه آمازون کندرا ایجاد کنید
برای دستورالعمل های مربوط به ایجاد نمایه آمازون کندرا، به ایجاد یک شاخص.
اگر فهرستی از قبل برای استفاده برای این نسخه نمایشی دارید، میتوانید از این مرحله رد شوید.
اسناد را در یک سطل S3 آپلود کنید و با استفاده از رابط S3 در فهرست قرار دهید
مراحل زیر را برای اتصال سطل S3 به فهرست خود انجام دهید:
- یک سطل S3 ایجاد کنید برای ذخیره اسناد شما
- یک پوشه ایجاد کنید نمونه-داده نامگذاری شده است.
- اسنادی را که می خواهید آزمایش کنید در پوشه آپلود کنید.
- در کنسول آمازون کندرا، به فهرست خود بروید و انتخاب کنید منابع داده.
- را انتخاب کنید منبع داده را اضافه کنید.
- تحت منابع داده های موجود، انتخاب کنید S3 و انتخاب کنید افزودن رابط.
- یک نام برای رابط خود وارد کنید (مانند
Demo_S3_connector
) و انتخاب کنید بعدی. - را انتخاب کنید S3 را مرور کنید و سطل S3 را که اسناد را در آن آپلود کرده اید انتخاب کنید.
- برای نقش IAM، نقش جدیدی ایجاد کنید.
- برای برنامه اجرای همگام سازی را تنظیم کنید، انتخاب کنید اجرا بر اساس تقاضا.
- را انتخاب کنید بعدی.
- بر بررسی و ایجاد کنید صفحه ، انتخاب کنید منبع داده را اضافه کنید.
- پس از تکمیل فرآیند ایجاد، انتخاب کنید همگام سازی اکنون.
اکنون که برخی از اسناد را دریافت کردهاید، میتوانید به کنسول جستجوی داخلی بروید تا سؤالات را آزمایش کنید.
اسناد خود را با کنسول جستجوی آمازون کندرا جستجو کنید
در کنسول آمازون کندرا، انتخاب کنید محتوای نمایه شده را جستجو کنید در صفحه ناوبری
در زیر نمونههایی از نتایج حاصل از جستجوی انواع مختلف سند آمده است:
- RTF – داده ها را با فرمت RTF که در سطل S3 آپلود شده اند وارد کنید و منبع داده را همگام سازی کنید:
تصویر زیر نتایج جستجو را نشان می دهد.
- JSON – داده ها را با فرمت JSON که در سطل S3 آپلود شده اند وارد کنید و منبع داده را همگام سازی کنید:
تصویر زیر نتایج جستجو را نشان می دهد.
- مدل های نشانه گذاری – داده ها را با فرمت MD که در سطل S3 آپلود شده اند وارد کنید و منبع داده را همگام سازی کنید:
تصویر زیر نتایج جستجو را نشان می دهد.
- CSV – داده ها را در قالب CSV که در سطل S3 آپلود شده اند وارد کنید و منبع داده را همگام سازی کنید:
تصویر زیر نتایج جستجو را نشان می دهد.
- اکسل – داده ها را با فرمت اکسل که در سطل S3 آپلود شده اند وارد کنید و منبع داده را همگام سازی کنید:
تصویر زیر نتایج جستجو را نشان می دهد.
- XML – داده ها را با فرمت XML که در سطل S3 آپلود شده اند وارد کنید و منبع داده را همگام سازی کنید:
تصویر زیر نتایج جستجو را نشان می دهد.
- XSLT – داده ها را با فرمت XSLT که در سطل S3 آپلود شده اند وارد کنید و منبع داده را همگام سازی کنید:
تصویر زیر نتایج جستجو را نشان می دهد.
پاک کردن
برای جلوگیری از متحمل شدن هزینه های آینده، منابعی را که به عنوان بخشی از این راه حل ایجاد کرده اید با استفاده از مراحل زیر پاکسازی کنید:
- در کنسول آمازون کندرا، انتخاب کنید شاخص در صفحه ناوبری
- فهرستی را انتخاب کنید که حاوی منبع داده برای حذف است.
- در صفحه پیمایش، را انتخاب کنید منابع داده.
- منبع داده را برای حذف انتخاب کنید، سپس انتخاب کنید حذف.
هنگامی که یک منبع داده را حذف می کنید، آمازون کندرا تمام اطلاعات ذخیره شده در مورد منبع داده را حذف می کند. آمازون کندرا تمام داده های سند ذخیره شده در فهرست، و تمام تاریخچه های اجرا و معیارهای مرتبط با منبع داده را حذف می کند. حذف منبع داده، اسناد اصلی را از فضای ذخیرهسازی شما حذف نمیکند.
- در کنسول آمازون کندرا، انتخاب کنید ایندکس ها در صفحه پیمایش.
- فهرست مورد نظر را برای حذف انتخاب کنید، سپس انتخاب کنید حذف.
به مراجعه حذف فهرست و منبع داده برای جزئیات بیشتر.
- در کنسول آمازون S3، را انتخاب کنید سطل در صفحه ناوبری
- سطلی را که می خواهید حذف کنید انتخاب کنید، سپس انتخاب کنید حذف.
- نام سطل را برای تایید حذف وارد کنید، سپس انتخاب کنید سطل را حذف کنید.
اگر سطل حاوی هر شیئی باشد، یک هشدار خطا دریافت خواهید کرد. سطل را قبل از حذف با انتخاب پیوند در پیام خطا و دنبال کردن دستورالعملهای روی آن خالی کنید سطل خالی صفحه سپس به سطل را حذف کنید صفحه و سطل را حذف کنید.
- برای تأیید اینکه سطل را حذف کرده اید، آن را باز کنید سطل صفحه را وارد کنید و نام سطلی را که حذف کرده اید وارد کنید. اگر سطل پیدا نشد، حذف شما با موفقیت انجام شد.
به مراجعه حذف یک صفحه سطلی برای جزئیات بیشتر.
نتیجه
در این پست، ما در مورد فرمت های داده جدید که Amazon Kendra اکنون پشتیبانی می کند بحث کردیم. علاوه بر این، نحوه استفاده از آمازون کندرا برای جذب و انجام جستجو در این انواع اسناد جدید ذخیره شده در یک سطل S3 را مورد بحث قرار دادیم. برای کسب اطلاعات بیشتر در مورد فرمت های مختلف داده های پشتیبانی شده، مراجعه کنید انواع اسناد.
ما شما را با اصول اولیه آشنا کردیم، اما بسیاری از ویژگی های اضافی وجود دارد که در این پست به آنها اشاره نکردیم، مانند موارد زیر:
- می توانید کنترل دسترسی مبتنی بر کاربر را برای فهرست آمازون Kendra خود فعال کنید و دسترسی به کاربران و گروه هایی را که پیکربندی می کنید محدود کنید.
- میتوانید فیلدهای اضافی را به ویژگیهای فهرست آمازون کندرا نگاشت کنید و آنها را برای صفحهبندی، جستجو و نمایش در نتایج جستجو فعال کنید.
- میتوانید کانکتورهای مختلف منبع داده شخص ثالث مانند Service Now و Salesforce را با قابلیت غنیسازی اسناد سفارشی (CDE) در Amazon Kendra ادغام کنید تا منطق نقشهبرداری ویژگیهای اضافی و حتی تغییر محتوای سفارشی را در حین دریافت انجام دهید. برای لیست کامل کانکتورهای پشتیبانی شده، مراجعه کنید اتصالات.
برای آشنایی با این احتمالات و موارد دیگر به ادامه مطلب مراجعه کنید راهنمای توسعه دهنده آمازون کندرا.
درباره نویسندگان
ریشابه یداو یک معمار Partner Solutions در AWS با پیشینه گسترده در DevOps و پیشنهادات امنیتی در AWS است. او با شرکای ASEAN کار می کند تا راهنمایی هایی در مورد پذیرش ابر سازمانی و بررسی های معماری به همراه ساخت تمرین AWS از طریق اجرای چارچوب Well-Architected ارائه دهد. خارج از محل کار، او دوست دارد وقت خود را در زمین ورزش و بازی های FPS بگذراند.
کروتی جایاسیمها رائو یک معمار راه حل های شریک با تمرکز بر هوش مصنوعی و ML است. او راهنمایی های فنی را برای شرکای AWS در پیروی از بهترین شیوه ها برای ایجاد راه حل های ایمن، انعطاف پذیر و بسیار در دسترس در AWS Cloud ارائه می دهد.
کیرتی کومار کالور مهندس توسعه نرم افزار در AWS است. او از 2 سال گذشته با تیم AWS Kendra بوده و روی ویژگیهای مختلف و همچنین مشتریان کار کرده است. او در اوقات فراغت خود دوست دارد فعالیت های خارج از منزل مانند پیاده روی، ورزش هایی مانند والیبال انجام دهد.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- پلاتوبلاک چین. Web3 Metaverse Intelligence. دانش تقویت شده دسترسی به اینجا.
- منبع: https://aws.amazon.com/blogs/machine-learning/new-expanded-data-format-support-in-amazon-kendra/
- 10
- 100
- 7
- a
- درباره ما
- دسترسی
- دقیق
- در میان
- فعالیت ها
- اضافه
- اضافی
- علاوه بر این
- اتخاذ
- پیشرفته
- AI
- هوشیار
- الگوریتم
- معرفی
- اجازه می دهد تا
- آمازون
- آمازون کندرا
- و
- پاسخ
- معماری
- آسه آن
- مرتبط است
- خواص
- در دسترس
- AWS
- زمینه
- مبانی
- شدن
- قبل از
- بهترین
- بهترین شیوه
- ساختن
- بنا
- ساخته شده در
- علت
- را انتخاب کنید
- انتخاب
- نزدیک
- ابر
- پذیرش ابر
- سازگاری
- کامل
- تکرار
- اتصال
- در نظر بگیرید
- با توجه به
- کنسول
- شامل
- محتوا
- کنترل
- هزینه
- پوشش
- ایجاد
- ایجاد شده
- ایجاد
- ایجاد
- سفارشی
- مشتریان
- داده ها
- جزئیات
- توسعه دهنده
- پروژه
- مختلف
- بحث و تبادل نظر
- بحث کردیم
- نمایش دادن
- سند
- اسناد و مدارک
- در طی
- به آسانی
- کارکنان
- قادر ساختن
- را قادر می سازد
- مهندس
- وارد
- سرمایه گذاری
- خطا
- حتی
- مثال ها
- اکسل
- موجود
- منبسط
- تجربه
- کارشناس
- وسیع
- عوامل
- امکانات
- رشته
- زمینه
- پرونده
- فایل ها
- تمرکز
- پیروی
- فرم
- قالب
- یافت
- فریم در ثانیه
- چارچوب
- غالبا
- از جانب
- آینده
- بازی
- دادن
- زمین
- Go
- گروه ها
- خیلی
- چگونه
- چگونه
- HTML
- HTTPS
- انسان
- انجام
- پیاده سازی
- in
- مشمول
- شاخص
- اطلاعات
- ورودی
- دستورالعمل
- ادغام
- هوشمند
- تعامل
- معرفی
- مسائل
- IT
- json
- کلید
- زبان
- بزرگ
- راه اندازی
- راه اندازی
- یاد گرفتن
- ارتباط دادن
- فهرست
- به دنبال
- بسیاری
- نقشه
- نقشه برداری
- پیام
- متریک
- مایکروسافت
- ML
- بیش
- MS
- چندگانه
- نام
- تحت عنوان
- طبیعی
- پردازش زبان طبیعی
- هدایت
- جهت یابی
- نیاز
- نیازهای
- جدید
- هدف
- اشیاء
- پیشنهادات
- پیشنهادات
- باز کن
- گزینه
- اصلی
- خارج از
- خود
- قطعه
- بخش
- شریک
- شرکای
- گذشته
- انجام
- کارایی
- انجام
- ساده
- افلاطون
- هوش داده افلاطون
- PlatoData
- فرصت
- پست
- تمرین
- شیوه های
- ارایهها در همایشهای علمی
- روند
- در حال پردازش
- ارائه
- فراهم می کند
- سوالات
- گرفتن
- برداشتن
- انعطاف پذیر
- منابع
- محدود کردن
- نتایج
- برگشت
- بازده
- بررسی
- نقش
- دویدن
- salesforce
- همان
- مقیاس پذیری
- جستجو
- بخش
- امن
- تیم امنیت لاتاری
- سرویس
- هفت
- نشان می دهد
- پس از
- نرم افزار
- توسعه نرم افزار
- راه حل
- مزایا
- برخی از
- منبع
- منابع
- خاص
- سرعت
- خرج کردن
- ورزش ها
- گام
- مراحل
- ذخیره سازی
- opbevare
- ذخیره شده
- ساخت یافته
- موفق
- چنین
- پشتیبانی
- پشتیبانی
- پشتیبانی از
- تیم
- فنی
- آزمون
- تست
- La
- مبانی
- شان
- شخص ثالث
- از طریق
- زمان
- به
- دگرگونی
- تحولات
- انواع
- یکپارچه
- منحصر به فرد
- آپلود شده
- آپلود
- استفاده کنید
- کاربران
- استفاده کنید
- ارزشها
- مختلف
- بررسی
- حجم
- راه
- کلمه
- مهاجرت کاری
- مشغول به کار
- با این نسخهها کار
- XML
- XSLT
- سال
- شما
- شما
- زفیرنت