Амазонка Кендра – це інтелектуальний пошуковий сервіс на основі машинного навчання (ML), що дозволяє організаціям надавати клієнтам і співробітникам відповідну інформацію, коли вона їм потрібна.
Amazon Kendra використовує алгоритми машинного навчання, щоб дозволити користувачам використовувати запити на природній мові для пошуку інформації, розпорошеної в багатьох джерелах даних на підприємстві, включно з поширеними системами зберігання документів, як-от Microsoft OneDrive.
OneDrive – це служба онлайнового хмарного зберігання, яка дозволяє розміщувати ваш вміст і автоматично синхронізувати його на кількох пристроях. Amazon Kendra може індексувати такі формати документів, як Microsoft OneNote, HTML, PDF, Microsoft Word, Microsoft PowerPoint, Microsoft Excel, форматований текст, JSON, XML, CSV, XSLT і звичайний текст.
Ми раді повідомити, що оновили конектор OneDrive для Amazon Kendra, щоб додати ще більше можливостей. Наприклад, ми додали підтримку для пошуку документів OneNote. Крім того, тепер ви можете використовувати ідентифікаційну інформацію або інформацію про список доступу, щоб зробити ваші пошуки більш детальними.
З’єднувач допомагає індексувати документи та інформацію про керування доступом до них, щоб обмежити результати пошуку лише тими документами, доступ до яких дозволено користувачеві. Для відображення результатів пошуку на основі прав доступу користувача та використання лише інформації про користувача з’єднувач надає сканер ідентифікації для завантаження основної інформації, такої як зіставлення користувачів і груп, у сховище основних.
У цій публікації ми демонструємо, як налаштувати кілька джерел даних в Amazon Kendra, щоб забезпечити центральне місце для пошуку у вашому сховищі документів.
Огляд рішення
Для нашого рішення ми демонструємо, як індексувати сховище або папку OneDrive за допомогою конектора Amazon Kendra для OneDrive. Рішення складається з наступних кроків:
- Створіть і налаштуйте додаток на Портал Microsoft Azure і отримати облікові дані для автентифікації.
- Створіть джерело даних OneDrive за допомогою консолі Amazon Kendra.
- Індексуйте дані в сховищі OneDrive.
- Виконайте зразок запиту, щоб отримати інформацію.
- Відфільтрувати запит за користувачами або групами.
Передумови
Щоб випробувати з’єднувач Amazon Kendra для OneDrive, потрібно:
Налаштуйте програму Azure і призначте дозволи на підключення
Перш ніж налаштувати джерело даних OneDrive, нам знадобляться деякі відомості про репозиторій OneDrive. Виконайте наступні дії:
- Увійдіть в Azure.
- Увійшовши за допомогою облікових даних свого облікового запису, виберіть Реєстрації додатків, Потім виберіть Нова реєстрація.
- Дайте відповідну назву своїй заявці та зареєструйте її.
- Зберіть інформацію про ідентифікатор клієнта, ідентифікатор орендаря та інші деталі програми.
- Щоб отримати секрет клієнта, виберіть Додайте сертифікат або секрет при Повноваження клієнта.
- Вибирати Новий секрет клієнта і надати відповідний опис і термін придатності.
- Зверніть увагу на значення client-id, tenant-id і secret-id. Ми використовуємо їх для автентифікації програми OAuth2.
- перейдіть до додатоквиберіть Дозволи API на панелі навігації та виберіть Додайте дозвіл.
- Вибирати Графік Microsoft.
- під Дозволи програми, введіть філе у рядку пошуку та в розділі Файли виберіть Файли. Читати. Все.
- Вибирати Додати дозволи
- Так само додайте наступні дозволи на Графік Microsoft варіант для програми, яку ви створили:
Group.Read.All
Notes.Read.All
Після завершення дозволи API виглядатимуть так, як на знімку екрана нижче.
Налаштуйте конектор Amazon Kendra для OneDrive
Щоб налаштувати конектор Amazon Kendra, виконайте такі кроки:
- На консолі Amazon Kendra виберіть «Створити індекс».
- для Ім'я індексу, введіть назву для індексу (наприклад,
my-onedrive-index
). - Введіть необов’язковий опис.
- Вибирати Створіть нову роль.
- для Назва ролі, введіть назву ролі IAM.
- Налаштуйте додаткові параметри шифрування та теги
- Вибирати МАЙБУТНІ
- У Налаштувати контроль доступу користувачів розділ, виберіть Так при Контроль доступу налаштування
- для Знак тип, вибрати JSON у спадному меню.
- Залиште решту значень стандартними.
- Вибирати МАЙБУТНІ
Перш ніж перейти до наступного кроку налаштування, нам потрібно надати Amazon Kendra роль, яка має дозволи, необхідні для підключення до сайту. Вони включають дозвіл на отримання та розшифрування секрету AWS Secrets Manager, який містить ідентифікатор програми та секретний ключ, необхідний для підключення до сайту OneDrive.
- Відкрийте іншу вкладку для облікового запису AWS і на консолі IAM перейдіть до ролі, яку ви створили раніше (наприклад,
AmazonKendra-us-west-2-onedrive
). - Вибирати Додати дозволи та Створіть вбудовану політику.
- для Обслуговуваннявиберіть Кендра.
- для Дії¸вибирай Запис і вкажіть
BatchPutDocument
. - для ресурсивиберіть Усі ресурси.
- Вибирати Огляд політики.
- для ІМ'Я, введіть назву (наприклад,
BatchPutPolicy
). - Вибирати Створити політику.
- Додайте цю політику до створеної ролі.
- Додатково прикріпіть
SecretsManagerReadWrite
Керована політика AWS для ролі - Поверніться на вкладку Amazon Kendra.
- Select Видання для розробників І вибирай Створювати.
Це створює та поширює роль IAM, а потім створює індекс Amazon Kendra, що може зайняти до 30 хвилин.
- Поверніться до консолі Amazon Kendra, виберіть Джерела даних на панелі навігації та виберіть Додати джерело даних.
- під Коннектор OneDrive V2.0виберіть Додати роз'єм.
- для Назва джерела даних, введіть назву (наприклад,
my-onedrive
). - Введіть необов’язковий опис.
- Вибирати МАЙБУТНІ.
- для Ідентифікатор клієнта OneDrive, введіть ідентифікатор орендаря, який ви зібрали раніше.
- для Налаштуйте VPC і групу безпеки, залиште значення за замовчуванням (Немає VPC).
- тримати Ідентифікаційний сканер увімкнено вибрано. Це імпортує ідентифікаційну інформацію в індекс.
- Для ролі IAM виберіть Створіть нову роль.
- Введіть назву ролі, наприклад
AmazonKendra-us-west-2-onedrive
, Потім виберіть МАЙБУТНІ. - У Authentication розділ, вибрати Створіть і додайте секрет.
- Створіть секрет за допомогою
clientId
таclientSecret
як ключі. - Додайте їх відповідні значення до інформації, яку ви зібрали раніше.
- Вибирати МАЙБУТНІ.
- У Налаштувати параметри синхронізації додайте користувачів OneDrive, чиї документи потрібно проіндексувати.
- Виберіть режим синхронізації для покажчика. Для цієї публікації ми вибираємо Синхронізація нового, зміненого або видаленого вмісту.
- Виберіть частоту індексації як Запуск на вимогу, Потім виберіть Далі.
Увімкнення зіставлення полів дає змогу встановити можливість пошуку та релевантність полів. Наприклад, lastUpdatedAt
поле може сортувати або підвищувати рейтинг документів на основі того, як нещодавно його було оновлено.
- Зберегти всі значення за замовчуванням у Встановити відображення полів розділ і виберіть МАЙБУТНІ.
- Виберіть на сторінці огляду Додати джерело даних
- Вибирати Синхронізуйте зараз
Синхронізація може тривати до 30 хвилин.
Перевірте розчин
Тепер, коли ви проіндексували вміст із OneDrive, ви можете перевірити його, зробивши запит на індекс.
- Перейдіть до свого покажчика на консолі Amazon Kendra та виберіть Пошук індексованого вмісту у навігаційній панелі.
- Введіть пошуковий термін і натисніть
Що натомість? Створіть віртуальну версію себе у
.
Зауважте, що без маркера ACL запобігає поверненню результатів пошуку.
- Розширювати Тестовий запит із маркером доступу І вибирай Застосувати маркер.
- Введіть відповідний маркер для користувача, який має дозвіл читати файл, і виберіть Застосовувати.
- Знову знайдіть інформацію, наявну в OneDrive.
Ви можете переконатися, що Amazon Kendra надає ранжовані результати належним чином.
Вітаємо, ви налаштували Amazon Kendra для індексування та пошуку документів у OneDrive та керування доступом до них за допомогою ACL.
Висновок
Завдяки роз’єму Microsoft OneDrive V2 для Amazon Kendra організації можуть отримати доступ до часто використовуваних корпоративних сховищ документів, безпечно використовуючи інтелектуальний пошук на основі Amazon Kendra. Ви можете покращити пошук, інтегрувавши джерело даних із можливістю Custom Document Enrichment (CDE) в Amazon Kendra, щоб виконувати додаткову логіку відображення атрибутів і навіть користувальницьке перетворення вмісту під час прийому.
Про авторів
Правінчандра Варма є старшим архітектором обслуговування клієнтів у команді AWS Professional Services і захоплюється програмами машинного навчання та послугами штучного інтелекту.
Супратим Барат є інженером-розробником програмного забезпечення в команді AWS Kendra Yellowbadge і є ентузіастом блокчейну та кібербезпеки
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- Платоблокчейн. Web3 Metaverse Intelligence. Розширені знання. Доступ тут.
- Карбування майбутнього з Адріенн Ешлі. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/announcing-the-updated-microsoft-onedrive-connector-v2-for-amazon-kendra/
- : має
- :є
- $UP
- 7
- a
- МЕНЮ
- доступ
- рахунки
- через
- доданий
- Додатковий
- Додатково
- алгоритми
- ВСІ
- дозволяє
- Amazon
- Амазонка Кендра
- та
- Оголосити
- Оголошуючи
- Інший
- API
- додаток
- додаток
- застосування
- відповідний
- штучний
- штучний інтелект
- AS
- приєднувати
- Authentication
- автоматично
- AWS
- Професійні послуги AWS
- Лазурний
- бар
- заснований
- буття
- blockchain
- підвищення
- by
- CAN
- можливості
- центральний
- сертифікат
- Вибирати
- клієнт
- хмара
- Cloud Storage
- зазвичай
- повний
- завершення
- конфігурація
- З'єднуватися
- З'єднувальний
- зв'язку
- Консоль
- містить
- зміст
- контроль
- гусеничний
- створювати
- створений
- створює
- Повноваження
- виготовлений на замовлення
- клієнт
- Клієнти
- кібер-
- кібер-безпеки
- дані
- Розшифрувати
- дефолт
- за замовчуванням
- доставка
- демонструвати
- description
- деталі
- Розробник
- прилади
- документ
- документація
- під час
- Раніше
- співробітників
- включіть
- дозволяє
- шифрування
- інженер
- Що натомість? Створіть віртуальну версію себе у
- підприємство
- Навіть
- приклад
- перевершувати
- збуджений
- очікуваний
- досвід
- термін дії
- кілька
- поле
- Поля
- філе
- Файли
- після
- для
- частота
- від
- отримати
- Group
- Групи
- Мати
- допомагає
- господар
- Як
- How To
- HTML
- HTTPS
- ID
- Особистість
- імпорт
- in
- включати
- У тому числі
- індекс
- інформація
- Інтеграція
- Інтелект
- Розумний
- IT
- json
- ключ
- ключі
- мова
- вивчення
- Залишати
- як
- МЕЖА
- загрузка
- подивитися
- виглядає як
- машина
- навчання за допомогою машини
- зробити
- вдалося
- менеджер
- відображення
- Меню
- Microsoft
- хвилин
- ML
- режим
- модифікований
- більше
- рухатися
- множинний
- ім'я
- Природний
- Переміщення
- навігація
- необхідно
- Необхідність
- Нові
- наступний
- of
- on
- онлайн
- варіант
- організації
- Інше
- наші
- сторінка
- pane
- пристрасний
- Виконувати
- дозвіл
- Дозволи
- місце
- одноколірний
- plato
- Інформація про дані Платона
- PlatoData
- політика
- пошта
- Харчування
- представити
- подарунки
- press
- запобігати
- Головний
- професійний
- правильний
- забезпечувати
- забезпечує
- запити
- ранг
- Ранжування
- Читати
- нещодавно
- реєструвати
- актуальність
- доречний
- решті
- Сховище
- ті
- результат
- результати
- огляд
- Багаті
- праві
- Роль
- розсіяний
- Пошук
- секрет
- розділ
- безпечно
- безпеку
- обраний
- старший
- обслуговування
- Послуги
- комплект
- налаштування
- Показувати
- сайт
- Софтвер
- рішення
- Source
- Джерела
- Крок
- заходи
- зберігання
- зберігати
- магазинів
- такі
- підтримка
- Systems
- Приймати
- Кран
- команда
- орендар
- тест
- Що
- Команда
- інформація
- їх
- Їх
- Ці
- до
- знак
- Перетворення
- при
- оновлений
- використання
- використовуваний
- користувач
- користувачі
- Цінності
- перевірити
- через
- який
- ВООЗ
- волі
- з
- без
- слово
- XML
- XSLT
- Ти
- вашу
- зефірнет