Амазон Кендра — это высокоточный и простой в использовании интеллектуальный поисковый сервис, основанный на машинном обучении (ML). Amazon Kendra предлагает набор соединителей источников данных, упрощающих процесс загрузки и индексации вашего контента, где бы он ни находился.
Для многих организаций Box Content Cloud является основной частью их стратегии хранения контента и управления жизненным циклом. Корпоративная учетная запись Box часто содержит кладезь активов, таких как документы, презентации, статьи базы знаний и многое другое. Теперь, благодаря новому коннектору источника данных Amazon Kendra для Box, эти ресурсы и любые связанные с ними задачи или комментарии могут быть проиндексированы интеллектуальной поисковой службой Amazon Kendra для раскрытия контента и разблокировки ответов в ответ на запросы пользователей.
В этом посте мы покажем вам, как настроить новый коннектор Amazon Kendra Box для выборочного индексирования контента из репозитория Box Enterprise.
Обзор решения
Решение состоит из следующих высокоуровневых шагов:
- Создайте приложение Box для Amazon Kendra с помощью консоли разработчика Box.
- Добавьте образцы документов в свою учетную запись Box.
- Создайте источник данных Box через консоль Amazon Kendra.
- Проиндексируйте образцы документов из учетной записи Box.
Предпосылки
Чтобы опробовать коннектор Amazon Kendra для Box, вам потребуется следующее:
- An Аккаунт AWS с правами на создание Управление идентификацией и доступом AWS (IAM) роли и политики. Для получения дополнительной информации см. Обзор управления доступом: разрешения и политики.
- Базовые знания AWS и практические навыки администрирования Box Enterprise.
- Административный доступ к рабочему пространству Box Enterprise.
Создайте приложение Box для Amazon Kendra
Перед настройкой коннектора источника данных Amazon Kendra Box необходимо сначала создать приложение Box.
- Войдите в Box Enterprise Консоль разработчика.
- Выберите Создать новое приложение.
- Выберите Пользовательское приложение.
- Выберите Аутентификация сервера (с JWT).
- Введите имя для вашего приложения. Например,
KendraConnector
. - Выберите Создать приложение.
- В созданном вами приложении в Мои приложения, выбрать Конфигурация меню.
- В Уровень доступа к приложению раздел, выбрать Приложение + корпоративный доступ.
- В Сферы применения раздел, убедитесь, что включены следующие разрешения:
- В Расширенные функции раздел, выберите Выполнение вызовов API с использованием заголовка as-user.
- В Добавляйте открытые ключи и управляйте ими раздел, выбрать Создайте пару открытого/закрытого ключей.
Для этого требуется двухэтапная проверка. Текстовый файл JSON загружается на ваш компьютер.
- Выберите OK принять эту загрузку.
- Выберите Сохранить изменения.
- На Авторизация , выберите Обзор и отправка.
- Выберите Отправить приложение на этом предприятии , а затем выбрать Отправить.
Ваш владелец Box Enterprise должен одобрить приложение, прежде чем вы сможете его использовать.
Перейдите в каталог загрузок на своем компьютере, чтобы просмотреть загруженный файл JSON. Он содержит идентификатор клиента, секрет клиента, идентификатор открытого ключа, закрытый ключ, парольную фразу и идентификатор предприятия. Эти значения понадобятся вам для создания источника данных Box на более позднем этапе.
Добавьте образцы документов в свою учетную запись Box
На этом этапе вы загружаете образцы документов в свою учетную запись Box. Позже мы используем источник данных Amazon Kendra Box для сканирования и индексации этих документов.
- Скачать AWS_Whitepapers.zip к компьютеру.
- Извлеките файлы в папку с именем
AWS_Whitepapers
.
- Загрузить
AWS_Whitepapers
папку в свою учетную запись Box.
Создайте источник данных Box
Чтобы добавить источник данных в свой индекс Amazon Kendra с помощью соединителя Box, вы можете использовать существующий индекс Amazon Kendra или создать новый индекс Amazon Kendra. Затем выполните следующие шаги, чтобы создать источник данных Box:
- На консоли Amazon Kendra выберите Индексы в навигационной панели.
- Из списка индексов выберите индекс, в который вы хотите добавить источник данных.
- Выберите Добавить источники данных.
- В списке соединителей источников данных выберите Добавить разъем под Коробка.
- На Укажите сведения об источнике данных на странице введите имя источника данных и необязательное описание.
- Выберите Следующая.
- Откройте файл JSON, загруженный из консоли разработчика Box.
Он содержит значения для clientID
, clientSecret
, publicKeyID
, privateKey
, passphrase
и enterpriseID
.
- На Определение доступа и безопасности страница, в Источник раздел, для Идентификатор предприятия Box, введите значение
enterpriseID
поле. - В Аутентификация в разделе Секрет AWS Secrets Manager, выберите Создать и добавить новый секрет.
- Что касается Секретное имя, введите имя секрета, например,
boxsecret1
. - В остальные поля введите соответствующие значения из загруженного файла JSON.
- Выберите Сохранить и добавить секрет.
- В Роль IAM раздел, выбрать Создать новую роль (рекомендуется) и введите имя роли, например,
box-role
.
Дополнительные сведения о необходимых разрешениях для включения в роль IAM см. Роли IAM для источников данных.
- Выберите Следующая.
- На Настройте параметры синхронизации страница, в Область синхронизации вы можете включить в индекс веб-ссылки, комментарии и задачи Box в дополнение к содержимому файла. Используйте параметр по умолчанию (не отмечен) для этого сообщения.
- Что касается Дополнительная конфигурация (журнал изменений) – необязательный, используйте параметр по умолчанию (не отмечен).
- Что касается Дополнительная конфигурация (шаблоны регулярных выражений) — необязательно, выберите Включить шаблоны.
- Что касается Тип, выберите Path
- Что касается Путь — необязательно, введите путь к образцам документов, которые вы загрузили ранее:
AWS_Whitepapers/
. - Выберите Добавить.
- В Расписание запуска синхронизации раздел, выбрать Запуск по требованию.
- Выберите Следующая.
- На Установить сопоставление полей на странице вы можете определить, как источник данных сопоставляет атрибуты объектов Box с вашим индексом. Используйте настройки по умолчанию для этого поста.
- Выберите Следующая.
- На Просмотрите и создайте страницу, просмотрите сведения об источнике данных Box.
- Чтобы внести изменения, выберите Редактировать кнопку рядом с элементом, который вы хотите изменить.
- Когда закончите, выберите Добавить источник данных чтобы добавить источник данных Box.
После выбора Добавить источник данных, Amazon Kendra начнет создание источника данных. Создание источника данных может занять несколько минут. По завершении статус источника данных изменится с Creating
в Active
.
Примеры индексных документов из учетной записи Box
Вы настроили расписание запуска синхронизации источника данных для запуска по запросу, поэтому вам нужно запустить его вручную.
- На консоли Amazon Kendra перейдите к своему индексу.
- Выберите новый источник данных.
- Выберите Синхронизировать сейчас.
Текущее состояние синхронизации изменится на Syncing – crawling
затем Syncing – indexing
.
Примерно через 10 минут текущее состояние синхронизации изменится на idle
, последний статус синхронизации изменится на Successful
, и Синхронизация истории запуска панель показывает более подробную информацию, включая количество добавленных документов.
Проверить решение
Теперь, когда вы добавили технические документы AWS из своей учетной записи Box в свой индекс Amazon Kendra, вы можете протестировать некоторые запросы.
- На консоли Amazon Kendra выберите Поиск по проиндексированному контенту в навигационной панели.
- В поле запроса введите тестовый запрос, например
What databases are offered by AWS?
Вы также можете попробовать свои собственные запросы.
Поздравляем! Вы успешно использовали Amazon Kendra для получения ответов и идей на основе контента, проиндексированного из вашей учетной записи Box.
Убирать
Чтобы избежать будущих затрат, очистите ресурсы, созданные вами в рамках этого решения.
- Если вы создали новый индекс Amazon Kendra во время тестирования этого решения, удалите его.
- Если вы добавили новый источник данных с помощью соединителя Amazon Kendra для Box, удалите этот источник данных.
- Удалите
AWS_Whitepapers
папку и ее содержимое из вашей учетной записи Box.
Заключение
С помощью коннектора Amazon Kendra Box организации могут сделать бесценную информацию, хранящуюся в их учетных записях Box, доступной для своих пользователей безопасным образом с помощью интеллектуального поиска на базе Amazon Kendra.
В этом посте мы познакомили вас с основами, но есть много дополнительных функций, которые мы не рассмотрели. Например:
- Вы можете включить управление доступом на основе пользователей для своего индекса Amazon Kendra и ограничить доступ к документам Box на основе элементов управления доступом, которые вы уже настроили в Box.
- Вы можете индексировать дополнительные типы объектов Box, такие как задачи, комментарии и веб-ссылки.
- Вы можете сопоставить атрибуты объекта Box с атрибутами индекса Amazon Kendra и включить их для фасетирования, поиска и отображения в результатах поиска.
- Вы можете интегрировать источник данных Box с функцией Custom Document Enrichment (CDE) в Amazon Kendra для выполнения дополнительной логики сопоставления атрибутов и даже преобразования пользовательского содержимого во время загрузки.
Чтобы узнать об этих и других возможностях, см. Руководство разработчика по Amazon Kendra.
Об авторах
Боб Стрэхэн является главным архитектором решений в команде AWS Language AI Services.
- Коинсмарт. Лучшая в Европе биржа биткойнов и криптовалют.
- Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. БЕСПЛАТНЫЙ ДОСТУП.
- КриптоХок. Альткоин Радар. Бесплатная пробная версия.
- Источник: https://aws.amazon.com/blogs/machine-learning/getting-started-with-the-amazon-kendra-box-connector/
- "
- 10
- 100
- О нас
- доступ
- Учетная запись
- точный
- дополнение
- дополнительный
- администрация
- AI
- Услуги искусственного интеллекта
- Все
- уже
- Amazon
- API
- приложение
- утвердить
- статьи
- Активы
- Атрибуты
- Аутентификация
- доступен
- AWS
- Основы
- Коробка
- изменение
- Выберите
- облако
- Комментарии
- Конфигурация
- Консоли
- содержит
- содержание
- содержание
- контроль
- Основные
- Расходы
- создали
- Создающий
- Текущий
- изготовленный на заказ
- данным
- базы данных
- Спрос
- Застройщик
- Дисплей
- Документация
- загрузок
- включить
- Enter
- Предприятие
- пример
- Особенности
- Поля
- First
- после
- будущее
- получающий
- очень
- Как
- How To
- HTTPS
- Личность
- включают
- В том числе
- индекс
- информация
- размышления
- интегрировать
- Умный
- IT
- Основные
- знания
- язык
- УЧИТЬСЯ
- изучение
- связи
- Список
- машина
- обучение с помощью машины
- управление
- менеджер
- вручную
- карта
- Карты
- ML
- БОЛЕЕ
- Навигация
- номер
- Предложения
- организации
- собственный
- владелец
- сборах
- возможности,
- Presentations
- Основной
- частная
- Секретный ключ
- процесс
- что такое варган?
- публичный ключ
- осталось
- хранилище
- обязательный
- Полезные ресурсы
- ответ
- обзоре
- Run
- Поиск
- безопасно
- обслуживание
- Услуги
- набор
- установка
- So
- Решение
- Решения
- некоторые
- Начало
- и политические лидеры
- начинается
- Область
- Статус:
- диск
- Стратегия
- Успешно
- Поверхность
- задачи
- команда
- тестXNUMX
- Тестирование
- Основы
- трансформация
- отпереть
- использование
- пользователей
- ценностное
- проверка
- Web
- в то время как
- Статьи
- в
- работает