Генеративный ИИ Модели могут произвести революцию в работе предприятий, но предприятия должны тщательно продумать, как использовать их возможности, одновременно преодолевая такие проблемы, как защита данных и обеспечение качества контента, создаваемого ИИ.
Платформа извлечения дополненной генерации (RAG) дополняет подсказки внешними данными из нескольких источников, таких как репозитории документов, базы данных или API, чтобы сделать базовые модели эффективными для задач, специфичных для предметной области. В этом посте представлены возможности модели RAG и подчеркивается преобразующий потенциал MongoDB Atlas с его функцией векторного поиска.
Атлас MongoDB представляет собой интегрированный набор сервисов обработки данных, которые ускоряют и упрощают разработку приложений, управляемых данными. Хранилище векторных данных легко интегрируется с хранилищем операционных данных, устраняя необходимость в отдельной базе данных. Эта интеграция обеспечивает мощные возможности семантического поиска посредством Векторный поиск, быстрый способ создания семантического поиска и приложений на базе искусственного интеллекта.
Создатель мудреца Амазонки позволяет предприятиям создавать, обучать и развертывать модели машинного обучения (ML). Amazon SageMaker JumpStart предоставляет предварительно обученные модели и данные, которые помогут вам начать работу с машинным обучением. Вы можете получить доступ, настроить и развернуть предварительно обученные модели и данные через целевую страницу SageMaker JumpStart в Студия Amazon SageMaker всего за несколько кликов.
Amazon Lex — это диалоговый интерфейс, который помогает компаниям создавать чат-ботов и голосовых ботов, которые участвуют в естественном, реалистичном взаимодействии. Интегрируя Amazon Lex с генеративным искусственным интеллектом, компании могут создать целостную экосистему, в которой пользовательский ввод плавно превращается в последовательные и контекстуально релевантные ответы.
Обзор решения
Следующая диаграмма иллюстрирует архитектуру решения.
В следующих разделах мы рассмотрим шаги по реализации этого решения и его компонентов.
Настройка кластера MongoDB
Чтобы создать кластер MongoDB Atlas бесплатного уровня, следуйте инструкциям в разделе Создать кластер. Настройте базу данных доступ и сети доступ.
Развертывание модели внедрения SageMaker
Вы можете выбрать модель встраивания (ВСЕ MiniLM L6 v2) на странице SageMaker JumpStart Модели, ноутбуки, решения стр.
Выберите Развертывание для развертывания модели.
Убедитесь, что модель успешно развернута, и убедитесь, что конечная точка создана.
Векторное вложение
Векторное вложение это процесс преобразования текста или изображения в векторное представление. С помощью следующего кода мы можем генерировать векторные внедрения с помощью SageMaker JumpStart и обновлять коллекцию созданным вектором для каждого документа:
payload = {"text_inputs": [document[field_name_to_be_vectorized]]}
query_response = query_endpoint_with_json_payload(json.dumps(payload).encode('utf-8'))
embeddings = parse_response_multiple_texts(query_response) # update the document
update = {'$set': {vector_field_name : embeddings[0]}}
collection.update_one(query, update)
Приведенный выше код показывает, как обновить один объект в коллекции. Чтобы обновить все объекты, следуйте инструкциям инструкции.
Хранилище векторных данных MongoDB
Векторный поиск в Атласе MongoDB — это новая функция, которая позволяет хранить и искать векторные данные в MongoDB. Векторные данные — это тип данных, которые представляют точку в многомерном пространстве. Этот тип данных часто используется в приложениях машинного обучения и искусственного интеллекта. MongoDB Atlas Vector Search использует метод, называемый k-ближайшие соседи (k-NN) для поиска подобных векторов. k-NN работает путем поиска k векторов, наиболее похожих на заданный вектор. Наиболее похожими векторами являются те, которые наиболее близки к данному вектору по евклидову расстоянию.
Хранение векторных данных рядом с операционными данными может повысить производительность за счет уменьшения необходимости перемещения данных между различными системами хранения. Это особенно полезно для приложений, которым требуется доступ к векторным данным в режиме реального времени.
Создать индекс векторного поиска
Следующим шагом является создание Индекс векторного поиска MongoDB в векторном поле, созданном на предыдущем шаге. MongoDB использует knnVector
введите для индексации векторных вложений. Векторное поле должно быть представлено как массив чисел (только типы данных BSON int32, int64 или double).
Обратитесь к Обзор ограничений типа knnVector для получения дополнительной информации об ограничениях knnVector
тип.
Следующий код представляет собой пример определения индекса:
{ "mappings": { "dynamic": true, "fields": { "egVector": { "dimensions": 384, "similarity": "euclidean", "type": "knnVector" } } }
}
Обратите внимание, что размер должен соответствовать размеру вашей модели внедрения.
Запрос к хранилищу векторных данных
Вы можете запросить хранилище векторных данных, используя команду Конвейер агрегирования векторного поиска. Он использует индекс векторного поиска и выполняет семантический поиск в хранилище векторных данных.
Следующий код представляет собой пример определения поиска:
{ $search: { "index": "<index name>", // optional, defaults to "default" "knnBeta": { "vector": [<array-of-numbers>], "path": "<field-to-search>", "filter": {<filter-specification>}, "k": <number>, "score": {<options>} } }
}
Развертывание модели большого языка SageMaker
Модели основания SageMaker JumpStart — это предварительно обученные модели большого языка (LLM), которые используются для решения различных задач обработки естественного языка (NLP), таких как суммирование текста, ответы на вопросы и вывод на естественном языке. Они доступны в различных размерах и конфигурациях. В этом решении мы используем Обнимая лицо Модель ФЛАН-Т5-XL.
Найдите модель FLAN-T5-XL в SageMaker JumpStart.
Выберите Развертывание для настройки модели FLAN-T5-XL.
Убедитесь, что модель успешно развернута и конечная точка активна.
Создайте бота Amazon Lex
Чтобы создать бота Amazon Lex, выполните следующие шаги:
- На консоли Amazon Lex выберите Создать бота.
- Что касается Имя ботавведите имя.
- Что касается Роль времени выполнения, наведите на Создайте роль с базовыми разрешениями Amazon Lex.
- Укажите настройки языка, затем выберите Готово.
- Добавьте образец высказывания в
NewIntent
Пользовательский интерфейс и выберите Сохранить намерение. - Перейдите в
FallbackIntent
который был создан для вас по умолчанию и переключите Активные в Выполнение . - Выберите строить и после успешной сборки выберите Пусконаладка.
- Перед тестированием выберите значок шестеренки.
- Укажите AWS Lambda функция, которая будет взаимодействовать с MongoDB Atlas и LLM для предоставления ответов. Чтобы создать лямбда-функцию, выполните следующие действия. этим шагам.
- Теперь вы можете взаимодействовать с LLM.
Убирать
Чтобы очистить ресурсы, выполните следующие действия:
- Удалите бот Amazon Lex.
- Удалите функцию Лямбда.
- Удалите конечную точку LLM SageMaker.
- Удалите конечную точку модели внедрения SageMaker.
- Удалите кластер MongoDB Atlas.
Заключение
В статье мы показали, как создать простого бота, который использует семантический поиск MongoDB Atlas и интегрируется с моделью из SageMaker JumpStart. Этот бот позволяет быстро создавать прототипы взаимодействия пользователя с различными LLM в SageMaker Jumpstart, сопоставляя их с контекстом, происходящим из MongoDB Atlas.
Как всегда, AWS приветствует обратную связь. Пожалуйста, оставляйте свои отзывы и вопросы в разделе комментариев.
Об авторах
Игорь Алексеев является старшим архитектором партнерских решений в AWS в области данных и аналитики. В своей роли Игорь работает со стратегическими партнерами, помогая им создавать сложные архитектуры, оптимизированные для AWS. До прихода в AWS в качестве архитектора данных/решений он реализовал множество проектов в области больших данных, в том числе несколько озер данных в экосистеме Hadoop. В качестве инженера по обработке данных он занимался применением ИИ/МО для обнаружения мошенничества и автоматизации делопроизводства.
Бабу Сринивасан является старшим архитектором партнерских решений в MongoDB. В своей текущей роли он работает с AWS над созданием технических интеграций и эталонных архитектур для решений AWS и MongoDB. Он имеет более чем двадцатилетний опыт работы с базами данных и облачными технологиями. Он увлечен предоставлением технических решений клиентам, работающим с несколькими глобальными системными интеграторами (GSI) в разных регионах.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/retrieval-augmented-generation-with-langchain-amazon-sagemaker-jumpstart-and-mongodb-atlas-semantic-search/
- :имеет
- :является
- :куда
- $UP
- 100
- 200
- 321
- 361
- 7
- 9
- a
- О нас
- выше
- ускорять
- доступ
- через
- активный
- После
- агрегирование
- AI
- Поддержка
- AI / ML
- Все
- позволяет
- всегда
- Amazon
- Amazon Lex
- Создатель мудреца Амазонки
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- аналитика
- и
- API
- Приложения
- Применение
- архитектура
- МЫ
- массив
- искусственный
- искусственный интеллект
- AS
- At
- увеличивает
- автоматизация
- доступен
- AWS
- AWS Lambda
- основной
- BE
- полезный
- между
- большой
- Big Data
- Бот
- боты
- строить
- бизнес
- но
- by
- под названием
- CAN
- возможности
- осторожно
- проблемы
- chatbots
- Выберите
- чистым
- облако
- Кластер
- код
- ПОСЛЕДОВАТЕЛЬНЫЙ
- лыжных шлемов
- Комментарии
- полный
- комплекс
- компоненты
- Рассматривать
- Консоли
- содержание
- контекст
- диалоговый
- преобразование
- Создайте
- создали
- Текущий
- Клиенты
- настроить
- данным
- хранение данных
- управляемых данными
- База данных
- базы данных
- десятилетия
- По умолчанию
- по умолчанию
- определение
- развертывание
- развернуть
- обнаружение
- Развитие
- различный
- Размеры
- размеры
- расстояние
- документ
- домен
- двойной
- динамический
- экосистема
- Эффективный
- уничтожение
- вложения
- позволяет
- Конечная точка
- заниматься
- инженер
- обеспечение
- Enter
- Предприятие
- предприятий
- особенно
- Каждая
- опыт
- и, что лучший способ
- БЫСТРО
- Особенность
- Обратная связь
- несколько
- поле
- Поля
- фильтр
- обнаружение
- следовать
- после
- Что касается
- Год основания
- Рамки
- мошенничество
- обнаружение мошенничества
- Бесплатно
- от
- функция
- принадлежности
- порождать
- поколение
- генеративный
- Генеративный ИИ
- географии
- получить
- данный
- Глобальный
- упряжь
- Есть
- he
- помощь
- помощь
- помогает
- основной момент
- его
- целостный
- Как
- How To
- HTML
- HTTP
- HTTPS
- ICON
- иллюстрирует
- изображение
- осуществлять
- в XNUMX году
- улучшать
- in
- В том числе
- индекс
- информация
- вход
- инструкции
- интегрированный
- Интегрируется
- Интегрируя
- интеграции.
- интеграций
- Интеллекта
- взаимодействовать
- взаимодействие
- взаимодействие
- Интерфейс
- в
- вовлеченный
- IT
- ЕГО
- присоединение
- JSON
- всего
- озера
- посадка
- язык
- большой
- изучение
- Оставлять
- как живой
- недостатки
- LLM
- машина
- обучение с помощью машины
- сделать
- многих
- Совпадение
- ML
- модель
- Модели
- MongoDB
- БОЛЕЕ
- самых
- двигаться
- с разными
- должен
- имя
- натуральный
- Обработка естественного языка
- Необходимость
- сеть
- Новые
- следующий
- НЛП
- сейчас
- номера
- объект
- объекты
- of
- Офис
- .
- on
- те,
- только
- оперативный
- Операционный отдел
- or
- Возникнув
- преодоление
- обзор
- страница
- спаривание
- партнер
- партнеры
- страстный
- путь
- производительность
- выполняет
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- пожалуйста
- Точка
- После
- потенциал
- мощностью
- мощный
- разрабатывает
- предыдущий
- Предварительный
- процесс
- обработка
- проектов
- прототип
- обеспечивать
- приводит
- обеспечение
- вопрос
- Вопросы
- быстро
- реального времени
- снижение
- ссылка
- соответствующие
- представление
- представленный
- представляет
- требовать
- Полезные ресурсы
- ответы
- революционизировать
- Роли
- охрана
- sagemaker
- Гол
- легко
- Поиск
- Раздел
- разделах
- старший
- отдельный
- Услуги
- набор
- настройки
- несколько
- должен
- показал
- Шоу
- аналогичный
- просто
- упростить
- одинарной
- Размеры
- Решение
- Решения
- РЕШАТЬ
- Источники
- Space
- и политические лидеры
- Шаг
- Шаги
- диск
- магазин
- Стратегический
- стратегические партнеры
- успешный
- Успешно
- такие
- suite
- система
- системы
- задачи
- Технический
- техника
- технологии
- terms
- тестXNUMX
- Тестирование
- текст
- чем
- который
- Ассоциация
- их
- Их
- тогда
- они
- этой
- Через
- ярус
- в
- Train
- преобразующей
- переходы
- правда
- два
- напишите
- Типы
- ui
- Обновление ПО
- использование
- используемый
- Информация о пользователе
- использования
- через
- разнообразие
- проверить
- Режимы
- от
- законопроект
- Путь..
- we
- Web
- веб-сервисы
- приветствует
- в то время как
- будете
- работает
- работает
- Ты
- ВАШЕ
- зефирнет