At AWS Re: Invent 2023 года мы объявили о широкой доступности Базы знаний для Amazon Bedrock. Имея базу знаний, вы можете безопасно соединить модели фундамента (FM) в Коренная порода Амазонки в данные вашей компании для полностью управляемой поисковой дополненной генерации (RAG).
В предыдущей публикации, мы описали, как базы знаний для Amazon Bedrock управляют сквозным рабочим процессом RAG, и поделились подробностями о некоторых недавних запусках функций.
Для приложений на основе RAG точность сгенерированного ответа из моделей большого языка (LLM) зависит от контекста, предоставленного модели. Контекст извлекается из базы данных векторов на основе запроса пользователя. Семантический поиск широко используется, поскольку он способен понимать более человеческие вопросы — запрос пользователя не всегда напрямую связан с точными ключевыми словами в контенте, который на него отвечает. Семантический поиск помогает дать ответы, исходя из смысла текста. Однако у него есть ограничения по захвату всех релевантных ключевых слов. Его производительность зависит от качества встраивания слов, используемых для представления смысла текста. Чтобы преодолеть такие ограничения, сочетание семантического поиска с поиском по ключевым словам (гибридным) даст лучшие результаты.
В этом посте мы обсуждаем новую функцию гибридного поиска, которую вы можете выбрать в качестве варианта запроса наряду с семантическим поиском.
Обзор гибридного поиска
Гибридный поиск использует преимущества нескольких алгоритмов поиска, объединяя их уникальные возможности для повышения релевантности возвращаемых результатов поиска. В приложениях на основе RAG возможности семантического поиска обычно сочетаются с традиционным поиском по ключевым словам для повышения релевантности результатов поиска. Это позволяет осуществлять поиск как по содержанию документов, так и по их основному смыслу. Например, рассмотрим следующий запрос:
В этом запросе по названию книги и названию веб-сайта поиск по ключевым словам даст лучшие результаты, поскольку нам нужна стоимость конкретной книги. Однако у термина «стоимость» могут быть такие синонимы, как «цена», поэтому лучше будет воспользоваться семантическим поиском, понимающим смысл текста. Гибридный поиск сочетает в себе лучшее из обоих подходов: точность семантического поиска и охват ключевых слов. Он отлично работает для приложений на основе RAG, где средству извлечения приходится обрабатывать широкий спектр запросов на естественном языке. Ключевые слова помогают охватить конкретные объекты запроса, такие как название продукта, цвет и цена, а семантика лучше понимает значение и цель запроса. Например, если вы хотите создать чат-бота для веб-сайта электронной коммерции, который будет обрабатывать запросы клиентов, такие как политика возврата или подробная информация о продукте, наиболее подходящим будет использование гибридного поиска.
Варианты использования гибридного поиска
Ниже приведены некоторые распространенные случаи использования гибридного поиска:
- Открытый ответ на вопрос по домену – Это предполагает ответы на вопросы по широкому кругу тем. Это требует поиска в больших коллекциях документов с разнообразным содержанием, например данных веб-сайтов, которые могут включать различные темы, такие как устойчивое развитие, лидерство, финансовые результаты и многое другое. Семантический поиск сам по себе не может хорошо обобщить эту задачу, поскольку ему не хватает возможностей для лексического сопоставления невидимых сущностей, что важно для обработки примеров вне предметной области. Таким образом, сочетание поиска по ключевым словам с семантическим поиском может помочь сузить область применения и обеспечить лучшие результаты для ответов на вопросы в открытой области.
- Контекстные чат-боты – Разговоры могут быстро менять направление и охватывать непредсказуемые темы. Гибридный поиск лучше справляется с такими открытыми диалогами.
- Персональный поиск – Поиск в масштабе сети по разнородному контенту выигрывает от гибридного подхода. Семантический поиск обрабатывает популярные запросы, а ключевые слова охватывают редкие запросы с длинным хвостом.
Хотя гибридный поиск обеспечивает более широкий охват за счет объединения двух подходов, семантический поиск имеет преимущества в точности, когда предметная область узка и семантика четко определена или когда мало места для неправильной интерпретации, как, например, в системах фактического вопроса и ответа.
Преимущества гибридного поиска
Как поиск по ключевым словам, так и семантический поиск вернут отдельный набор результатов вместе с их оценками релевантности, которые затем объединяются для получения наиболее релевантных результатов. Базы знаний для Amazon Bedrock в настоящее время поддерживают четыре векторных хранилища: Amazon OpenSearch без сервера, Версия, совместимая с Amazon Aurora PostgreSQL, сосновая шишкаи Корпоративное облако Redis. На момент написания этой статьи функция гибридного поиска доступна для OpenSearch Serverless, а поддержка других векторных хранилищ появится в ближайшее время.
Ниже приведены некоторые преимущества использования гибридного поиска:
- Повышенная точность – Точность формируемого ответа ФМ напрямую зависит от релевантности полученных результатов. Судя по вашим данным, может быть сложно повысить точность вашего приложения только с помощью семантического поиска. Ключевым преимуществом использования гибридного поиска является повышение качества получаемых результатов, что, в свою очередь, помогает FM генерировать более точные ответы.
- Расширенные возможности поиска – Поиск по ключевым словам охватывает более широкую сеть и находит документы, которые могут быть релевантными, но могут не содержать семантическую структуру во всем документе. Он позволяет осуществлять поиск по ключевым словам, а также смысловому значению текста, тем самым расширяя возможности поиска.
В следующих разделах мы покажем, как использовать гибридный поиск с базами знаний для Amazon Bedrock.
Используйте гибридный и семантический поиск через SDK.
Когда вы вызываете API получения, базы знаний для Amazon Bedrock выбирают для вас правильную стратегию поиска, чтобы предоставить вам наиболее релевантные результаты. У вас есть возможность переопределить его для использования гибридного или семантического поиска в API.
Получить API
API получения предназначен для получения релевантных результатов поиска путем предоставления запроса пользователя, идентификатора базы знаний и количества результатов, которые вы хотите, чтобы API возвращал. Этот API преобразует пользовательские запросы во внедрения, выполняет поиск в базе знаний с помощью гибридного поиска или семантического (векторного) поиска и возвращает соответствующие результаты, предоставляя вам больше контроля над созданием пользовательских рабочих процессов поверх результатов поиска. Например, вы можете добавить логику постобработки к полученным результатам или добавить собственное приглашение и подключиться к любому FM, предоставленному Amazon Bedrock, для генерации ответов.
Чтобы показать вам пример переключения между гибридным и семантическим (векторным) вариантами поиска, мы создали базу знаний с помощью Документ Amazon 10K на 2023 год. Более подробную информацию о создании базы знаний см. Создайте контекстное приложение чат-бота, используя базы знаний для Amazon Bedrock..
Чтобы продемонстрировать ценность гибридного поиска, мы используем следующий запрос:
Ответ на предыдущий запрос включает несколько ключевых слов, например date
, physical stores
и North America
. Правильный ответ 22,871 thousand square feet
. Давайте посмотрим на разницу в результатах поиска как для гибридного, так и для семантического поиска.
Следующий код показывает, как использовать гибридный или семантический (векторный) поиск с помощью API получения с Boto3:
Ассоциация overrideSearchType
вариант в retrievalConfiguration
предлагает выбор: использовать либо HYBRID
or SEMANTIC
. По умолчанию он выберет для вас правильную стратегию, чтобы получить наиболее релевантные результаты, и если вы хотите переопределить параметр по умолчанию для использования гибридного или семантического поиска, вы можете установить значение HYBRID/SEMANTIC
. Выход Retrieve
API включает извлеченные фрагменты текста, тип местоположения и URI исходных данных, а также оценки релевантности извлеченных данных. Оценки помогают определить, какие фрагменты лучше всего соответствуют ответу на запрос.
Ниже приведены результаты предыдущего запроса с использованием гибридного поиска (некоторые результаты отредактированы для краткости):
Ниже приведены результаты семантического поиска (некоторые результаты отредактированы для краткости):
Как видно из результатов, гибридный поиск смог получить результаты поиска с арендованными квадратными метрами для физических магазинов в Северной Америке, как указано в пользовательском запросе. Основная причина заключалась в том, что гибридный поиск мог объединять результаты по таким ключевым словам, как date
, physical stores
и North America
в запросе, тогда как семантический поиск этого не сделал. Поэтому, когда результаты поиска дополняются пользовательским запросом и подсказкой, FM не сможет предоставить правильный ответ в случае семантического поиска.
Теперь давайте посмотрим на RetrieveAndGenerate
API с гибридным поиском для понимания окончательного ответа, сгенерированного FM.
Получить и создать API
Ассоциация RetrieveAndGenerate
API запрашивает базу знаний и генерирует ответ на основе полученных результатов. Вы указываете идентификатор базы знаний, а также FM, чтобы сгенерировать ответ на основе результатов. Amazon Bedrock преобразует запросы во внедрения, запрашивает базу знаний на основе типа поиска, а затем дополняет приглашение FM результатами поиска в качестве контекстной информации и возвращает ответ, сгенерированный FM.
Давайте воспользуемся запросом «Какова арендованная площадь физических магазинов в Северной Америке по состоянию на 31 декабря 2023 года?» и спроси RetrieveAndGenerate
API для генерации ответа с помощью нашего запроса:
Ниже приведены результаты использования гибридного поиска:
Ниже приведены результаты семантического поиска:
Фактический ответ на запрос 22,871 thousand leased square feet
, который генерируется гибридным поиском. Полученные результаты гибридного поиска включали информацию об арендованных площадях для физических магазинов в Северной Америке, тогда как семантический поиск не смог получить нужную информацию из векторного магазина из-за перевода вложений. Таким образом, FM не смог дать правильный ответ, поскольку у него не было правильных и наиболее релевантных результатов поиска.
Однако для более общих вопросов, которые не затрагивают такие сущности, как physical stores
or North America
Как гибридный, так и семантический поиск дают схожие результаты.
Ниже приведены примеры ответов на несколько запросов, демонстрирующие случаи, когда гибридный и семантический поиск дают схожие результаты.
Question | Семантический поиск: RAG API | Гибридный поиск: RAG API |
Как Amazon обслуживает разработчиков и предприятия? | Мы обслуживаем разработчиков и предприятия любого размера, включая стартапы, государственные учреждения и академические учреждения, через AWS, который предлагает широкий набор технологических услуг по требованию, включая вычисления, хранение, базы данных, аналитику и машинное обучение, а также другие услуги | Мы обслуживаем разработчиков и предприятия любого размера, включая стартапы, государственные учреждения и академические учреждения, через AWS, который предлагает широкий набор технологических услуг по требованию, включая вычисления, хранение, базы данных, аналитику и машинное обучение, а также другие услуги. |
Кто является исполнительными директорами и директорами Amazon по состоянию на 24 января 2024 г.? | По состоянию на 2024 год в состав исполнительных директоров Amazon входят Эндрю Р. Джасси в качестве президента и главного исполнительного директора, Дуглас Дж. Херрингтон в качестве генерального директора Amazon Stores по всему миру, Брайан Т. Олсавски в качестве старшего вице-президента и финансового директора, Шелли Л. Рейнольдс в качестве вице-президента. , международный контролер и главный бухгалтер, Адам Н. Селипски в качестве генерального директора Amazon Web Services и Дэвид А. Запольски в качестве старшего вице-президента по глобальной государственной политике и главного юрисконсульта. | С 2024 года Джеффри П. Безос является исполнительным председателем Amazon.com. Эндрю Р. Ясси является президентом и главным исполнительным директором. В число других исполнительных директоров входят Дуглас Дж. Херрингтон в качестве генерального директора Amazon Stores по всему миру, Брайан Т. Олсавски в качестве старшего вице-президента и финансового директора, Шелли Л. Рейнольдс в качестве вице-президента, международного контролера и главного бухгалтера, а также Адам Н. Селипски в качестве генерального директора. Веб-сервисы Amazon. Дэвид А. Запольски занимает должность старшего вице-президента по глобальной государственной политике и главного юрисконсульта. |
Используйте гибридный и семантический поиск через консоль Amazon Bedrock.
Чтобы использовать параметры гибридного и семантического поиска в консоли Amazon Bedrock, выполните следующие действия:
- На консоли Amazon Bedrock выберите База знаний в навигационной панели.
- Выберите базу знаний, которую вы создали.
- Выберите Тестовая база знаний.
- Выберите значок конфигурации.
- Что касается Тип поискаВыбрать Гибридный поиск (семантический и текстовый).
По умолчанию вы можете выбрать FM, чтобы получить сгенерированный ответ на ваш запрос. Если вы хотите видеть только полученные результаты, вы можете переключить Создать ответ выключено, чтобы получить только полученные результаты.
Заключение
В этом посте мы рассмотрели новую функцию запросов в базах знаний для Amazon Bedrock, которая обеспечивает гибридный поиск. Мы узнали, как настроить опцию гибридного поиска в SDK и консоли Amazon Bedrock. Это помогает преодолеть некоторые ограничения, связанные с использованием исключительно семантического поиска, особенно при поиске в больших коллекциях документов с разнообразным содержанием. Использование гибридного поиска зависит от типа документа и варианта использования, который вы пытаетесь реализовать.
Дополнительные ресурсы см. в следующих разделах:
Рекомендации
Повышение производительности поиска в конвейерах RAG с помощью гибридного поиска
Об авторах
Мани Хануджа — технический руководитель, специалисты по генеративному искусственному интеллекту, автор книги «Прикладное машинное обучение и высокопроизводительные вычисления на AWS», а также член совета директоров Фонда образования женщин в производстве. Она возглавляет проекты машинного обучения в различных областях, таких как компьютерное зрение, обработка естественного языка и генеративный искусственный интеллект. Она выступает на внутренних и внешних конференциях, таких как AWS re:Invent, Women in Manufacturing West, вебинарах YouTube и GHC 23. В свободное время она любит совершать длительные пробежки по пляжу.
Паллави Наргунд — главный архитектор решений в AWS. В своей роли специалиста по облачным технологиям она работает с клиентами, чтобы понять их цели и проблемы, а также дает рекомендации по достижению их целей с помощью предложений AWS. Она увлечена женщинами в сфере технологий и является одним из основных членов организации «Женщины в искусственном интеллекте и машинном обучении» в Amazon. Она выступает на внутренних и внешних конференциях, таких как AWS re:Invent, AWS Summits и вебинарах. Вне работы она увлекается волонтерством, садоводством, ездой на велосипеде и пешим туризмом.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/knowledge-bases-for-amazon-bedrock-now-supports-hybrid-search/
- :имеет
- :является
- :нет
- :куда
- ][п
- 1
- 100
- 10K
- 125
- 17
- 2021
- 2022
- 2023
- 2024
- 22
- 23
- 24
- 28
- 30
- 31
- 31
- 32
- 43
- 54
- 60
- 7
- 72
- 8
- 9
- a
- в состоянии
- О нас
- академический
- Бухгалтерский учет
- точность
- точный
- Достигать
- приобретенный
- фактического соединения
- Адам
- Добавить
- дополнительный
- плюс
- Преимущества
- агентствах
- AI
- AI / ML
- самолет
- алгоритмы
- Все
- позволяет
- в одиночестве
- вдоль
- рядом
- всегда
- Amazon
- Amazon Web Services
- Amazon.com
- Америка
- амортизация
- an
- аналитика
- и
- Эндрю
- объявило
- ответ
- ответ
- ответы
- любой
- API
- Применение
- Приложения
- прикладной
- подхода
- подходы
- МЫ
- AS
- спросить
- Активы
- At
- дополненная
- увеличивает
- Aurora
- автор
- свободных мест
- доступен
- AWS
- AWS Re: Invent
- Использование темпера с изогнутым основанием
- основанный
- BE
- Beach
- , так как:
- польза
- Преимущества
- ЛУЧШЕЕ
- Лучшая
- между
- Безос
- миллиард
- доска
- совет директоров
- книга
- изоферменты печени
- Брайан
- Приносит
- широкий
- строить
- Строительство
- зданий
- но
- by
- призывают
- CAN
- возможности
- Пропускная способность
- Захват
- случаев
- случаев
- Центр
- Генеральный директор
- Кресла
- проблемы
- сложные
- изменение
- Chatbot
- главный
- Глава исполнительной власти
- Директор компании
- выбор
- Выберите
- облако
- ОБЛАЧНЫЕ ТЕХНОЛОГИИ
- код
- Коллекции
- цвет
- COM
- объединять
- сочетании
- комбинируя
- приход
- Скоро
- Общий
- обычно
- Компания
- полный
- Вычисление
- компьютер
- Компьютерное зрение
- вычисление
- конференции
- Свяжитесь
- Рассматривать
- Консоли
- строительство
- содержать
- содержание
- содержание
- контекст
- контекстной
- контроль
- контроллер
- Беседы
- Основные
- Корпоративное
- исправить
- Цена
- Расходы
- адвокат
- чехол для варгана
- охват
- покрытый
- создали
- Создающий
- В настоящее время
- изготовленный на заказ
- клиент
- Клиенты
- данным
- Центр обработки данных
- База данных
- Давид
- Декабрь
- По умолчанию
- демонстрировать
- демонстрирующий
- зависимый
- зависит
- амортизация
- описано
- описание
- предназначенный
- подробнее
- Определять
- застройщиков
- DID
- разница
- направление
- непосредственно
- Директора
- обсуждать
- Разное
- do
- документ
- Документация
- приносит
- домен
- доменов
- Dont
- Дуглас
- вниз
- два
- в течение
- электронной коммерции
- Обучение
- или
- Enabler
- позволяет
- впритык
- повышать
- вошел
- Предприятие
- предприятий
- лиц
- Оборудование
- особенно
- пример
- Примеры
- исполнительный
- Должностное лицо
- расширяющийся
- и, что лучший способ
- средства
- Особенность
- несколько
- окончательный
- финансы
- финансовый
- находит
- после
- следующим образом
- Что касается
- Год основания
- 4
- Бесплатно
- от
- полностью
- Общие
- порождать
- генерируется
- генерирует
- порождающий
- поколение
- генеративный
- Генеративный ИИ
- получить
- Дайте
- Отдаете
- Глобальный
- Go
- Цели
- Правительство
- государственные учреждения
- большой
- валовой
- руководство
- обрабатывать
- Ручки
- Управляемость
- Есть
- помощь
- помогает
- ее
- High
- Как
- How To
- Однако
- HTTPS
- Гибридный
- ICON
- ID
- if
- осуществлять
- важную
- улучшать
- улучшенный
- in
- Стимулы
- включают
- включены
- включает в себя
- В том числе
- информация
- вход
- учреждения
- Интегрируя
- намерение
- в нашей внутренней среде,
- Мультиязычность
- в
- включать в себя
- включает в себя
- IT
- ЕГО
- январь
- Январь 24г.
- Джеффри
- JPG
- Основные
- ключевые слова
- знания
- Земля
- язык
- большой
- запускает
- вести
- Наша команда
- Лиды
- узнали
- изучение
- аренда
- такое как
- нравится
- недостатки
- мало
- расположение
- логика
- Длинное
- посмотреть
- машина
- обучение с помощью машины
- Главная
- управляемого
- управляет
- производство
- Совпадение
- согласование
- Май..
- смысл
- член
- упомянутый
- может быть
- миллионы
- модель
- Модели
- БОЛЕЕ
- самых
- с разными
- имя
- Узкий
- натуральный
- Обработка естественного языка
- Навигация
- сеть
- сеть
- сетей
- Новые
- север
- Северная Америка
- в своих размышлениях
- сейчас
- номер
- цель
- наблюдать
- of
- от
- Предложения
- Предложения
- Офис
- сотрудник
- офицеров
- on
- On-Demand
- только
- открытый
- операционный
- Опция
- Опции
- or
- Другое
- наши
- выходной
- внешнюю
- за
- Преодолеть
- переопределение
- собственный
- хлеб
- страстный
- производительность
- период
- физический
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- политика
- Популярное
- После
- предшествующий
- Точность
- президент
- цена
- Основной
- обработка
- Продукт
- проектов
- собственность
- обеспечивать
- при условии
- обеспечение
- что такое варган?
- Запросы
- запрос
- вопрос
- Вопросы
- R
- тряпка
- быстро
- РЕДКИЙ
- RE
- причина
- Получать
- последний
- записанный
- снижение
- относиться
- Связанный
- актуальность
- соответствующие
- опираясь
- представлять
- требуется
- Полезные ресурсы
- ответ
- ответы
- результат
- Итоги
- поиск
- возвращают
- Возвращает
- правую
- Роли
- Комната
- работает
- образец
- сфера
- Гол
- SDK
- Поиск
- поиск
- поиск
- разделах
- безопасно
- посмотреть
- сегмент
- выберите
- семантический
- семантика
- старший
- отдельный
- служить
- сервер
- Serverless
- служит
- Услуги
- набор
- общие
- она
- показывать
- Шоу
- аналогичный
- Размеры
- So
- только
- Решения
- некоторые
- скоро
- Источник
- Говорит
- специалисты
- конкретный
- площадь
- стартапов
- Шаги
- диск
- магазин
- магазины
- Стратегия
- сильные
- Структура
- такие
- подходящее
- Вершины
- поддержка
- Поддержка
- Стабильность
- системы
- ТАБЛИЦЫ
- принимает
- Сложность задачи
- технологии
- Технологии
- срок
- текст
- который
- Ассоциация
- информация
- Источник
- их
- тогда
- Там.
- тем самым
- следовательно
- этой
- тысяча
- Через
- по всему
- время
- в
- топ
- Темы
- традиционный
- Переводы
- пытается
- ОЧЕРЕДЬ
- два
- напишите
- под
- лежащий в основе
- понимать
- понимает
- созданного
- непредсказуемый
- использование
- прецедент
- используемый
- Информация о пользователе
- через
- ценностное
- разнообразие
- различный
- Транспорт
- поставщики
- с помощью
- вице
- вице-президент
- видение
- хотеть
- законопроект
- we
- Web
- веб-сервисы
- Вебинары
- Вебсайт
- ЧТО Ж
- вполне определенный
- запад
- Что
- Что такое
- когда
- в то время как
- , которые
- в то время как
- широкий
- широко
- Шире
- будете
- в
- Женщина
- женщины в технологии
- Word
- Работа
- рабочий
- Рабочие процессы
- работает
- по всему миру
- письмо
- Уступать
- Ты
- ВАШЕ
- YouTube
- зефирнет