At AWS re:Invent 2023, ми оголосили про загальну доступність Бази знань для Amazon Bedrock. Завдяки базі знань ви можете безпечно підключати базові моделі (FM). Amazon Bedrock до даних вашої компанії для повністю керованого Retrieval Augmented Generation (RAG).
В попередній публікації, ми описали, як бази знань для Amazon Bedrock керують для вас наскрізним робочим процесом RAG, і поділилися подробицями про деякі з останніх запусків функцій.
Для додатків на основі RAG точність згенерованої відповіді від великих мовних моделей (LLM) залежить від контексту, наданого моделі. Контекст отримується з векторної бази даних на основі запиту користувача. Семантичний пошук широко використовується, оскільки він здатний зрозуміти більш схожі на людину запитання — запит користувача не завжди безпосередньо пов’язаний із точними ключовими словами у вмісті, який відповідає на нього. Семантичний пошук допомагає дати відповіді на основі змісту тексту. Однак він має обмеження щодо захоплення всіх відповідних ключових слів. Його ефективність залежить від якості вбудованих слів, які використовуються для представлення значення тексту. Щоб подолати такі обмеження, поєднання семантичного пошуку з пошуком за ключовими словами (гібрид) дасть кращі результати.
У цій публікації ми обговорюємо нову функцію гібридного пошуку, яку можна вибрати як варіант запиту поряд із семантичним пошуком.
Огляд гібридного пошуку
Гібридний пошук використовує сильні сторони багатьох пошукових алгоритмів, об’єднуючи їхні унікальні можливості для підвищення релевантності результатів пошуку. Для додатків на основі RAG можливості семантичного пошуку зазвичай поєднуються з традиційним пошуком за ключовими словами, щоб підвищити релевантність результатів пошуку. Це дозволяє здійснювати пошук як за змістом документів, так і за їх основним значенням. Наприклад, розглянемо такий запит:
У цьому запиті на назву книги та назву веб-сайту пошук за ключовим словом дасть кращі результати, оскільки нам потрібна вартість конкретної книги. Однак термін «вартість» може мати такі синоніми, як «ціна», тому краще використовувати семантичний пошук, який розуміє зміст тексту. Гібридний пошук забезпечує найкраще з обох підходів: точність семантичного пошуку та охоплення ключових слів. Він чудово працює для додатків на основі RAG, де ретрівер має обробляти широкий спектр запитів природною мовою. Ключові слова допомагають охопити конкретні сутності в запиті, такі як назва продукту, колір і ціна, тоді як семантика краще розуміє значення та наміри в запиті. Наприклад, якщо ви хочете створити чат-бота для веб-сайту електронної комерції для обробки запитів клієнтів, таких як політика повернення або деталі продукту, використання гібридного пошуку буде найбільш підходящим.
Варіанти використання гібридного пошуку
Нижче наведено кілька типових випадків використання гібридного пошуку:
- Відповідь на питання відкритого домену – Це передбачає відповіді на запитання на різноманітні теми. Це потребує пошуку у великих колекціях документів із різноманітним вмістом, як-от дані веб-сайтів, які можуть включати різноманітні теми, як-от стійкий розвиток, лідерство, фінансові результати тощо. Сам по собі семантичний пошук не може добре узагальнити для цього завдання, оскільки він не має можливості для лексичного зіставлення невидимих сутностей, що важливо для обробки прикладів поза доменом. Таким чином, поєднання пошуку на основі ключових слів із семантичним пошуком може допомогти звузити область і забезпечити кращі результати для відповіді на питання відкритої області.
- Контекстні чат-боти – Розмови можуть швидко змінювати напрямок і охоплювати непередбачувані теми. Гібридний пошук може краще обробляти такі відкриті діалоги.
- Персоналізований пошук – Пошук у веб-масштабі за різнорідним вмістом отримує переваги від гібридного підходу. Семантичний пошук обробляє популярні головні запити, тоді як ключові слова покривають рідкісні довгі запити.
Хоча гібридний пошук пропонує ширше охоплення завдяки поєднанню двох підходів, семантичний пошук має переваги в точності, коли область вузька, а семантика чітко визначена, або коли мало місця для неправильного тлумачення, як-от системи відповідей на запитання фактоїдів.
Переваги гібридного пошуку
І пошук за ключовими словами, і семантичний пошук повертатимуть окремий набір результатів разом із їх оцінками релевантності, які потім об’єднуються, щоб отримати найбільш релевантні результати. Бази знань для Amazon Bedrock наразі підтримують чотири векторні сховища: Amazon OpenSearch Serverless, Редакція Amazon Aurora, сумісна з PostgreSQL, Соснова шишка та Redis Enterprise Cloud. На момент написання цієї статті функція гібридного пошуку доступна для OpenSearch Serverless, а незабаром з’явиться підтримка інших векторних сховищ.
Нижче наведено деякі з переваг використання гібридного пошуку.
- Покращена точність – Точність генерованої відповіді від FM безпосередньо залежить від релевантності отриманих результатів. Виходячи з ваших даних, підвищити точність вашої програми лише за допомогою семантичного пошуку може бути складно. Ключовою перевагою використання гібридного пошуку є покращення якості отриманих результатів, що, у свою чергу, допомагає FM генерувати точніші відповіді.
- Розширені можливості пошуку – Пошук за ключовими словами створює ширшу мережу та знаходить документи, які можуть бути релевантними, але можуть не містити семантичної структури в усьому документі. Він дозволяє здійснювати пошук як за ключовими словами, так і за смисловим значенням тексту, розширюючи тим самим пошукові можливості.
У наступних розділах ми демонструємо, як використовувати гібридний пошук із базами знань для Amazon Bedrock.
Використовуйте параметри гібридного та семантичного пошуку через SDK
Коли ви викликаєте Retrieve API, Knowledge Bases for Amazon Bedrock вибирає для вас правильну стратегію пошуку, щоб отримати найрелевантніші результати. У вас є можливість перевизначити його, щоб використовувати гібридний або семантичний пошук в API.
Отримати API
API Retrieve призначений для отримання релевантних результатів пошуку шляхом надання запиту користувача, ідентифікатора бази знань і кількості результатів, які API має повернути. Цей API перетворює запити користувачів на вбудовування, здійснює пошук у базі знань за допомогою гібридного пошуку або семантичного (векторного) пошуку та повертає релевантні результати, надаючи вам більше можливостей для створення спеціальних робочих процесів поверх результатів пошуку. Наприклад, ви можете додати логіку постобробки до отриманих результатів або додати власну підказку та підключитися до будь-якого FM, наданого Amazon Bedrock, для генерації відповідей.
Щоб показати вам приклад перемикання між гібридним і семантичним (векторним) пошуком, ми створили базу знань за допомогою Документ Amazon 10K за 2023 рік. Детальніше про створення бази знань див Створіть програму контекстного чат-бота за допомогою баз знань для Amazon Bedrock.
Щоб продемонструвати цінність гібридного пошуку, ми використовуємо такий запит:
Відповідь на попередній запит містить кілька ключових слів, наприклад date
, physical stores
та North America
. Правильна відповідь 22,871 thousand square feet
. Давайте поспостерігаємо за різницею в результатах пошуку як для гібридного, так і для семантичного пошуку.
Наступний код показує, як використовувати гібридний або семантичний (векторний) пошук за допомогою Retrieve API з Boto3:
Команда overrideSearchType
варіант в retrievalConfiguration
пропонує вибір використання будь-якого HYBRID
or SEMANTIC
. За замовчуванням він вибере правильну стратегію для вас, щоб отримати найрелевантніші результати, і якщо ви хочете змінити параметр за замовчуванням на використання гібридного або семантичного пошуку, ви можете встановити значення HYBRID/SEMANTIC
. Вихід з Retrieve
API включає фрагменти отриманого тексту, тип розташування та URI вихідних даних, а також оцінки релевантності отриманих даних. Оцінки допомагають визначити, які фрагменти найкраще відповідають відповіді на запит.
Нижче наведено результати для попереднього запиту з використанням гібридного пошуку (з деякими результатами, відредагованими для стислості):
Нижче наведено результати семантичного пошуку (з деякими вихідними даними для стислості):
Як ви можете бачити в результатах, гібридний пошук зміг отримати результат пошуку з орендованими квадратними метрами для фізичних магазинів у Північній Америці, як зазначено в запиті користувача. Основною причиною було те, що гібридний пошук міг об’єднати результати за такими ключовими словами, як date
, physical stores
та North America
у запиті, тоді як семантичний пошук ні. Таким чином, коли результати пошуку доповнюються запитом користувача та підказкою, FM не зможе надати правильну відповідь у разі семантичного пошуку.
Тепер давайте розглянемо RetrieveAndGenerate
API із гібридним пошуком для розуміння кінцевої відповіді, створеної FM.
API RetrieveAndGenerate
Команда RetrieveAndGenerate
API запитує базу знань і генерує відповідь на основі отриманих результатів. Ви вказуєте ідентифікатор бази знань, а також FM, щоб створити відповідь на основі результатів. Amazon Bedrock перетворює запити на вбудовування, запитує базу знань на основі типу пошуку, а потім доповнює підказку FM результатами пошуку як контекстну інформацію та повертає відповідь, згенеровану FM.
Давайте скористаємося запитом «Станом на 31 грудня 2023 року, яка орендована площа фізичних магазинів у Північній Америці?» і запитайте RetrieveAndGenerate
API для створення відповіді за допомогою нашого запиту:
Нижче наведено результати використання гібридного пошуку:
Нижче наведено результати семантичного пошуку:
Справжня відповідь на запит така 22,871 thousand leased square feet
, який створюється гібридним пошуком. Отримані результати пошуку для гібридного пошуку включали інформацію про орендовані квадратні метри для фізичних магазинів у Північній Америці, тоді як семантичний пошук не зміг отримати правильну інформацію з векторного магазину через переклад вбудованих елементів. Тому FM не зміг надати правильну відповідь, оскільки не мав правильних і найбільш релевантних результатів пошуку.
Однак для більш загальних питань, які не включають сутності, такі як physical stores
or North America
, як гібридний, так і семантичний пошук дають подібні результати.
Нижче наведено приклади відповідей на кілька запитів, які демонструють випадки, коли і гібридний, і семантичний пошук дають схожі результати.
Питання | Семантичний пошук: RAG API | Гібридний пошук: RAG API |
Як Amazon обслуговує розробників і підприємства? | Ми обслуговуємо розробників і підприємства будь-якого розміру, включаючи стартапи, державні установи та академічні установи, через AWS, яка пропонує широкий набір технологічних послуг на вимогу, включаючи обчислення, зберігання, базу даних, аналітику та машинне навчання, а також інші послуги | Ми обслуговуємо розробників і підприємства будь-якого розміру, включаючи стартапи, державні установи та академічні установи, через AWS, яка пропонує широкий набір технологічних послуг на вимогу, включаючи обчислення, зберігання, базу даних, аналітику та машинне навчання, а також інші послуги. |
Хто є виконавчими директорами та директорами Amazon станом на 24 січня 2024 року? | Серед виконавчих директорів Amazon станом на 2024 рік: Ендрю Р. Джессі як президент і головний виконавчий директор, Дуглас Дж. Геррінгтон як генеральний директор Amazon Stores у всьому світі, Брайан Т. Олсавскі як старший віце-президент і головний фінансовий директор, Шеллі Л. Рейнольдс як віце-президент. , глобальний контролер і головний бухгалтер, Адам Н. Селіпскі як генеральний директор Amazon Web Services і Девід А. Запольскі як старший віце-президент із глобальної публічної політики та головний юрисконсульт. | Станом на 2024 рік Джеффрі П. Безос є виконавчим головою Amazon.com. Ендрю Р. Джессі є президентом і головним виконавчим директором. Серед інших виконавчих директорів – Дуглас Дж. Герінгтон як генеральний директор Worldwide Amazon Stores, Брайан Т. Олсавскі як старший віце-президент і головний фінансовий директор, Шеллі Л. Рейнольдс як віце-президент, глобальний контролер і головний бухгалтер та Адам Н. Селіпскі як генеральний директор Веб-сервіси Amazon. Девід А. Запольський є старшим віце-президентом із глобальної публічної політики та головним радником |
Використовуйте параметри гібридного та семантичного пошуку через консоль Amazon Bedrock
Щоб використовувати параметри гібридного та семантичного пошуку на консолі Amazon Bedrock, виконайте такі дії:
- Виберіть на консолі Amazon Bedrock База знань у навігаційній панелі.
- Виберіть створену базу знань.
- Вибирати Тест бази знань.
- Виберіть піктограму конфігурацій.
- для Тип пошуку¸ виберіть Гібридний пошук (семантичний і текстовий).
За замовчуванням ви можете вибрати FM, щоб отримати згенеровану відповідь на ваш запит. Якщо ви хочете побачити лише отримані результати, ви можете перемкнути Згенеруйте відповідь вимкнено, щоб отримати лише отримані результати.
Висновок
У цій публікації ми розглянули нову функцію запитів у базах знань для Amazon Bedrock, яка забезпечує гібридний пошук. Ми дізналися, як налаштувати опцію гібридного пошуку в SDK і консолі Amazon Bedrock. Це допомагає подолати деякі обмеження покладатися виключно на семантичний пошук, особливо для пошуку у великих колекціях документів із різноманітним вмістом. Використання гібридного пошуку залежить від типу документа та варіанту використання, який ви намагаєтесь реалізувати.
Щоб отримати додаткові ресурси, зверніться до наступного:
посилання
Покращення продуктивності пошуку в конвеєрах RAG за допомогою гібридного пошуку
Про авторів
Мані Хануджа є технічним керівником – Generative AI Specialists, автором книги Applied Machine Learning and High Performance Computing on AWS, а також членом ради директорів фонду «Жінки у сфері виробничої освіти». Вона керує проектами машинного навчання в різних областях, таких як комп’ютерне бачення, обробка природної мови та генеративний штучний інтелект. Вона виступає на внутрішніх і зовнішніх конференціях, таких як AWS re:Invent, Women in Manufacturing West, вебінарах YouTube і GHC 23. У вільний час вона любить довго бігати вздовж пляжу.
Паллаві Наргунд є головним архітектором рішень в AWS. Виконуючи роль постачальника хмарних технологій, вона працює з клієнтами, щоб зрозуміти їхні цілі та проблеми, а також дає чіткі вказівки щодо досягнення їх мети за допомогою пропозицій AWS. Вона захоплюється жінками в технологіях і є одним із основних членів групи Women in AI/ML в Amazon. Вона виступає на внутрішніх і зовнішніх конференціях, таких як AWS re:Invent, AWS Summits і вебінарах. Поза роботою вона захоплюється волонтерством, садівництвом, їздою на велосипеді та пішим туризмом.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/knowledge-bases-for-amazon-bedrock-now-supports-hybrid-search/
- : має
- :є
- : ні
- :де
- ][стор
- 1
- 100
- 10K
- 125
- 17
- 2021
- 2022
- 2023
- 2024
- 22
- 23
- 24
- 28
- 30
- 31
- 31st
- 32
- 43
- 54
- 60
- 7
- 72
- 8
- 9
- a
- Здатний
- МЕНЮ
- академічний
- бухгалтерський облік
- точність
- точний
- Achieve
- придбаний
- фактичний
- Адам
- додавати
- Додатковий
- Перевага
- Переваги
- агентства
- AI
- AI / ML
- літак
- алгоритми
- ВСІ
- дозволяє
- тільки
- по
- пліч-о-пліч
- завжди
- Amazon
- Amazon Web Services
- Amazon.com
- Америка
- амортизація
- an
- аналітика
- та
- Ендрю
- оголошений
- відповідь
- відповідь
- Відповіді
- будь-який
- API
- додаток
- застосування
- прикладної
- підхід
- підходи
- ЕСТЬ
- AS
- запитати
- Активи
- At
- збільшено
- збільшує
- Аврора
- автор
- наявність
- доступний
- AWS
- AWS re:Invent
- база
- заснований
- BE
- Пляж
- оскільки
- користь
- Переваги
- КРАЩЕ
- Краще
- між
- безос
- Мільярд
- рада
- рада директорів
- книга
- обидва
- Брайан
- Приносить
- широкий
- будувати
- Створюємо
- будівель
- але
- by
- call
- CAN
- можливості
- потужність
- захопивши
- випадок
- випадків
- Центр
- Генеральний директор
- Крісло
- проблеми
- складні
- зміна
- Chatbot
- головний
- Глава виконавчої влади
- chief executive officer
- вибір
- Вибирати
- хмара
- ХМАРНІ ТЕХНОЛОГІЇ
- код
- Колекції
- color
- COM
- об'єднувати
- комбінований
- об'єднання
- майбутній
- Скоро
- загальний
- зазвичай
- компанія
- повний
- обчислення
- комп'ютер
- Комп'ютерне бачення
- обчислення
- конференції
- З'єднуватися
- Вважати
- Консоль
- будівництво
- містити
- зміст
- зміст
- контекст
- контекстуальний
- контроль
- контролер
- розмови
- Core
- Корпоративний
- виправити
- Коштувати
- витрати
- адвокат
- обкладинка
- охоплення
- покритий
- створений
- створення
- В даний час
- виготовлений на замовлення
- клієнт
- Клієнти
- дані
- Центр обробки даних
- Database
- Девід
- Грудень
- дефолт
- демонструвати
- демонстрація
- залежний
- залежить
- амортизація
- описаний
- description
- призначений
- деталі
- Визначати
- розробників
- DID
- різниця
- напрям
- безпосередньо
- Директори
- обговорювати
- Різне
- do
- документ
- документація
- робить
- домен
- домени
- Не знаю
- Дуглас
- вниз
- два
- під час
- електронної комерції
- Освіта
- або
- активатор
- дозволяє
- кінець в кінець
- підвищувати
- увійшов
- підприємство
- підприємств
- юридичні особи
- обладнання
- особливо
- приклад
- Приклади
- виконавчий
- Посадова особа
- розширюється
- зовнішній
- засоби
- особливість
- кілька
- остаточний
- фінансування
- фінансовий
- знахідки
- після
- слідує
- для
- фонд
- чотири
- Безкоштовна
- від
- повністю
- Загальне
- породжувати
- генерується
- генерує
- породжує
- покоління
- генеративний
- Генеративний ШІ
- отримати
- Давати
- дає
- Глобальний
- Go
- Цілі
- Уряд
- державні установи
- великий
- валовий
- керівництво
- обробляти
- Ручки
- Обробка
- Мати
- голова
- допомога
- допомагає
- її
- Високий
- Як
- How To
- Однак
- HTTPS
- гібрид
- ICON
- ID
- if
- здійснювати
- важливо
- удосконалювати
- поліпшений
- in
- стимули
- включати
- включені
- includes
- У тому числі
- інформація
- вхід
- установи
- Інтеграція
- намір
- внутрішній
- Міжнародне покриття
- в
- залучати
- включає в себе
- IT
- ЙОГО
- січня
- 24 січня
- Джеффрі
- JPG
- ключ
- ключові слова
- знання
- земля
- мова
- великий
- запуски
- вести
- Керівництво
- Веде за собою
- вчений
- вивчення
- оренда
- як
- Сподобалося
- недоліки
- трохи
- розташування
- логіка
- Довго
- подивитися
- машина
- навчання за допомогою машини
- головний
- вдалося
- управляє
- виробництво
- матч
- узгодження
- Може..
- сенс
- член
- згаданий
- може бути
- мільйони
- модель
- Моделі
- більше
- найбільш
- множинний
- ім'я
- вузький
- Природний
- Обробка природних мов
- навігація
- мережу
- мережу
- мережа
- Нові
- На північ
- Північна Америка
- увагу
- зараз
- номер
- мета
- спостерігати
- of
- від
- Пропозиції
- Пропозиції
- Office
- Офіцер
- офіцерів
- on
- On-Demand
- тільки
- відкрити
- операційний
- варіант
- Опції
- or
- Інше
- наші
- вихід
- поза
- над
- Подолати
- перевизначення
- власний
- pane
- пристрасний
- продуктивність
- period
- фізичний
- plato
- Інформація про дані Платона
- PlatoData
- політика
- популярний
- пошта
- попередній
- Точність
- президент
- price
- Головний
- обробка
- Product
- проектів
- власність
- забезпечувати
- за умови
- забезпечення
- громадськість
- якість
- запити
- запит
- питання
- питань
- R
- ганчіркою
- швидко
- РІДНІ
- RE
- причина
- отримати
- останній
- записаний
- скорочення
- послатися
- пов'язаний
- актуальність
- доречний
- покладаючись
- представляти
- Вимагається
- ресурси
- відповідь
- відповіді
- результат
- результати
- пошук
- повертати
- Умови повернення
- право
- Роль
- Кімната
- пробіжки
- зразок
- сфера
- рахунок
- Sdk
- Пошук
- пошук
- Грати короля карти - безкоштовно Nijumi логічна гра гри
- розділам
- безпечно
- побачити
- сегмент
- вибрати
- смисловий
- семантика
- старший
- окремий
- служити
- сервер
- Без сервера
- служить
- Послуги
- комплект
- загальні
- вона
- Показувати
- Шоу
- аналогічний
- розміри
- So
- виключно
- Рішення
- деякі
- скоро
- Source
- Говорить
- Фахівці
- конкретний
- площа
- стартапів
- заходи
- зберігання
- зберігати
- магазинів
- Стратегія
- сильні сторони
- структура
- такі
- підходящий
- саміти
- підтримка
- Опори
- Sustainability
- Systems
- таблиця
- приймає
- Завдання
- технології
- Технологія
- термін
- текст
- Що
- Команда
- інформація
- Джерело
- їх
- потім
- Там.
- тим самим
- отже
- це
- тисяча
- через
- по всьому
- час
- до
- топ
- теми
- традиційний
- Переклад
- намагається
- ПЕРЕГЛЯД
- два
- тип
- при
- що лежить в основі
- розуміти
- розумієш
- створеного
- непередбачуваний
- використання
- використання випадку
- використовуваний
- користувач
- використання
- значення
- різноманітність
- різний
- Транспортні засоби
- постачальники
- через
- віце
- Віцепрезидент
- бачення
- хотіти
- було
- we
- Web
- веб-сервіси
- Вебінари
- веб-сайт
- ДОБРЕ
- добре визначений
- West
- Що
- Що таке
- коли
- в той час як
- який
- в той час як
- широкий
- широко
- ширше
- волі
- з
- в
- жінки
- жінки в технології
- слово
- Work
- робочий
- Робочі процеси
- працює
- світовий
- лист
- вихід
- Ти
- вашу
- YouTube
- зефірнет