Генеративний штучний інтелект (AI) набув значного розмаху завдяки організаціям, які активно вивчають його потенційні застосування. У міру успішного переходу перевірки концепції на виробництво організації все більше потребують масштабованих корпоративних рішень. Однак, щоб розблокувати довгостроковий успіх і життєздатність цих рішень на основі штучного інтелекту, вкрай важливо узгодити їх із усталеними архітектурними принципами.
AWS Well-Architected Framework надає найкращі практики та рекомендації щодо проектування та експлуатації надійних, безпечних, ефективних і економічно ефективних систем у хмарі. Узгодження генеративних програм штучного інтелекту з цією структурою є важливим з кількох причин, включаючи забезпечення масштабованості, підтримку безпеки та конфіденційності, досягнення надійності, оптимізацію витрат і оптимізацію операцій. Прийняття цих принципів має вирішальне значення для організацій, які прагнуть використовувати силу генеративного ШІ та стимулювати інновації.
У цьому дописі розглядаються нові функції корпоративного рівня для Бази знань Amazon Bedrock і як вони відповідають AWS Well-Architected Framework. За допомогою баз знань для Amazon Bedrock ви можете швидко створювати програми за допомогою Retrieval Augmented Generation (RAG) для таких випадків використання, як відповіді на запитання, контекстні чат-боти та персоналізований пошук.
Ось деякі функції, які ми розглянемо:
- Підтримка AWS CloudFormation
- Політики приватної мережі для Amazon OpenSearch Serverless
- Кілька сегментів S3 як джерела даних
- Підтримка квот на обслуговування
- Гібридний пошук, фільтри метаданих, спеціальні підказки для
RetreiveAndGenerate
API та максимальну кількість запитів.
Принципи дизайну AWS Well-Architected
Програми на основі RAG, створені за допомогою баз знань для Amazon Bedrock, можуть отримати значну користь від дотримання Добре побудований фреймворк AWS. Цей фреймворк має шість основних принципів, які допомагають організаціям переконатися, що їхні програми безпечні, високопродуктивні, стійкі, ефективні, економічно ефективні та стійкі:
- Оперативне досконалість – Добре розроблені принципи оптимізують операції, автоматизують процеси та забезпечують постійний моніторинг і покращення продуктивності генеративної програми AI.
- Безпека – Впровадження надійного контролю доступу, шифрування та моніторингу допомагає захистити конфіденційні дані, які використовуються в базі знань вашої організації, і запобігти зловживанням генеративним ШІ.
- Надійність – Розробкою стійких і стійких до збоїв систем керуються принципи добре архітектури, що забезпечує постійне надання користувачам цінностей.
- Оптимізація продуктивності – Вибір відповідних ресурсів, впровадження стратегій кешування та проактивний моніторинг показників продуктивності гарантують, що додатки надають швидкі та точні відповіді, що забезпечує оптимальну продуктивність і покращений досвід роботи з користувачем.
- Оптимізація витрат – Добре розроблені рекомендації допомагають оптимізувати використання ресурсів, використовувати економні послуги та контролювати витрати, що забезпечує довгострокову життєздатність генеративних проектів ШІ.
- Sustainability – Добре розроблені принципи сприяють ефективному використанню ресурсів і мінімізації вуглецевих слідів, усуваючи вплив на навколишнє середовище зростаючого генеративного використання ШІ.
Дотримуючись Well-Architected Framework, організації можуть ефективно створювати RAG-додатки корпоративного рівня та керувати ними за допомогою баз знань для Amazon Bedrock. Тепер давайте детальніше зануримося в нові функції, запущені в базах знань для Amazon Bedrock.
Підтримка AWS CloudFormation
Організаціям, які розробляють програми RAG, важливо забезпечити ефективну та ефективну роботу та узгоджену інфраструктуру в різних середовищах. Цього можна досягти шляхом впровадження таких практик, як автоматизація процесів розгортання. Щоб досягти цього, бази знань для Amazon Bedrock тепер пропонують підтримку для AWS CloudFormation.
З AWS CloudFormation і Набір хмарних розробок AWS (AWS CDK), тепер ви можете створювати, оновлювати та видаляти бази знань і пов’язані джерела даних. Застосування AWS CloudFormation і AWS CDK для керування базами знань і пов’язаними джерелами даних не тільки спрощує процес розгортання, але й сприяє дотриманню принципів добре архітектури. Виконуючи операції (програми, інфраструктуру) у вигляді коду, ви можете забезпечити узгоджене та надійне розгортання в кількох облікових записах AWS і регіонах AWS, а також підтримувати версії конфігурацій інфраструктури, які можна перевіряти.
Нижче наведено зразок Скрипт CloudFormation у форматі JSON для створення та оновлення бази знань в Amazon Bedrock:
Type
визначає базу знань як ресурс у шаблоні верхнього рівня. Як мінімум необхідно вказати такі властивості:
- ІМ'Я – Вкажіть назву для бази знань.
- РольАрн – Укажіть назву ресурсу Amazon (ARN) для Управління ідентифікацією та доступом AWS (IAM) роль із дозволами на виклик операцій API у базі знань. Для отримання додаткової інформації див Створіть роль служби для баз знань для Amazon Bedrock.
- Конфігурація бази знань – Укажіть конфігурацію вбудовування бази знань. Необхідні такі підвластивості:
- тип – Вкажіть значення
VECTOR
. - VectorKnowledgeBaseConfiguration – Містить подробиці про модель, яка використовується для створення векторних вставок для бази знань.
- тип – Вкажіть значення
- Конфігурація сховища – Укажіть інформацію про сховище векторів, у якому знаходиться джерело даних зберігати. Необхідні такі підвластивості:
- тип – Укажіть службу векторного сховища, яку ви використовуєте.
- Вам також потрібно буде вибрати одне з векторних сховищ, які підтримуються базами знань, наприклад OpenSearchServerless, Pinecone або Amazon PostgreSQL, і надати конфігурацію для вибраного векторного сховища.
Докладніше про всі поля та надання конфігурації різних векторних сховищ, які підтримуються базами знань для Amazon Bedrock, див. AWS::Bedrock::KnowledgeBase.
На момент написання цієї статті векторні сховища Redis Enterprise Cloud не підтримуються в AWS CloudFormation. Щоб отримати останню інформацію, зверніться до документації вище.
Після створення бази знань вам потрібно створити джерело даних із Служба простого зберігання Amazon (Amazon S3), що містить файли для вашої бази знань. Це викликає CreateDataSource
та DeleteDataSource
API.
Нижче наведено зразок Скрипт CloudFormation у форматі JSON:
Type
визначає джерело даних як ресурс у шаблоні верхнього рівня. Як мінімум необхідно вказати такі властивості:
- ІМ'Я – Вкажіть назву для джерела даних.
- KnowledgeBaseId – Укажіть ідентифікатор бази знань, до якої належить джерело даних.
- DataSourceConfiguration – Укажіть інформацію про сегмент S3, що містить джерело даних. Необхідні такі підвластивості:
- тип – Вкажіть значення S3.
- Конфігурація S3 – Містить подробиці про конфігурацію об’єкта S3, що містить джерело даних.
- VectorIngestionConfiguration – містить відомості про те, як завантажувати документи в джерело даних. Ви повинні надати "Chunking Configuration”, де ви можете визначити свою стратегію фрагментації.
- ServerSideEncryptionConfiguration – Містить конфігурацію для шифрування на стороні сервера, де ви можете вказати назву ресурсу Amazon (ARN) ключа AWS KMS, який використовується для шифрування ресурсу.
Щоб отримати додаткові відомості про налаштування джерел даних в Amazon Bedrock, див Налаштуйте джерело даних для своєї бази знань.
Примітка. Ви не можете змінити конфігурацію поділу на фрагменти після створення джерела даних.
Шаблон CloudFormation дозволяє визначати ресурси бази знань і керувати ними за допомогою інфраструктури як коду (IaC). Автоматизуючи налаштування та керування базою знань, ви можете забезпечити узгоджену інфраструктуру в різних середовищах. Цей підхід узгоджується з принципом операційної досконалості, який наголошує на виконанні операцій у вигляді коду. Розглядаючи все робоче навантаження як код, ви можете автоматизувати процеси, створювати узгоджені реакції на події та, зрештою, зменшити людські помилки.
Політики приватної мережі для Amazon OpenSearch Serverless
Для компаній, які розробляють програми RAG, важливо, щоб дані залишалися в безпеці, а мережевий трафік не спрямовувався в загальнодоступний Інтернет. Для підтримки цього Бази знань для Amazon Bedrock тепер підтримують політики приватної мережі для Amazon OpenSearch Serverless.
Бази знань для Amazon Bedrock надають можливість використовувати OpenSearch Serverless як векторне сховище. Тепер ви можете отримати доступ до безсерверних колекцій OpenSearch, які мають політику приватної мережі, що додатково підвищує рівень безпеки для вашої програми RAG. Щоб досягти цього, вам потрібно створити колекцію OpenSearch Serverless і налаштувати її для доступу до приватної мережі. Спочатку створіть векторний індекс у колекції для зберігання вставок. Потім під час створення колекції встановіть Налаштування доступу до мережі до приватний і вкажіть кінцеву точку VPC для доступу. Важливо, що тепер ви можете надати приватний мережевий доступ до OpenSearch Serverless колекції спеціально для Amazon Bedrock. Для цього виберіть Приватний доступ до служби AWS і вкажіть bedrock.amazonaws.com
як послуга.
Ця конфігурація приватної мережі гарантує, що ваші вбудовування надійно зберігаються та доступні лише Amazon Bedrock, підвищуючи загальну безпеку та конфіденційність ваших баз знань. Це тісно пов’язане з Стовп безпеки контролю трафіку на всіх рівнях, оскільки весь мережевий трафік зберігається в магістралі AWS із цими налаштуваннями.
Наразі ми досліджували автоматизацію створення, видалення й оновлення ресурсів бази знань, а також покращену безпеку за допомогою політик приватної мережі для OpenSearch Serverless для безпечного зберігання векторних вбудованих файлів. Тепер давайте розберемося, як створювати більш надійні, комплексні й оптимізовані за витратами програми RAG.
Кілька сегментів S3 як джерела даних
Бази знань для Amazon Bedrock тепер підтримують додавання кількох сегментів S3 як джерел даних в одній базі знань, включаючи доступ між обліковими записами. Це вдосконалення підвищує всебічність і точність бази знань, дозволяючи користувачам легко збирати та використовувати інформацію з різних джерел.
Ось ключові особливості:
- Кілька відер S3 – Бази знань для Amazon Bedrock тепер можуть включати дані з кількох сегментів S3, дозволяючи користувачам легко комбінувати та використовувати інформацію з різних джерел. Ця функція сприяє різноманітності даних і гарантує, що відповідна інформація є легкодоступною для додатків на основі RAG.
- Доступ до даних між обліковими записами – Бази знань для Amazon Bedrock підтримують налаштування сегментів S3 як джерел даних для різних облікових записів. Ви можете надати необхідні облікові дані для доступу до цих джерел даних, розширюючи діапазон інформації, яку можна включити в їхні бази знань.
- Ефективне управління даними – When a data source or knowledge base is deleted, the related or existing items in the vector stores are automatically removed. This feature makes sure that the knowledge base remains up to date and free from obsolete or irrelevant data, maintaining the integrity and accuracy of the RAG process.
Завдяки підтримці кількох сегментів S3 як джерел даних усувається необхідність створення кількох баз знань або надлишкових копій даних, що оптимізує витрати та сприяє хмарному фінансовому управлінню. Крім того, можливості доступу між обліковими записами дають змогу розробляти стійкі архітектури, які відповідають принципу надійності AWS Well-Architected Framework, забезпечуючи високу доступність і відмовостійкість.
Інші нещодавно анонсовані функції для баз знань
Щоб ще більше підвищити надійність вашої програми RAG, бази знань для Amazon Bedrock тепер розширюють підтримку для Квоти послуг. Ця функція забезпечує єдине вікно для перегляду застосованих значень квот і використання AWS. Наприклад, тепер у вас є швидкий доступ до такої інформації, як дозволена кількість `RetrieveAndGenerate
API запитів в секунду.
Ця функція дає змогу ефективно керувати квотами ресурсів, запобігати надмірному забезпеченню та обмежувати частоту запитів API, щоб захистити служби від потенційних зловживань.
Ви також можете підвищити продуктивність своєї програми, використовуючи нещодавно оголошені функції, такі як гібридний пошук, фільтрація на основі метаданих, користувацькі підказки для API RetreiveAndGenerate та максимальну кількість запитів. Ці функції разом покращують точність, релевантність і узгодженість згенерованих відповідей і узгоджуються зі стовпом продуктивності AWS Well-Architected Framework.
Бази знань для Amazon Bedrock узгоджуються зі стійким принципом AWS Well-Architected Framework завдяки використанню керованих сервісів і оптимізації використання ресурсів. Будучи повністю керованою послугою, бази знань для Amazon Bedrock усувають тягар надання, керування та масштабування основної інфраструктури, тим самим зменшуючи вплив на навколишнє середовище, пов’язаний з експлуатацією та обслуговуванням цих ресурсів.
Крім того, дотримуючись принципів AWS Well-Architected, організації можуть проектувати та експлуатувати свої додатки RAG в екологічно чистий спосіб. Такі практики, як автоматизація розгортань через AWS CloudFormation, впровадження політик приватної мережі для безпечного доступу до даних і використання ефективних служб, таких як OpenSearch Serverless, сприяють мінімізації впливу цих навантажень на навколишнє середовище.
Загалом, Knowledge Bases для Amazon Bedrock у поєднанні з AWS Well-Architected Framework дає змогу організаціям створювати масштабовані, безпечні та надійні додатки RAG, водночас віддаючи пріоритет екологічній стійкості за рахунок ефективного використання ресурсів і впровадження керованих послуг.
Висновок
Нові функції корпоративного рівня, такі як підтримка AWS CloudFormation, політики приватної мережі, можливість використовувати кілька сегментів S3 як джерела даних і підтримка квот на обслуговування, спрощують створення масштабованих, безпечних і надійних додатків RAG за допомогою баз знань. для Amazon Bedrock. Використання керованих сервісів AWS і дотримання найкращих практик Well-Architected дозволяє організаціям зосередитися на розробці інноваційних генеративних рішень штучного інтелекту, одночасно забезпечуючи досконалість операцій, надійну безпеку та ефективне використання ресурсів. Коли ви створюєте додатки на AWS, узгодження додатків RAG із добре архітектурною інфраструктурою AWS забезпечує надійну основу для створення рішень корпоративного рівня, які підвищують цінність бізнесу, дотримуючись галузевих стандартів.
Щоб отримати додаткові ресурси, зверніться до наступного:
Про авторів
Мані Хануджа є технічним керівником – Generative AI Specialists, автором книги Applied Machine Learning and High Performance Computing on AWS, а також членом ради директорів фонду «Жінки у сфері виробничої освіти». Вона керує проектами машинного навчання в різних областях, таких як комп’ютерне бачення, обробка природної мови та генеративний штучний інтелект. Вона виступає на внутрішніх і зовнішніх конференціях, таких як AWS re:Invent, Women in Manufacturing West, вебінарах YouTube і GHC 23. У вільний час вона любить довго бігати вздовж пляжу.
Нітін Євсевій є старшим архітектором корпоративних рішень в AWS, має досвід розробки програмного забезпечення, корпоративної архітектури та штучного інтелекту/ML. Він глибоко захоплений дослідженням можливостей генеративного ШІ. Він співпрацює з клієнтами, щоб допомогти їм створювати добре архітектурні додатки на платформі AWS, і присвячує себе вирішенню технологічних проблем і допомозі в їхній хмарній подорожі.
Паллаві Наргунд є головним архітектором рішень в AWS. Виконуючи роль постачальника хмарних технологій, вона працює з клієнтами, щоб зрозуміти їхні цілі та проблеми, а також дає чіткі вказівки щодо досягнення їх мети за допомогою пропозицій AWS. Вона захоплюється жінками в технологіях і є одним із основних членів групи Women in AI/ML в Amazon. Вона виступає на внутрішніх і зовнішніх конференціях, таких як AWS re:Invent, AWS Summits і вебінарах. Поза роботою вона захоплюється волонтерством, садівництвом, їздою на велосипеді та пішим туризмом.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/building-scalable-secure-and-reliable-rag-applications-using-knowledge-bases-for-amazon-bedrock/
- : має
- :є
- : ні
- :де
- $UP
- 100
- 125
- 16
- 23
- 7
- a
- здатність
- МЕНЮ
- вище
- зловживання
- доступ
- доступною
- виконувати
- Рахунки
- точність
- точний
- Achieve
- досягнутий
- досягнення
- через
- активно
- додати
- Додатковий
- адресація
- прихильність
- дотримуючись
- Прийняття
- Прийняття
- після
- сукупність
- AI
- Можливість
- AI / ML
- вирівнювати
- вирівнювання
- Вирівнює
- ВСІ
- дозволено
- Дозволити
- дозволяє
- по
- Також
- Amazon
- Amazon Web Services
- an
- та
- оголошений
- відповідь
- API
- Інтерфейси
- додаток
- додаток
- застосування
- прикладної
- підхід
- відповідний
- архітектурний
- архітектура
- архітектури
- ЕСТЬ
- штучний
- AS
- допомогу
- допомагати
- асоційований
- At
- підлягає аудиту
- збільшено
- автор
- автоматизувати
- автоматично
- автоматизація
- Автоматизація
- наявність
- доступний
- AWS
- AWS CloudFormation
- AWS re:Invent
- Хребет
- база
- заснований
- BE
- Пляж
- оскільки
- користь
- КРАЩЕ
- передового досвіду
- рада
- рада директорів
- книга
- будувати
- Створюємо
- побудований
- тягар
- бізнес
- але
- by
- кешування
- Виклики
- CAN
- не може
- можливості
- вуглець
- випадків
- проблеми
- зміна
- chatbots
- Вибираючи
- тісно
- хмара
- ХМАРНІ ТЕХНОЛОГІЇ
- код
- співпрацює
- збір
- Колекції
- колективно
- об'єднувати
- комбінований
- Компанії
- всеосяжний
- комп'ютер
- Комп'ютерне бачення
- обчислення
- конференції
- конфігурація
- послідовний
- містить
- контекстуальний
- безперервний
- сприяти
- управління
- управління
- Core
- Коштувати
- рентабельним
- витрати
- обкладинка
- створювати
- створення
- Повноваження
- критичний
- вирішальне значення
- виготовлений на замовлення
- Клієнти
- дані
- доступ до даних
- Дата
- присвячених
- глибокий
- глибоко
- визначати
- доставляти
- надання
- доставка
- розгортання
- розгортання
- description
- дизайн
- проектування
- деталі
- розробка
- різний
- Директори
- занурення
- різноманітність
- do
- документація
- документація
- робить
- домени
- управляти
- Освіта
- Ефективний
- фактично
- ефективність
- ефективний
- легко
- усувається
- обіймаючи
- підкреслює
- повноваження
- включіть
- активатор
- дозволяє
- шифрувати
- шифрування
- Кінцева точка
- Машинобудування
- підвищувати
- підвищена
- Посилення
- Підсилює
- підвищення
- забезпечувати
- підприємство
- підприємства
- Весь
- навколишній
- Екологічна стійкість
- середовищах
- помилки
- істотний
- Події
- приклад
- Перевага
- існуючий
- розширюється
- витрати
- досвід
- досвідчений
- Розвіданий
- досліджує
- Дослідження
- продовжується
- зовнішній
- далеко
- ШВИДКО
- особливість
- риси
- Поля
- Файли
- Фільтри
- фінансовий
- Перший
- Сфокусувати
- після
- для
- формат
- фонд
- Рамки
- Безкоштовна
- від
- повністю
- далі
- Крім того
- отримала
- генерується
- покоління
- генеративний
- Генеративний ШІ
- Давати
- скло
- Go
- Цілі
- значно
- Зростання
- керівництво
- керівництво
- керівні вказівки
- Мати
- he
- допомога
- допомагає
- її
- Високий
- високопродуктивний
- Як
- How To
- Однак
- HTML
- HTTP
- HTTPS
- людина
- ID
- Особистість
- Impact
- реалізації
- важливо
- важливо
- удосконалювати
- поліпшення
- in
- У тому числі
- включати
- Зареєстрований
- Збільшує
- все більше і більше
- індекс
- промисловість
- галузеві стандарти
- інформація
- Інфраструктура
- інновація
- інноваційний
- цілісність
- внутрішній
- інтернет
- в
- IT
- пунктів
- ЙОГО
- подорож
- JPEG
- JPG
- json
- збережений
- ключ
- знання
- мова
- останній
- запущений
- шарів
- вести
- провідний
- Веде за собою
- вивчення
- як
- Сподобалося
- МЕЖА
- Довго
- довгостроковий
- машина
- навчання за допомогою машини
- підтримувати
- Підтримка
- зробити
- РОБОТИ
- управляти
- вдалося
- управління
- управління
- манера
- виробництво
- максимальний
- член
- метадані
- Метрика
- мінімізація
- зловживання
- модель
- Імпульс
- моніторинг
- більше
- множинний
- повинен
- ім'я
- Природний
- Обробка природних мов
- необхідно
- Необхідність
- мережу
- мережевий трафік
- Нові
- Нові можливості
- зараз
- номер
- об'єкт
- мета
- застарілий
- of
- Пропозиції
- Пропозиції
- on
- ONE
- тільки
- працювати
- операційний
- оперативний
- операції
- оптимальний
- оптимізуючий
- варіант
- or
- організації
- поза
- загальний
- pane
- пристрасний
- для
- продуктивність
- виконанні
- Дозволи
- Персоналізовані
- стовп
- стовпи
- платформа
- plato
- Інформація про дані Платона
- PlatoData
- будь ласка
- Політика
- політика
- можливостей
- пошта
- postgresql
- потенціал
- влада
- практики
- запобігати
- Головний
- Принципи
- визначення пріоритетів
- недоторканність приватного життя
- приватний
- процес
- процеси
- обробка
- Production
- проектів
- сприяти
- сприяє
- сприяння
- підказок
- властивості
- забезпечувати
- забезпечує
- забезпечення
- громадськість
- питання
- Швидко
- швидко
- ганчіркою
- діапазон
- ставки
- RE
- легко
- Причини
- нещодавно
- зменшити
- зниження
- послатися
- райони
- пов'язаний
- актуальність
- доречний
- надійність
- надійний
- залишається
- Вилучено
- видаляє
- запросити
- запитів
- вимагається
- пружний
- ресурс
- ресурси
- відповіді
- в результаті
- пошук
- міцний
- Роль
- пробіжки
- захист
- зразок
- масштабованість
- масштабовані
- Масштабування
- сценарій
- плавно
- Пошук
- другий
- безпечний
- безпечно
- безпеку
- побачити
- пошук
- вибрати
- обраний
- чутливий
- Без сервера
- обслуговування
- Послуги
- комплект
- установка
- налаштування
- установка
- кілька
- вона
- значний
- простий
- один
- SIX
- Софтвер
- розробка програмного забезпечення
- solid
- Рішення
- Розв’язування
- деякі
- Source
- Джерела
- Говорить
- Фахівці
- конкретно
- стандартів
- зберігання
- зберігати
- зберігати
- магазинів
- просто
- стратегії
- Стратегія
- раціоналізувати
- Спрощує
- упорядкування
- рядок
- сильний
- успіх
- успішний
- такі
- саміти
- підтримка
- Підтриманий
- Підтримуючий
- Опори
- Переконайтеся
- Sustainability
- сталого
- Systems
- технології
- Технологія
- шаблон
- Що
- Команда
- їх
- Їх
- потім
- тим самим
- Ці
- вони
- це
- через
- час
- до
- терпимість
- верхній рівень
- трафік
- перехід
- лікування
- тип
- Зрештою
- що лежить в основі
- розуміти
- відімкнути
- Оновити
- оновлення
- Використання
- використання
- використовуваний
- користувач
- User Experience
- користувачі
- використання
- значення
- Цінності
- різний
- життєздатності
- вид
- бачення
- we
- Web
- веб-сервіси
- Вебінари
- West
- коли
- який
- в той час як
- волі
- з
- в
- жінки
- жінки в технології
- Work
- працює
- б
- лист
- Ти
- вашу
- YouTube
- зефірнет