Генеративный искусственный интеллект (ИИ) получил значительный импульс благодаря организациям, активно изучающим его потенциальные применения. По мере успешного перехода от проверки концепции к производству организации все больше нуждаются в масштабируемых корпоративных решениях. Однако для достижения долгосрочного успеха и жизнеспособности этих решений на базе искусственного интеллекта крайне важно привести их в соответствие с устоявшимися архитектурными принципами.
AWS Well-Architected Framework предоставляет лучшие практики и рекомендации по проектированию и эксплуатации надежных, безопасных, эффективных и экономичных систем в облаке. Согласование генеративных приложений ИИ с этой структурой важно по нескольким причинам, включая обеспечение масштабируемости, поддержание безопасности и конфиденциальности, достижение надежности, оптимизацию затрат и оптимизацию операций. Принятие этих принципов имеет решающее значение для организаций, стремящихся использовать возможности генеративного искусственного интеллекта и стимулировать инновации.
В этом посте рассматриваются новые функции корпоративного уровня для Базы знаний об Amazon Bedrock и как они согласуются с AWS Well-Architected Framework. С помощью баз знаний для Amazon Bedrock вы можете быстро создавать приложения с использованием расширенной генерации данных (RAG) для таких сценариев использования, как ответы на вопросы, контекстные чат-боты и персонализированный поиск.
Вот некоторые особенности, которые мы рассмотрим:
- Поддержка AWS CloudFormation
- Политики частной сети для Amazon OpenSearch Serverless
- Несколько сегментов S3 в качестве источников данных
- Поддержка сервисных квот
- Гибридный поиск, фильтры метаданных, пользовательские подсказки для
RetreiveAndGenerate
API и максимальное количество запросов.
Принципы проектирования AWS Well-Architected
Приложения на основе RAG, созданные с использованием баз знаний для Amazon Bedrock, могут получить значительную выгоду от следования Платформа AWS с хорошей архитектурой. Эта структура имеет шесть столпов, которые помогают организациям гарантировать, что их приложения безопасны, высокопроизводительны, отказоустойчивы, действенны, экономичны и устойчивы:
- Операционное превосходство – Принципы Well-Architected оптимизируют операции, автоматизируют процессы и обеспечивают непрерывный мониторинг и улучшение производительности генеративных приложений ИИ.
- Безопасность – Внедрение надежного контроля доступа, шифрования и мониторинга помогает защитить конфиденциальные данные, используемые в базе знаний вашей организации, и предотвратить неправомерное использование генеративного ИИ.
- Надежность – Принципы хорошо спроектированной архитектуры определяют разработку устойчивых и отказоустойчивых систем, обеспечивающих последовательное предоставление преимуществ пользователям.
- Оптимизация – Выбор подходящих ресурсов, реализация стратегий кэширования и упреждающий мониторинг показателей производительности гарантируют, что приложения будут предоставлять быстрые и точные ответы, что приведет к оптимальной производительности и улучшению пользовательского опыта.
- Оптимизация затрат – Рекомендации Well-Architected помогают оптимизировать использование ресурсов, использовать экономичные услуги и контролировать расходы, что приводит к долгосрочной жизнеспособности проектов генеративного ИИ.
- Стабильность – Принципы хорошо продуманной архитектуры способствуют эффективному использованию ресурсов и минимизации выбросов углекислого газа, устраняя воздействие на окружающую среду растущего использования генеративного ИИ.
Благодаря использованию Well-Architected Framework организации могут эффективно создавать приложения RAG корпоративного уровня и управлять ими с помощью баз знаний для Amazon Bedrock. Теперь давайте углубимся в новые функции, реализованные в базах знаний для Amazon Bedrock.
Поддержка AWS CloudFormation
Для организаций, создающих приложения RAG, важно обеспечить эффективные и результативные операции и согласованную инфраструктуру в различных средах. Этого можно достичь путем внедрения таких методов, как автоматизация процессов развертывания. Для этого базы знаний для Amazon Bedrock теперь предлагают поддержку AWS CloudFormation.
Благодаря AWS CloudFormation и Комплект для разработки облачных сервисов AWS (AWS CDK), теперь вы можете создавать, обновлять и удалять базы знаний и связанные источники данных. Использование AWS CloudFormation и AWS CDK для управления базами знаний и связанными с ними источниками данных не только упрощает процесс развертывания, но и способствует соблюдению принципов Well-Architected. Выполняя операции (приложения, инфраструктуру) в виде кода, вы можете обеспечить согласованное и надежное развертывание в нескольких учетных записях AWS и регионах AWS, а также поддерживать версионные и проверяемые конфигурации инфраструктуры.
Ниже приведен пример Скрипт CloudFormation в формате JSON для создания и обновления базы знаний в Amazon Bedrock:
Type
указывает базу знаний как ресурс в шаблоне верхнего уровня. Как минимум, необходимо указать следующие свойства:
- Имя – Укажите имя базы знаний.
- РольАрн – Укажите имя ресурса Amazon (ARN) Управление идентификацией и доступом AWS (IAM) роль с разрешениями на вызов операций API в базе знаний. Для получения дополнительной информации см. Создайте роль службы для баз знаний для Amazon Bedrock..
- База знанийКонфигурация – Укажите конфигурацию внедрения базы знаний. Обязательны следующие дочерние свойства:
- Тип – Укажите значение
VECTOR
. - ВекторЗнанияБазаКонфигурация – Содержит сведения о модели, используемой для создания векторных вложений для базы знаний.
- Тип – Укажите значение
- Конфигурация хранилища – Укажите информацию о векторном хранилище, в котором находится источник данных. хранить. Обязательны следующие дочерние свойства:
- Тип – Укажите службу векторного хранилища, которую вы используете.
- Вам также потребуется выбрать одно из векторных хранилищ, поддерживаемых базами знаний, таких как OpenSearchServerless, Pinecone или Amazon PostgreSQL, и предоставить конфигурацию для выбранного векторного хранилища.
Подробную информацию обо всех полях и настройке различных векторных хранилищ, поддерживаемых базами знаний для Amazon Bedrock, см. AWS::Bedrock::KnowledgeBase.
На момент написания этой статьи векторные хранилища Redis Enterprise Cloud не поддерживаются в AWS CloudFormation. Для получения последней информации обратитесь к документации выше.
После создания базы знаний вам необходимо создать источник данных из Простой сервис хранения Amazon (Amazon S3), содержащая файлы для вашей базы знаний. Он называет CreateDataSource
и DeleteDataSource
API-интерфейсы.
Ниже приведен образец Скрипт CloudFormation в формате JSON:
Type
указывает источник данных как ресурс в шаблоне верхнего уровня. Как минимум, необходимо указать следующие свойства:
- Имя – Укажите имя источника данных.
- Идентификатор базы знаний – Укажите идентификатор базы знаний, к которой будет принадлежать источник данных.
- Конфигурация источника данных – Укажите информацию о сегменте S3, содержащем источник данных. Обязательны следующие дочерние свойства:
- Тип – Укажите значение S3.
- S3Конфигурация – Содержит сведения о конфигурации объекта S3, содержащего источник данных.
- Конфигурация векторного приема – Содержит сведения о том, как принимать документы в источник данных. Вам необходимо предоставить «Конфигурация фрагментации», где вы можете определить свою стратегию разбиения на блоки.
- Серверсайденкриптионконфигуратион – Содержит конфигурацию шифрования на стороне сервера, где вы можете указать имя ресурса Amazon (ARN) ключа AWS KMS, используемого для шифрования ресурса.
Дополнительную информацию о настройке источников данных в Amazon Bedrock см. Настройте источник данных для своей базы знаний.
Примечание. Вы не можете изменить конфигурацию фрагментирования после создания источника данных.
Шаблон CloudFormation позволяет определять ресурсы базы знаний и управлять ими, используя инфраструктуру как код (IaC). Автоматизируя настройку базы знаний и управление ею, вы можете обеспечить согласованную инфраструктуру в различных средах. Этот подход соответствует принципу «Операционное совершенство», в котором особое внимание уделяется выполнению операций в виде кода. Рассматривая всю рабочую нагрузку как код, вы можете автоматизировать процессы, создавать согласованные реакции на события и, в конечном итоге, сократить количество человеческих ошибок.
Политики частной сети для Amazon OpenSearch Serverless
Для компаний, создающих приложения RAG, крайне важно, чтобы данные оставались в безопасности, а сетевой трафик не попадал в общедоступный Интернет. Для этого базы знаний для Amazon Bedrock теперь поддерживают политики частных сетей для Amazon OpenSearch без сервера.
Базы знаний для Amazon Bedrock предоставляют возможность использовать OpenSearch Serverless в качестве векторного хранилища. Теперь вы можете получить доступ к бессерверным коллекциям OpenSearch, имеющим политику частной сети, что еще больше повышает уровень безопасности вашего приложения RAG. Для этого вам необходимо создать бессерверную коллекцию OpenSearch и настроить ее для доступа к частной сети. Сначала создайте векторный индекс в коллекции для хранения вложений. Затем при создании коллекции установите Настройки доступа к сети в Частный и укажите конечную точку VPC для доступа. Важно отметить, что теперь вы можете предоставить доступ к частной сети к OpenSearch Serverless коллекции специально для Amazon Bedrock. Для этого выберите Частный доступ к сервису AWS и указать bedrock.amazonaws.com
как услуга.
Эта конфигурация частной сети гарантирует, что ваши внедрения надежно хранятся и доступны только Amazon Bedrock, повышая общую безопасность и конфиденциальность ваших баз знаний. Он тесно согласуется с Столп безопасности контроля трафика на всех уровнях, поскольку с этими настройками весь сетевой трафик хранится в магистральной сети AWS.
До сих пор мы исследовали автоматизацию создания, удаления и обновления ресурсов базы знаний, а также повышенную безопасность с помощью политик частной сети для OpenSearch Serverless для безопасного хранения векторных вложений. Теперь давайте разберемся, как создавать более надежные, комплексные и экономичные приложения RAG.
Несколько сегментов S3 в качестве источников данных
Базы знаний для Amazon Bedrock теперь поддерживают добавление нескольких сегментов S3 в качестве источников данных в единую базу знаний, включая доступ к нескольким аккаунтам. Это усовершенствование повышает полноту и точность базы знаний, позволяя пользователям беспрепятственно объединять и использовать информацию из различных источников.
Ниже приведены ключевые особенности:
- Несколько сегментов S3 – Базы знаний для Amazon Bedrock теперь могут включать данные из нескольких корзин S3, что позволяет пользователям без труда комбинировать и использовать информацию из разных источников. Эта функция способствует разнообразию данных и гарантирует, что соответствующая информация будет легко доступна для приложений на основе RAG.
- Доступ к данным между аккаунтами – Базы знаний для Amazon Bedrock поддерживают настройку корзин S3 в качестве источников данных для разных учетных записей. Вы можете предоставить необходимые учетные данные для доступа к этим источникам данных, расширяя диапазон информации, которая может быть включена в их базы знаний.
- Эффективное управление данными – При удалении источника данных или базы знаний связанные или существующие элементы в векторных хранилищах автоматически удаляются. Эта функция гарантирует, что база знаний остается актуальной и не содержит устаревших или неактуальных данных, сохраняя целостность и точность процесса RAG.
Благодаря поддержке нескольких сегментов S3 в качестве источников данных устраняется необходимость создания нескольких баз знаний или избыточных копий данных, что позволяет оптимизировать затраты и способствовать управлению финансами в облаке. Кроме того, возможности доступа к нескольким аккаунтам позволяют разрабатывать отказоустойчивые архитектуры, соответствующие принципу надежности AWS Well-Architected Framework, обеспечивая высокую доступность и отказоустойчивость.
Другие недавно анонсированные функции баз знаний
Чтобы еще больше повысить надежность вашего приложения RAG, базы знаний для Amazon Bedrock теперь расширяют поддержку Сервисные квоты. Эта функция предоставляет единую панель для просмотра примененных значений и использования квот AWS. Например, теперь у вас есть быстрый доступ к такой информации, как разрешенное количество `RetrieveAndGenerate
Запросов API в секунду.
Эта функция позволяет эффективно управлять квотами ресурсов, предотвращать избыточное выделение ресурсов и ограничивать частоту запросов API, чтобы защитить службы от потенциальных злоупотреблений.
Вы также можете повысить производительность своего приложения, используя недавно анонсированные функции, такие как гибридный поиск, фильтрация на основе метаданных, пользовательские запросы для API RetreiveAndGenerate и максимальное количество извлечений.. В совокупности эти функции повышают точность, актуальность и согласованность генерируемых ответов и соответствуют принципу эффективности производительности AWS Well-Architected Framework.
Базы знаний для Amazon Bedrock соответствуют принципу устойчивого развития AWS Well-Architected Framework за счет использования управляемых сервисов и оптимизации использования ресурсов. Являясь полностью управляемым сервисом, базы знаний для Amazon Bedrock устраняют необходимость предоставления, управления и масштабирования базовой инфраструктуры, тем самым снижая воздействие на окружающую среду, связанное с эксплуатацией и обслуживанием этих ресурсов.
Кроме того, следуя принципам AWS Well-Architected, организации могут разрабатывать и эксплуатировать свои приложения RAG устойчивым образом. Такие методы, как автоматизация развертываний с помощью AWS CloudFormation, реализация политик частных сетей для безопасного доступа к данным и использование эффективных сервисов, таких как OpenSearch Serverless, способствуют минимизации воздействия этих рабочих нагрузок на окружающую среду.
В целом, базы знаний для Amazon Bedrock в сочетании с AWS Well-Architected Framework позволяют организациям создавать масштабируемые, безопасные и надежные приложения RAG, уделяя при этом приоритет экологической устойчивости за счет эффективного использования ресурсов и внедрения управляемых сервисов.
Заключение
Новые функции корпоративного уровня, такие как поддержка AWS CloudFormation, политики частной сети, возможность использовать несколько сегментов S3 в качестве источников данных и поддержка квот на обслуживание, упрощают создание масштабируемых, безопасных и надежных приложений RAG с помощью баз знаний. для Amazon Bedrock. Использование управляемых сервисов AWS и следование передовым практикам Well-Architected позволяет организациям сосредоточиться на предоставлении инновационных генеративных решений искусственного интеллекта, обеспечивая при этом операционную эффективность, надежную безопасность и эффективное использование ресурсов. При создании приложений на AWS согласование приложений RAG с AWS Well-Architected Framework обеспечивает прочную основу для создания решений корпоративного уровня, которые повышают ценность бизнеса и соответствуют отраслевым стандартам.
Дополнительные ресурсы см. в следующих разделах:
Об авторах
Мани Хануджа — технический руководитель, специалисты по генеративному искусственному интеллекту, автор книги «Прикладное машинное обучение и высокопроизводительные вычисления на AWS», а также член совета директоров Фонда образования женщин в производстве. Она возглавляет проекты машинного обучения в различных областях, таких как компьютерное зрение, обработка естественного языка и генеративный искусственный интеллект. Она выступает на внутренних и внешних конференциях, таких как AWS re:Invent, Women in Manufacturing West, вебинарах YouTube и GHC 23. В свободное время она любит совершать длительные пробежки по пляжу.
Нитин Евсевий — старший архитектор корпоративных решений в AWS, имеющий опыт разработки программного обеспечения, архитектуры предприятия и искусственного интеллекта и машинного обучения. Он глубоко увлечен исследованием возможностей генеративного искусственного интеллекта. Он сотрудничает с клиентами, помогая им создавать хорошо спроектированные приложения на платформе AWS, а также занимается решением технологических проблем и помогает им в переходе к облаку.
Паллави Наргунд — главный архитектор решений в AWS. В своей роли специалиста по облачным технологиям она работает с клиентами, чтобы понять их цели и проблемы, а также дает рекомендации по достижению их целей с помощью предложений AWS. Она увлечена женщинами в сфере технологий и является одним из основных членов организации «Женщины в искусственном интеллекте и машинном обучении» в Amazon. Она выступает на внутренних и внешних конференциях, таких как AWS re:Invent, AWS Summits и вебинарах. Вне работы она увлекается волонтерством, садоводством, ездой на велосипеде и пешим туризмом.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/building-scalable-secure-and-reliable-rag-applications-using-knowledge-bases-for-amazon-bedrock/
- :имеет
- :является
- :нет
- :куда
- $UP
- 100
- 125
- 16
- 23
- 7
- a
- способность
- О нас
- выше
- злоупотребление
- доступ
- доступной
- выполнять
- Учетные записи
- точность
- точный
- Достигать
- достигнутый
- достижение
- через
- активно
- добавить
- дополнительный
- адресация
- соблюдение
- придерживаясь
- Принятие
- Принятие
- После
- совокупный
- AI
- Поддержка
- AI / ML
- выравнивать
- выравнивание
- Выравнивает
- Все
- разрешено
- Позволяющий
- позволяет
- вдоль
- причислены
- Amazon
- Amazon Web Services
- an
- и
- объявило
- ответ
- API
- API
- приложение
- Применение
- Приложения
- прикладной
- подхода
- соответствующий
- архитектурный
- архитектура
- архитектуры
- МЫ
- искусственный
- AS
- помощь
- содействие
- связанный
- At
- проверяемый
- дополненная
- автор
- автоматизировать
- автоматически
- Автоматизация
- автоматизация
- свободных мест
- доступен
- AWS
- AWS CloudFormation
- AWS Re: Invent
- Позвоночник
- Использование темпера с изогнутым основанием
- основанный
- BE
- Beach
- , так как:
- польза
- ЛУЧШЕЕ
- лучшие практики
- доска
- совет директоров
- книга
- строить
- Строительство
- построенный
- бремя
- бизнес
- но
- by
- кэширование
- Объявления
- CAN
- не могу
- возможности
- углерод
- случаев
- проблемы
- изменение
- chatbots
- Выбирая
- тесно
- облако
- ОБЛАЧНЫЕ ТЕХНОЛОГИИ
- код
- сотрудничает
- лыжных шлемов
- Коллекции
- коллективно
- объединять
- сочетании
- Компании
- комплексный
- компьютер
- Компьютерное зрение
- вычисление
- конференции
- Конфигурация
- последовательный
- содержит
- контекстной
- (CIJ)
- способствовать
- управление
- контрольная
- Основные
- Цена
- рентабельным
- Расходы
- чехол для варгана
- Создайте
- Создающий
- Полномочия
- критической
- решающее значение
- изготовленный на заказ
- Клиенты
- данным
- доступ к данным
- Время
- преданный
- глубоко
- глубоко
- определять
- доставить
- доставки
- поставка
- развертывание
- развертывания
- описание
- Проект
- проектирование
- подробнее
- Развитие
- различный
- Директора
- погружение
- Разнообразие
- do
- документации
- Документация
- приносит
- доменов
- управлять
- Обучение
- Эффективный
- фактически
- затрат
- эффективный
- легко
- устранен
- охватывающий
- подчеркивает
- Наделяет
- включить
- Enabler
- позволяет
- шифровать
- шифрование
- Конечная точка
- Проект и
- повышать
- расширение
- усиление
- Усиливает
- повышение
- обеспечивать
- Предприятие
- корпоративного класса
- Весь
- окружающий
- Экологическая устойчивость
- средах
- ошибки
- существенный
- События
- пример
- Превосходство
- существующий
- расширяющийся
- расходы
- опыт
- опытные
- Разведанный
- исследует
- Исследование
- продолжается
- и, что лучший способ
- далеко
- БЫСТРО
- Особенность
- Особенности
- Поля
- Файлы
- фильтры
- финансовый
- First
- Фокус
- после
- Что касается
- формат
- Год основания
- Рамки
- Бесплатно
- от
- полностью
- далее
- Более того
- получила
- генерируется
- поколение
- генеративный
- Генеративный ИИ
- Дайте
- стекло
- Go
- Цели
- значительно
- Рост
- руководство
- инструкция
- методические рекомендации
- Есть
- he
- помощь
- помогает
- ее
- High
- высокопроизводительный
- Как
- How To
- Однако
- HTML
- HTTP
- HTTPS
- человек
- ID
- Личность
- Влияние
- Осуществляющий
- важную
- важно
- улучшать
- улучшение
- in
- В том числе
- включать
- включенный
- Увеличивает
- все больше и больше
- индекс
- промышленность
- отраслевые стандарты
- информация
- Инфраструктура
- Инновации
- инновационный
- целостность
- в нашей внутренней среде,
- Интернет
- в
- IT
- пункты
- ЕГО
- путешествие
- JPEG
- JPG
- JSON
- хранится
- Основные
- знания
- язык
- последний
- запустили
- слоев
- вести
- ведущий
- Лиды
- изучение
- такое как
- нравится
- ОГРАНИЧЕНИЯ
- Длинное
- долгосрочный
- машина
- обучение с помощью машины
- поддерживать
- Сохранение
- сделать
- ДЕЛАЕТ
- управлять
- управляемого
- управление
- управления
- способ
- производство
- максимальный
- член
- Метаданные
- Метрика
- минимизация
- злоупотреблять
- модель
- Импульс
- Мониторинг
- БОЛЕЕ
- с разными
- должен
- имя
- натуральный
- Обработка естественного языка
- необходимо
- Необходимость
- сеть
- сетевой трафик
- Новые
- Новые функции
- сейчас
- номер
- объект
- цель
- устаревший
- of
- Предложения
- Предложения
- on
- ONE
- только
- работать
- операционный
- оперативный
- Операционный отдел
- оптимальный
- оптимизирующий
- Опция
- or
- организации
- внешнюю
- общий
- хлеб
- страстный
- для
- производительность
- выполнения
- Разрешения
- Персонализированные
- мародерство
- столбы
- Платформа
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- пожалуйста
- сборах
- политика
- возможности,
- После
- Postgresql
- потенциал
- мощностью
- практиками
- предотвращать
- Основной
- Принципы
- приоритезация
- политикой конфиденциальности.
- частная
- процесс
- Процессы
- обработка
- Производство
- проектов
- продвижении
- способствует
- Содействие
- наводящие
- свойства
- обеспечивать
- приводит
- обеспечение
- что такое варган?
- вопрос
- САЙТ
- быстро
- тряпка
- ассортимент
- Стоимость
- RE
- легко
- причины
- недавно
- уменьшить
- снижение
- относиться
- районы
- Связанный
- актуальность
- соответствующие
- надежность
- складская
- остатки
- удален
- удаляет
- запросить
- Запросы
- обязательный
- упругий
- ресурс
- Полезные ресурсы
- ответы
- в результате
- поиск
- надежный
- Роли
- работает
- охранять
- образец
- Масштабируемость
- масштабируемые
- масштабирование
- скрипт
- легко
- Поиск
- Во-вторых
- безопасный
- безопасно
- безопасность
- посмотреть
- поиск
- выберите
- выбранный
- чувствительный
- Serverless
- обслуживание
- Услуги
- набор
- установка
- настройки
- установка
- несколько
- она
- значительный
- просто
- одинарной
- ШЕСТЬ
- Software
- разработка программного обеспечения
- твердый
- Решения
- Решение
- некоторые
- Источник
- Источники
- Говорит
- специалисты
- конкретно
- стандартов
- диск
- магазин
- хранить
- магазины
- простой
- стратегий
- Стратегия
- упорядочить
- тока
- упорядочение
- строка
- сильный
- успех
- успешный
- такие
- Вершины
- поддержка
- Поддержанный
- поддержки
- Поддержка
- Убедитесь
- Стабильность
- комфортного
- системы
- технологии
- Технологии
- шаблон
- который
- Ассоциация
- их
- Их
- тогда
- тем самым
- Эти
- они
- этой
- Через
- время
- в
- терпимость
- верхний уровень
- трафик
- переход
- лечения
- напишите
- В конечном счете
- лежащий в основе
- понимать
- отпереть
- Обновление ПО
- обновление
- Применение
- использование
- используемый
- Информация о пользователе
- Пользовательский опыт
- пользователей
- через
- ценностное
- Наши ценности
- различный
- жизнеспособность
- Вид
- видение
- we
- Web
- веб-сервисы
- Вебинары
- запад
- когда
- который
- в то время как
- будете
- в
- Женщина
- женщины в технологии
- Работа
- работает
- бы
- письмо
- Ты
- ВАШЕ
- YouTube
- зефирнет