Благодаря последним достижениям в генеративный ИИ, ведется много дискуссий о том, как использовать генеративный ИИ в разных отраслях для решения конкретных бизнес-задач. Генеративный ИИ — это тип ИИ, который может создавать новый контент и идеи, включая разговоры, истории, изображения, видео и музыку. Все это поддерживается очень большими моделями, которые предварительно обучены на огромных объемах данных и обычно называются модели фундамента (ФМ). Эти FM могут выполнять широкий спектр задач, охватывающих несколько доменов, таких как написание сообщений в блогах, создание изображений, решение математических задач, участие в диалогах и ответы на вопросы на основе документа. Размер и универсальный характер FM отличают их от традиционных моделей ML, которые обычно выполняют определенные задачи, такие как анализ текста на предмет тональности, классификация изображений и прогнозирование тенденций.
В то время как организации стремятся использовать возможности этих FM, они также хотят, чтобы решения на основе FM работали в их собственных защищенных средах. Организации, работающие в строго регулируемых областях, таких как глобальные финансовые услуги, здравоохранение и медико-биологические науки, предъявляют аудиторские требования и требования соответствия для запуска своей среды в своих VPC. Фактически, во многих случаях даже прямой доступ в Интернет отключается в этих средах, чтобы избежать воздействия любого непреднамеренного трафика, как входящего, так и исходящего.
Amazon SageMaker JumpStart — это центр машинного обучения, предлагающий алгоритмы, модели и решения машинного обучения. С помощью SageMaker JumpStart специалисты по машинному обучению могут выбирать из растущего списка наиболее эффективных FM с открытым исходным кодом. Он также предоставляет возможность развертывания этих моделей в собственных Виртуальное частное облако (VPC).
В этом посте мы покажем, как использовать JumpStart для развертывания Флан-Т5 XXL модели в VPC без подключения к Интернету. Мы обсуждаем следующие темы:
- Как развернуть базовую модель с помощью SageMaker JumpStart в облаке VPC без доступа к Интернету
- Преимущества развертывания FM через модели SageMaker JumpStart в режиме VPC
- Альтернативные способы настройки развертывания базовых моделей с помощью JumpStart.
Помимо FLAN-T5 XXL, JumpStart предлагает множество различных моделей фундаментов для различных задач. Полный список см. Начало работы с Amazon SageMaker JumpStart.
Обзор решения
В рамках решения мы рассмотрим следующие шаги:
- Настройте VPC без подключения к Интернету.
- Создавать Студия Amazon SageMaker с помощью созданного нами VPC.
- Разверните базовую модель генеративного искусственного интеллекта Flan T5-XXL с помощью JumpStart в облаке VPC без доступа к Интернету.
Ниже приведена архитектурная схема решения.
Давайте рассмотрим различные шаги для реализации этого решения.
Предпосылки
Чтобы следовать этому посту, вам необходимо следующее:
Настройте VPC без подключения к Интернету
Создайте новый стек CloudFormation с помощью 01_networking.yaml шаблон. Этот шаблон создает новый VPC и добавляет две частные подсети в двух зонах доступности без подключения к Интернету. Затем он развертывает конечные точки шлюза VPC для доступа Простой сервис хранения Amazon (Amazon S3) и интерфейсные конечные точки VPC для SageMaker и некоторых других сервисов, чтобы позволить ресурсам в VPC подключаться к сервисам AWS через Приватная ссылка AWS.
Укажите имя стека, например No-Internet
и завершите процесс создания стека.
Это решение не отличается высокой доступностью, поскольку шаблон CloudFormation создает интерфейсные конечные точки VPC только в одной подсети, чтобы снизить затраты при выполнении действий, описанных в этом посте.
Настройте Studio с помощью VPC
Создайте еще один стек CloudFormation, используя 02_sagemaker_studio.yaml, который создает домен Studio, профиль пользователя Studio и вспомогательные ресурсы, такие как роли IAM. Выберите имя для стека; для этого поста мы используем имя SageMaker-Studio-VPC-No-Internet
. Укажите имя созданного ранее стека VPC (No-Internet
) в качестве CoreNetworkingStackName
параметр и оставить все остальное по умолчанию.
Подождите, пока AWS CloudFormation сообщит о завершении создания стека. Вы можете подтвердить, что домен Studio доступен для использования на консоли SageMaker.
Чтобы убедиться, что у пользователя домена Studio нет доступа в Интернет, запустить Studio с помощью консоли SageMaker. Выберите Файл, Новыеи Терминал, затем попытайтесь получить доступ к интернет-ресурсу. Как показано на следующем снимке экрана, терминал будет продолжать ждать ресурса и в конечном итоге истечет время ожидания.
Это доказывает, что Studio работает в облаке VPC, у которого нет доступа в Интернет.
Разверните базовую модель генеративного ИИ Flan T5-XXL с помощью JumpStart.
Мы можем развернуть эту модель как через Studio, так и через API. JumpStart предоставляет весь код для развертывания модели через записную книжку SageMaker, доступную из Studio. В этом посте мы демонстрируем эту возможность из Studio.
- На странице приветствия Studio выберите Толчок в разделе Готовые и автоматизированные решения.
- Выберите модель Flan-T5 XXL в разделе Фундаментальные модели.
- По умолчанию открывается Развертывание Вкладка. Разверните Конфигурация развертывания раздел для изменения
hosting instance
иendpoint name
или добавьте любые дополнительные теги. Также есть возможность изменитьS3 bucket location
где будет храниться артефакт модели для создания конечной точки. Для этого поста мы оставляем все значения по умолчанию. Запишите имя конечной точки, которое будет использоваться при вызове конечной точки для создания прогнозов.
- Развернуть Настройки безопасности раздел, где можно указать
IAM role
для создания конечной точки. Вы также можете указатьVPC configurations
путем предоставленияsubnets
иsecurity groups
. Идентификаторы подсети и группы безопасности можно найти на вкладке «Выводы» стека VPC в консоли AWS CloudFormation. Для SageMaker JumpStart требуется по крайней мере две подсети как часть этой конфигурации. Подсети и группы безопасности контролируют доступ к контейнеру модели и из него.
ЗАМЕТКА: независимо от того, развернута ли модель SageMaker JumpStart в VPC или нет, модель всегда работает в режиме сетевой изоляции, который изолирует контейнер модели, поэтому входящие или исходящие сетевые вызовы не могут выполняться в контейнер модели или из него. Поскольку мы используем VPC, SageMaker загружает артефакт модели через указанное VPC. Запуск контейнера модели в сетевой изоляции не мешает вашей конечной точке SageMaker отвечать на запросы логического вывода. Серверный процесс работает вместе с контейнером модели и пересылает ему запросы на вывод, но контейнер модели не имеет доступа к сети.
- Выберите Развертывание для развертывания модели. Мы можем видеть почти в реальном времени состояние процесса создания конечной точки. Создание конечной точки может занять 5–10 минут.
Обратите внимание на значение поля Местоположение данных модели на этой странице. Все модели SageMaker JumpStart размещаются в корзине S3, управляемой SageMaker (s3://jumpstart-cache-prod-{region}
). Таким образом, независимо от того, какая модель выбрана из JumpStart, модель развертывается из общедоступной корзины SageMaker JumpStart S3, и трафик никогда не направляется в API общедоступного зоопарка моделей для загрузки модели. Вот почему создание конечной точки модели началось успешно, даже если мы создаем конечную точку в облаке VPC, у которого нет прямого доступа в Интернет.
Артефакт модели также можно скопировать в любой частный зоопарк моделей или в вашу собственную корзину S3 для дальнейшего контроля и защиты местоположения источника модели. Вы можете использовать следующую команду для загрузки модели локально с помощью Интерфейс командной строки AWS (интерфейс командной строки AWS):
aws s3 cp s3://jumpstart-cache-prod-eu-west-1/huggingface-infer/prepack/v1.0.2/infer-prepack-huggingface-text2text-flan-t5-xxl.tar.gz .
- Через несколько минут конечная точка успешно создана и показывает статус как В сервисе. Выберите
Open Notebook
вUse Endpoint from Studio
раздел. Это образец записной книжки, предоставленный в рамках программы JumpStart для быстрого тестирования конечной точки.
- В блокноте выберите изображение как Наука о данных 3.0 и ядро как Python 3. Когда ядро будет готово, вы можете запустить ячейки записной книжки, чтобы делать прогнозы на конечной точке. Обратите внимание, что ноутбук использует вызвать_конечную точку() API из AWS SDK для Python делать прогнозы. В качестве альтернативы вы можете использовать Предсказание() в SageMaker Python SDK способ достижения того же результата.
На этом завершаются шаги по развертыванию модели Flan-T5 XXL с использованием JumpStart в облаке VPC без доступа к Интернету.
Преимущества развертывания моделей SageMaker JumpStart в режиме VPC
Ниже приведены некоторые преимущества развертывания моделей SageMaker JumpStart в режиме VPC:
- Поскольку SageMaker JumpStart не загружает модели из общедоступного зоопарка моделей, его можно использовать в полностью заблокированных средах, где нет доступа в Интернет.
- Поскольку доступ к сети может быть ограничен для моделей SageMaker JumpStart, это помогает командам повысить уровень безопасности среды.
- Из-за границ VPC доступ к конечной точке также может быть ограничен через подсети и группы безопасности, что добавляет дополнительный уровень безопасности.
Альтернативные способы настройки развертывания базовых моделей с помощью SageMaker JumpStart.
В этом разделе мы расскажем о некоторых альтернативных способах развертывания модели.
Используйте SageMaker JumpStart API из предпочитаемой вами IDE
Модели, предоставляемые SageMaker JumpStart, не требуют доступа к Studio. Вы можете развернуть их на конечных точках SageMaker из любой IDE благодаря API-интерфейсы JumpStart. Вы можете пропустить этап настройки Studio, описанный ранее в этом посте, и использовать API JumpStart для развертывания модели. Эти API-интерфейсы предоставляют аргументы, в которых также могут быть предоставлены конфигурации VPC. API являются частью SDK для SageMaker Python сам. Для получения дополнительной информации см. Предварительно обученные модели.
Используйте записные книжки, предоставленные SageMaker JumpStart из SageMaker Studio.
SageMaker JumpStart также предоставляет ноутбуки для непосредственного развертывания модели. На странице сведений о модели выберите Открыть блокнот чтобы открыть образец записной книжки, содержащий код для развертывания конечной точки. В ноутбуке используется Отраслевые API-интерфейсы SageMaker JumpStart которые позволяют вам составлять список и фильтровать модели, извлекать артефакты, а также развертывать конечные точки и запрашивать их. Вы также можете отредактировать код записной книжки в соответствии с конкретными требованиями вашего варианта использования.
Очистить ресурсы
Попробуйте CLEANUP.md файл, чтобы найти подробные инструкции по удалению Studio, VPC и других ресурсов, созданных в рамках этого поста.
УСТРАНЕНИЕ НЕПОЛАДОК
Если у вас возникли проблемы при создании стеков CloudFormation, см. Устранение неполадок CloudFormation.
Заключение
Генеративный ИИ на основе больших языковых моделей меняет то, как люди получают и применяют идеи из информации. Тем не менее, организации, работающие в строго регулируемых областях, должны использовать возможности генеративного ИИ таким образом, чтобы они могли быстрее внедрять инновации, а также упрощали схемы доступа к таким возможностям.
Мы рекомендуем вам попробовать подход, представленный в этом посте, чтобы внедрить возможности генеративного ИИ в вашу существующую среду, сохраняя при этом его в своем собственном VPC без доступа к Интернету. Чтобы узнать больше о базовых моделях SageMaker JumpStart, ознакомьтесь со следующими материалами:
Об авторах
Викеш Пандей является специалистом по машинному обучению и архитектором решений в AWS, помогая клиентам из финансовой отрасли проектировать и создавать решения на основе генеративного искусственного интеллекта и машинного обучения. Вне работы Викеш любит пробовать разные кухни и заниматься спортом на открытом воздухе.
Мехран Нику является старшим архитектором решений в AWS, работает с компаниями Digital Native в Великобритании и помогает им в достижении их целей. Увлеченный применением своего опыта разработки программного обеспечения для машинного обучения, он специализируется на сквозном машинном обучении и методах MLOps.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Автомобили / электромобили, Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- Смещения блоков. Модернизация права собственности на экологические компенсации. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/use-generative-ai-foundation-models-in-vpc-mode-with-no-internet-connectivity-using-amazon-sagemaker-jumpstart/
- :имеет
- :является
- :нет
- :куда
- $UP
- 100
- 7
- a
- способность
- О нас
- доступ
- доступной
- доступа
- Достигать
- приобретать
- через
- Добавить
- дополнительный
- Добавляет
- достижения
- Преимущества
- AI
- алгоритмы
- Все
- позволять
- позволяет
- вдоль
- рядом
- причислены
- всегда
- Amazon
- Создатель мудреца Амазонки
- Amazon SageMaker JumpStart
- Amazon Web Services
- суммы
- an
- анализ
- и
- Другой
- любой
- API
- API
- Применить
- Применение
- подхода
- архитектура
- МЫ
- Аргументы
- AS
- At
- Автоматизированный
- свободных мест
- доступен
- избежать
- AWS
- AWS CloudFormation
- со спинкой
- основанный
- BE
- , так как:
- ЛУЧШЕЕ
- Блог
- Сообщения в блоге
- изоферменты печени
- Границы
- строить
- бизнес
- бизнес
- но
- by
- Объявления
- CAN
- возможности
- возможности
- Клетки
- изменение
- изменения
- проверка
- Выберите
- облако
- код
- обычно
- полный
- Соответствие закону
- Конфигурация
- подтвердить
- Свяжитесь
- связи
- связь
- Консоли
- Container
- содержание
- контроль
- Беседы
- Расходы
- может
- чехол для варгана
- Создайте
- создали
- создает
- Создающий
- создание
- Клиенты
- настроить
- данным
- По умолчанию
- демонстрировать
- развертывание
- развернуть
- развертывание
- развертывание
- развертывает
- Проект
- подробность
- подробный
- Диалог
- различный
- Интернет
- направлять
- непосредственно
- инвалид
- обсуждать
- обсуждается
- обсуждение
- документ
- не
- домен
- доменов
- Dont
- вниз
- скачать
- загрузок
- Ранее
- еще
- вставлять
- поощрять
- впритык
- Конечная точка
- привлечение
- Проект и
- Окружающая среда
- средах
- Даже
- со временем
- многое
- существующий
- Расширьте
- опыт
- Экспозиция
- дополнительно
- факт
- быстрее
- несколько
- поле
- Файл
- фильтр
- финансовый
- финансовые отрасли
- финансовые услуги
- Найдите
- следовать
- после
- Что касается
- найденный
- Год основания
- от
- полностью
- далее
- шлюз
- общее назначение
- порождающий
- генеративный
- Генеративный ИИ
- Глобальный
- глобальный финансовый
- Цели
- идет
- группы
- Группы
- Рост
- Случай
- Есть
- he
- здравоохранение
- сильно
- помощь
- помогает
- очень
- его
- состоялся
- Как
- How To
- Однако
- HTML
- HTTP
- HTTPS
- хаб
- идеи
- идентификаторы
- изображение
- изображений
- осуществлять
- улучшать
- in
- В том числе
- промышленности
- промышленность
- информация
- обновлять
- внутри
- размышления
- Интерфейс
- Интернет
- доступ в Интернет
- интернет-соединение
- независимо
- изоляция
- вопросы
- IT
- ЕГО
- саму трезвость
- JPG
- Сохранить
- хранение
- язык
- большой
- слой
- изучение
- наименее
- Оставлять
- ЖИЗНЬЮ
- Медико-биологическая промышленность
- такое как
- Ограниченный
- линия
- Список
- в местном масштабе
- расположение
- искать
- серия
- машина
- обучение с помощью машины
- сделанный
- сделать
- Создание
- управляемого
- математике
- Май..
- метод
- Минут
- ML
- млн операций в секунду
- режим
- модель
- Модели
- БОЛЕЕ
- с разными
- Музыка
- имя
- родной
- природа
- Необходимость
- сеть
- никогда
- Новые
- нет
- ноутбук
- of
- предлагающий
- on
- ONE
- только
- открытый
- с открытым исходным кодом
- Откроется
- операционный
- Опция
- or
- организации
- Другое
- наши
- внешний
- внешнюю
- собственный
- страница
- параметр
- часть
- страстный
- паттеранами
- Люди
- для
- Выполнять
- выполнения
- взял
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- игры
- После
- Блог
- мощностью
- Питание
- практиками
- предсказывать
- Predictions
- Predictor
- привилегированный
- предотвращать
- частная
- проблемам
- процесс
- Профиль
- Прогресс
- защищенный
- доказывает
- обеспечивать
- при условии
- приводит
- обеспечение
- что такое варган?
- публично
- Питон
- Вопросы
- быстро
- ассортимент
- Reading
- готовый
- последний
- уменьшить
- назвало
- регулируемых брокеров
- Отчеты
- Запросы
- требовать
- обязательный
- Требования
- требуется
- ресурс
- Полезные ресурсы
- ответ
- результат
- роли
- Run
- Бег
- работает
- sagemaker
- то же
- Наука
- НАУКА
- SDK
- Раздел
- безопасный
- безопасность
- посмотреть
- старший
- настроение
- Услуги
- установка
- Поделиться
- демонстрации
- показанный
- Шоу
- просто
- Размер
- So
- Software
- разработка программного обеспечения
- Решение
- Решения
- РЕШАТЬ
- Решение
- некоторые
- Источник
- пространства
- пролет
- специалист
- специализируется
- конкретный
- указанный
- Спорт
- стек
- Стеки
- и политические лидеры
- Статус:
- Шаг
- Шаги
- По-прежнему
- диск
- хранить
- Истории
- студия
- подсети
- подсеть
- Успешно
- такие
- поставляется
- поддержки
- взять
- задачи
- команды
- шаблон
- Терминал
- тестXNUMX
- Спасибо
- который
- Ассоциация
- Великобритании
- их
- Их
- тогда
- Там.
- следовательно
- Эти
- они
- этой
- Через
- время
- раз
- в
- Темы
- традиционный
- трафик
- Тенденции
- стараться
- два
- напишите
- типично
- Uk
- под
- до
- использование
- используемый
- Информация о пользователе
- использования
- через
- ценностное
- Наши ценности
- различный
- Огромная
- проверить
- очень
- с помощью
- Видео
- Ожидание
- хотеть
- Путь..
- способы
- we
- Web
- веб-сервисы
- добро пожаловать
- ЧТО Ж
- когда
- будь то
- , которые
- в то время как
- зачем
- широкий
- Широкий диапазон
- Википедия.
- будете
- в
- Работа
- работает
- письмо
- YAML
- Ты
- ВАШЕ
- зефирнет
- зоны
- ZOO