Comece a usar a distribuição de código aberto do Amazon SageMaker

Republicado por Platão

seguidores: 0

Os cientistas de dados precisam de um ambiente consistente e reproduzível para cargas de trabalho de aprendizado de máquina (ML) e ciência de dados que permita o gerenciamento de dependências e seja seguro. Contêineres de aprendizado profundo da AWS já fornece imagens Docker pré-criadas para treinar e servir modelos em estruturas comuns, como TensorFlow, PyTorch e MXNet. Para melhorar essa experiência, anunciamos uma versão beta pública da distribuição de código aberto SageMaker na JupyterCon 2023. Isso fornece uma experiência de ML de ponta a ponta unificada para desenvolvedores de ML de vários níveis de especialização. Os desenvolvedores não precisam mais alternar entre diferentes contêineres de estrutura para experimentação ou à medida que passam de ambientes JupyterLab locais e notebooks SageMaker para trabalhos de produção no SageMaker. O SageMaker Distribution de código aberto oferece suporte aos pacotes e bibliotecas mais comuns para ciência de dados, ML e visualização, como TensorFlow, PyTorch, Scikit-learn, Pandas e Matplotlib. Você pode começar a usar o contêiner do Galeria pública do Amazon ECR começando hoje.

Nesta postagem, mostramos como você pode usar a distribuição de código aberto SageMaker para experimentar rapidamente em seu ambiente local e promovê-los facilmente para empregos no SageMaker.

Visão geral da solução

Para nosso exemplo, mostramos o treinamento de um modelo de classificação de imagem usando o PyTorch. Nós usamos o KMNIST conjunto de dados disponível publicamente no PyTorch. Treinamos um modelo de rede neural, testamos o desempenho do modelo e, finalmente, imprimimos o treinamento e a perda de teste. O notebook completo para este exemplo está disponível no Repositório de exemplos do SageMaker Studio Lab. Iniciamos a experimentação em um laptop local usando a distribuição de código aberto, movemos para Estúdio Amazon SageMaker para usar uma instância maior e agende o bloco de anotações como um trabalho de bloco de anotações.

Pré-requisitos

Você precisa dos seguintes pré-requisitos:

Configure seu ambiente local

Você pode começar a usar diretamente a distribuição de código aberto em seu laptop local. Para iniciar o JupyterLab, execute os seguintes comandos no seu terminal:

export ECR_IMAGE_ID='public.ecr.aws/sagemaker/sagemaker-distribution:latest-cpu'
docker run -it -p 8888:8888 --user `id -u`:`id -g` -v `pwd`/sample-notebooks:/home/sagemaker-user/sample-notebooks $ECR_IMAGE_ID jupyter-lab --no-browser --ip=0.0.0.0

Você pode substituir ECR_IMAGE_ID com qualquer uma das tags de imagem disponíveis no Galeria pública do Amazon ECR, ou escolha o latest-gpu tag se estiver usando uma máquina compatível com GPU.

Este comando iniciará o JupyterLab e fornecerá uma URL no terminal, como http://127.0.0.1:8888/lab?token=<token>. Copie o link e insira-o em seu navegador preferido para iniciar o JupyterLab.

Configurar estúdio

O Studio é um ambiente de desenvolvimento integrado (IDE) de ponta a ponta para ML que permite que desenvolvedores e cientistas de dados criem, treinem, implantem e monitorem modelos de ML em escala. O Studio fornece uma extensa lista de imagens próprias com estruturas e pacotes comuns, como Data Science, TensorFlow, PyTorch e Spark. Essas imagens tornam simples para os cientistas de dados começarem a usar o ML simplesmente escolhendo uma estrutura e um tipo de instância de sua escolha para computação.

Agora você pode usar a distribuição de código aberto SageMaker no Studio usando o Studio traga sua própria imagem recurso. Para adicionar a distribuição de código aberto ao seu domínio SageMaker, conclua as seguintes etapas:

Adicione a distribuição de código aberto à sua conta Registro do Amazon Elastic Container (Amazon ECR) executando os seguintes comandos em seu terminal:

# Use the latest-cpu or latest-gpu tag based on your requirements
export ECR_GALLERY_IMAGE_ID='sagemaker-distribution:latest-cpu'
export SAGEMAKER_IMAGE_NAME='sagemaker-runtime'
export SAGEMAKER_STUDIO_DOMAIN_ID='d-xxxx'
export SAGEMAKER_STUDIO_IAM_ROLE_ARN='<studio-default-execution-role-arn>' docker pull public.ecr.aws/sagemaker/$ECR_GALLERY_IMAGE_ID export ECR_PRIVATE_REPOSITORY_NAME='sm-distribution'
export ECR_IMAGE_TAG='sagemaker-runtime-cpu'
export AWS_ACCOUNT_ID='0123456789'
export AWS_ECR_REPOSITORY_REGION='us-east-1' # create repository
aws --region ${AWS_ECR_REPOSITORY_REGION} ecr create-repository --repository-name $ECR_PRIVATE_REPOSITORY_NAME
aws --region ${AWS_ECR_REPOSITORY_REGION} ecr get-login-password | docker login --username AWS --password-stdin ${AWS_ACCOUNT_ID}.dkr.ecr.${AWS_ECR_REPOSITORY_REGION}.amazonaws.com
export ECR_IMAGE_URI=$AWS_ACCOUNT_ID.dkr.ecr.$AWS_ECR_REPOSITORY_REGION.amazonaws.com/$ECR_PRIVATE_REPOSITORY_NAME:$ECR_IMAGE_TAG # Tag
docker tag public.ecr.aws/sagemaker/$ECR_GALLERY_IMAGE_ID $ECR_IMAGE_URI
# Push the image to your private repository
docker push $ECR_IMAGE_URI

Crie uma imagem do SageMaker e anexe a imagem ao domínio do Studio:

# Create a SageMaker image
aws sagemaker create-image --image-name $SAGEMAKER_IMAGE_NAME --role-arn $SAGEMAKER_STUDIO_IAM_ROLE_ARN
# Create a SageMaker Image Version.
aws sagemaker create-image-version --image-name $SAGEMAKER_IMAGE_NAME --base-image $ECR_IMAGE_URI # Optionally, describe the image version to ensure it's succesfully created
aws sagemaker describe-image-version --image-name $SAGEMAKER_IMAGE_NAME --version-number 1 # Create the app image configuration file
cat > /tmp/app-config.json << EOF
{ "AppImageConfigName": "app-image-config-$SAGEMAKER_IMAGE_NAME", "KernelGatewayImageConfig": { "FileSystemConfig": { "DefaultGid": 100, "DefaultUid": 1000, "MountPath": "/home/sagemaker-user" }, "KernelSpecs": [ { "DisplayName": "Python 3 (ipykernel)", "Name": "python3" } ] }
}
EOF # Create an Amazon SageMaker App Image Config.
aws sagemaker create-app-image-config --cli-input-json file:///tmp/app-config.json # Create a default user settings file
# Update the file with your existing settings if you have additional custom images
cat > /tmp/default-user-settings.json << EOF
{ "DefaultUserSettings": { "KernelGatewayAppSettings": { "CustomImages": [ { "ImageName": "$SAGEMAKER_IMAGE_NAME", "AppImageConfigName": "app-image-config-$SAGEMAKER_IMAGE_NAME", "ImageVersionNumber": 1 } ] } }
}
EOF # Update Amazon SageMaker Domain with the new default User Settings.
aws sagemaker update-domain --domain-id $SAGEMAKER_STUDIO_DOMAIN_ID --cli-input-json file:///tmp/default-user-settings.json

No console do SageMaker, inicie o Studio escolhendo seu domínio e perfil de usuário existente.
Opcionalmente, reinicie o Studio seguindo as etapas em Desligue e atualize o SageMaker Studio.

detalhes do domínio

Baixe o caderno

Faça o download do bloco de anotações de amostra localmente em GitHub repo.

Abra o notebook no IDE de sua escolha e adicione uma célula no início do notebook para instalar torchsummary. O torchsummary pacote não faz parte da distribuição e instalá-lo no notebook garantirá que o notebook seja executado de ponta a ponta. Recomendamos usar conda or micromamba para gerenciar ambientes e dependências. Adicione a seguinte célula ao notebook e salve o notebook:

%pip install torchsummary

Experimente no notebook local

Carregue o notebook na IU do JupyterLab que você iniciou escolhendo o ícone de upload conforme mostrado na captura de tela a seguir.

upload de arquivo

Quando estiver carregado, inicie o cv-kmnist.ipynb caderno. Você pode começar a executar as células imediatamente, sem precisar instalar nenhuma dependência, como maçarico, matplotlib ou ipywidgets.

Se você seguiu as etapas anteriores, verá que pode usar a distribuição localmente em seu laptop. Na próxima etapa, usamos a mesma distribuição no Studio para aproveitar os recursos do Studio.

Mova a experimentação para o Studio (opcional)

Opcionalmente, vamos promover a experimentação para o Studio. Uma das vantagens do Studio é que os recursos de computação subjacentes são totalmente elásticos, para que você possa discar facilmente os recursos disponíveis para cima ou para baixo, e as alterações ocorrem automaticamente em segundo plano sem interromper seu trabalho. Se você deseja executar o mesmo bloco de anotações anterior em um conjunto de dados e instância de computação maiores, pode migrar para o Studio.

Navegue até a interface do usuário do Studio que você iniciou anteriormente e escolha o ícone de upload para fazer upload do bloco de anotações.

upload-arquivo-estúdio

Depois de iniciar o notebook, você será solicitado a escolher a imagem e o tipo de instância. No iniciador do kernel, escolha sagemaker-runtime como a imagem e um ml.t3.medium instância, em seguida, escolha Selecionar.

escolher-imagem-estúdio

Agora você pode executar o notebook de ponta a ponta sem precisar fazer alterações no notebook do seu ambiente de desenvolvimento local para os notebooks do Studio!

Agendar o notebook como um trabalho

Quando você terminar sua experimentação, o SageMaker oferece várias opções para colocar seu notebook em produção, como trabalhos de treinamento e pipelines do SageMaker. Uma dessas opções é executar diretamente o próprio notebook como um trabalho de notebook agendado e não interativo usando Tarefas do notebook SageMaker. Por exemplo, você pode querer treinar novamente seu modelo periodicamente ou obter inferências sobre os dados recebidos periodicamente e gerar relatórios para consumo por seus interessados.

No Studio, escolha o ícone do trabalho do notebook para iniciar o trabalho do notebook. Se você instalou a extensão de tarefas do notebook localmente em seu laptop, também pode agendar o notebook diretamente de seu laptop. Ver Guia de Instalação para configurar a extensão de tarefas do notebook localmente.

agenda-notebook-job-icon

O trabalho do notebook usa automaticamente o URI da imagem ECR da distribuição de software livre, para que você possa agendar diretamente o trabalho do notebook.

escolher-imagem-nb-job

Escolha executar dentro do cronograma, escolha uma programação, por exemplo, toda semana no sábado, e escolha Criar. Você também pode escolher Corra agora se você gostaria de ver os resultados imediatamente.

enviar-nb-trabalho

Quando o primeiro trabalho do notebook estiver concluído, você poderá visualizar as saídas do notebook diretamente da interface do usuário do Studio, escolhendo Portátil para Arquivos de saída.

visualizar saída do trabalho

Considerações adicionais

Além de usar a imagem ECR disponível publicamente diretamente para cargas de trabalho de ML, a distribuição de código aberto oferece as seguintes vantagens:

O Dockerfile usado para criar a imagem está disponível publicamente para os desenvolvedores explorarem e criarem suas próprias imagens. Você também pode herdar essa imagem como a imagem base e instalar suas bibliotecas personalizadas para ter um ambiente reproduzível.
Se você não está acostumado com o Docker e prefere usar ambientes Conda em seu ambiente JupyterLab, oferecemos um env.out arquivo para cada uma das versões publicadas. Você pode usar as instruções no arquivo para criar seu próprio ambiente Conda que imitará o mesmo ambiente. Por exemplo, consulte o arquivo de ambiente da CPU cpu.env.out.
Você pode usar as versões de GPU da imagem para executar cargas de trabalho compatíveis com GPU, como aprendizado profundo e processamento de imagens.

limpar

Conclua as etapas a seguir para limpar seus recursos:

Se você agendou seu bloco de anotações para ser executado em uma programação, pause ou exclua a programação no Definições de Tarefas do Notebook guia para evitar o pagamento de trabalhos futuros.
Desligue todos os aplicativos do Studio para evitar pagar pelo uso de computação não utilizado. Ver Desligue e atualize os aplicativos do Studio para obter instruções.
Opcionalmente, exclua o domínio do Studio se você criou um.

Conclusão

Manter um ambiente reproduzível em diferentes estágios do ciclo de vida do ML é um dos maiores desafios para cientistas de dados e desenvolvedores. Com a distribuição de código aberto SageMaker, fornecemos uma imagem com versões mutuamente compatíveis das estruturas e pacotes de ML mais comuns. A distribuição também é de código aberto, fornecendo aos desenvolvedores transparência nos pacotes e processos de construção, facilitando a personalização de sua própria distribuição.

Neste post, mostramos como usar a distribuição em seu ambiente local, no Studio e como contêiner para seus trabalhos de treinamento. Este recurso está atualmente em versão beta pública. Incentivamos você a experimentar e compartilhar seus comentários e problemas no repositório GitHub público!

Sobre os autores

Durga Sury é arquiteto de soluções de ML da equipe Amazon SageMaker Service SA. Ela é apaixonada por tornar o aprendizado de máquina acessível a todos. Em seus 4 anos na AWS, ela ajudou a configurar plataformas AI/ML para clientes corporativos. Quando não está trabalhando, ela adora andar de moto, romances de mistério e longas caminhadas com seu husky de 5 anos.

Ketan Vijayvargiya é Engenheiro de Desenvolvimento de Software Sênior na Amazon Web Services (AWS). Suas áreas de foco são aprendizado de máquina, sistemas distribuídos e código aberto. Fora do trabalho, ele gosta de passar o tempo se hospedando e curtindo a natureza.

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
EVM Finanças. Interface unificada para finanças descentralizadas. Acesse aqui.
Grupo de Mídia Quântica. IR/PR Amplificado. Acesse aqui.
PlatoAiStream. Inteligência de Dados Web3. Conhecimento Amplificado. Acesse aqui.
Fonte: https://aws.amazon.com/blogs/machine-learning/get-started-with-the-open-source-amazon-sagemaker-distribution/

Carimbo de hora: 8 de Junho de 2023

Carimbo de hora: 20 Dezembro, 2022

Republicado por Platão

Intuitivo alcança maior produtividade e economiza custos de IA/ML usando AWS Inferentia e PyTorch | Amazon Web Services

Treinamento distribuído com Amazon EKS e Torch Distributed Elastic

Aproveitando a inteligência artificial e o aprendizado de máquina na Parsons com o AWS DeepRacer

Como o Kustomer utiliza imagens personalizadas do Docker e o Amazon SageMaker para criar um pipeline de classificação de texto

Crie áudio para conteúdo em vários idiomas com a mesma persona de voz TTS no Amazon Polly

Apresentando Fortuna: uma biblioteca para quantificação de incertezas

Acelere o processo de investimento com os serviços AWS Low Code-No Code

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta