Comience con la distribución de código abierto de Amazon SageMaker

Reeditado por Platón

seguidores: 0

Los científicos de datos necesitan un entorno consistente y reproducible para el aprendizaje automático (ML) y las cargas de trabajo de ciencia de datos que permita administrar las dependencias y sea seguro. Contenedores de aprendizaje profundo de AWS ya proporciona imágenes de Docker preconstruidas para entrenar y servir modelos en marcos comunes como TensorFlow, PyTorch y MXNet. Para mejorar esta experiencia, anunciamos una versión beta pública de la distribución de código abierto de SageMaker en la JupyterCon de 2023. Esto proporciona una experiencia de ML unificada de extremo a extremo entre los desarrolladores de ML de diferentes niveles de experiencia. Los desarrolladores ya no necesitan cambiar entre diferentes contenedores de marco para la experimentación, o cuando pasan de entornos locales de JupyterLab y cuadernos de SageMaker a trabajos de producción en SageMaker. La distribución de SageMaker de código abierto es compatible con los paquetes y bibliotecas más comunes para ciencia de datos, aprendizaje automático y visualización, como TensorFlow, PyTorch, Scikit-learn, Pandas y Matplotlib. Puede empezar a utilizar el contenedor desde el Galería pública de Amazon ECR empezando hoy.

En esta publicación, le mostramos cómo puede usar la distribución de código abierto de SageMaker para experimentar rápidamente en su entorno local y promocionarlos fácilmente a puestos de trabajo en SageMaker.

Resumen de la solución

Para nuestro ejemplo, mostramos el entrenamiento de un modelo de clasificación de imágenes usando PyTorch. usamos el KMNIST conjunto de datos disponible públicamente en PyTorch. Entrenamos un modelo de red neuronal, probamos el rendimiento del modelo y finalmente imprimimos el entrenamiento y la pérdida de prueba. El cuaderno completo para este ejemplo está disponible en el Repositorio de ejemplos de SageMaker Studio Lab. Comenzamos la experimentación en una computadora portátil local utilizando la distribución de código abierto, la movemos a Estudio Amazon SageMaker para usar una instancia más grande y luego programe el cuaderno como un trabajo de cuaderno.

Requisitos previos

Necesita los siguientes requisitos previos:

Configura tu entorno local

Puede comenzar a usar directamente la distribución de código abierto en su computadora portátil local. Para iniciar JupyterLab, ejecute los siguientes comandos en su terminal:

export ECR_IMAGE_ID='public.ecr.aws/sagemaker/sagemaker-distribution:latest-cpu'
docker run -it -p 8888:8888 --user `id -u`:`id -g` -v `pwd`/sample-notebooks:/home/sagemaker-user/sample-notebooks $ECR_IMAGE_ID jupyter-lab --no-browser --ip=0.0.0.0

Puedes reemplazar ECR_IMAGE_ID con cualquiera de las etiquetas de imagen disponibles en el Galería pública de Amazon ECR, o elige el latest-gpu etiqueta si está utilizando una máquina compatible con GPU.

Este comando iniciará JupyterLab y proporcionará una URL en el terminal, como http://127.0.0.1:8888/lab?token=<token>. Copie el enlace e ingréselo en su navegador preferido para iniciar JupyterLab.

Configurar estudio

Studio es un entorno de desarrollo integrado (IDE) de extremo a extremo para ML que permite a los desarrolladores y científicos de datos crear, entrenar, implementar y monitorear modelos de ML a escala. Studio proporciona una extensa lista de imágenes propias con marcos y paquetes comunes, como Data Science, TensorFlow, PyTorch y Spark. Estas imágenes facilitan que los científicos de datos comiencen con ML simplemente eligiendo un marco y un tipo de instancia de su elección para el cómputo.

Ahora puede usar la distribución de código abierto de SageMaker en Studio usando Studio's trae tu propia imagen característica. Para agregar la distribución de código abierto a su dominio de SageMaker, complete los siguientes pasos:

Agregue la distribución de código abierto a su cuenta Registro de contenedores elásticos de Amazon (Amazon ECR) ejecutando los siguientes comandos en su terminal:

# Use the latest-cpu or latest-gpu tag based on your requirements
export ECR_GALLERY_IMAGE_ID='sagemaker-distribution:latest-cpu'
export SAGEMAKER_IMAGE_NAME='sagemaker-runtime'
export SAGEMAKER_STUDIO_DOMAIN_ID='d-xxxx'
export SAGEMAKER_STUDIO_IAM_ROLE_ARN='<studio-default-execution-role-arn>' docker pull public.ecr.aws/sagemaker/$ECR_GALLERY_IMAGE_ID export ECR_PRIVATE_REPOSITORY_NAME='sm-distribution'
export ECR_IMAGE_TAG='sagemaker-runtime-cpu'
export AWS_ACCOUNT_ID='0123456789'
export AWS_ECR_REPOSITORY_REGION='us-east-1' # create repository
aws --region ${AWS_ECR_REPOSITORY_REGION} ecr create-repository --repository-name $ECR_PRIVATE_REPOSITORY_NAME
aws --region ${AWS_ECR_REPOSITORY_REGION} ecr get-login-password | docker login --username AWS --password-stdin ${AWS_ACCOUNT_ID}.dkr.ecr.${AWS_ECR_REPOSITORY_REGION}.amazonaws.com
export ECR_IMAGE_URI=$AWS_ACCOUNT_ID.dkr.ecr.$AWS_ECR_REPOSITORY_REGION.amazonaws.com/$ECR_PRIVATE_REPOSITORY_NAME:$ECR_IMAGE_TAG # Tag
docker tag public.ecr.aws/sagemaker/$ECR_GALLERY_IMAGE_ID $ECR_IMAGE_URI
# Push the image to your private repository
docker push $ECR_IMAGE_URI

Cree una imagen de SageMaker y adjunte la imagen al dominio de Studio:

# Create a SageMaker image
aws sagemaker create-image --image-name $SAGEMAKER_IMAGE_NAME --role-arn $SAGEMAKER_STUDIO_IAM_ROLE_ARN
# Create a SageMaker Image Version.
aws sagemaker create-image-version --image-name $SAGEMAKER_IMAGE_NAME --base-image $ECR_IMAGE_URI # Optionally, describe the image version to ensure it's succesfully created
aws sagemaker describe-image-version --image-name $SAGEMAKER_IMAGE_NAME --version-number 1 # Create the app image configuration file
cat > /tmp/app-config.json << EOF
{ "AppImageConfigName": "app-image-config-$SAGEMAKER_IMAGE_NAME", "KernelGatewayImageConfig": { "FileSystemConfig": { "DefaultGid": 100, "DefaultUid": 1000, "MountPath": "/home/sagemaker-user" }, "KernelSpecs": [ { "DisplayName": "Python 3 (ipykernel)", "Name": "python3" } ] }
}
EOF # Create an Amazon SageMaker App Image Config.
aws sagemaker create-app-image-config --cli-input-json file:///tmp/app-config.json # Create a default user settings file
# Update the file with your existing settings if you have additional custom images
cat > /tmp/default-user-settings.json << EOF
{ "DefaultUserSettings": { "KernelGatewayAppSettings": { "CustomImages": [ { "ImageName": "$SAGEMAKER_IMAGE_NAME", "AppImageConfigName": "app-image-config-$SAGEMAKER_IMAGE_NAME", "ImageVersionNumber": 1 } ] } }
}
EOF # Update Amazon SageMaker Domain with the new default User Settings.
aws sagemaker update-domain --domain-id $SAGEMAKER_STUDIO_DOMAIN_ID --cli-input-json file:///tmp/default-user-settings.json

En la consola de SageMaker, inicie Studio eligiendo su dominio y perfil de usuario existente.
Opcionalmente, reinicie Studio siguiendo los pasos en Apague y actualice SageMaker Studio.

detalles del dominio

Descarga el cuaderno

Descargue el cuaderno de muestra localmente desde el Repositorio GitHub.

Abra la computadora portátil en el IDE de su elección y agregue una celda al comienzo de la computadora portátil para instalar torchsummary. torchsummary El paquete no es parte de la distribución, e instalarlo en la computadora portátil asegurará que la computadora portátil se ejecute de principio a fin. Recomendamos usar conda or micromamba para gestionar entornos y dependencias. Agregue la siguiente celda al cuaderno y guarde el cuaderno:

%pip install torchsummary

Experimento en el cuaderno local

Cargue el cuaderno en la interfaz de usuario de JupyterLab que inició eligiendo el ícono de carga como se muestra en la siguiente captura de pantalla.

cargando archivo

Cuando esté cargado, inicie el cv-kmnist.ipynb computadora portátil. Puede comenzar a ejecutar las celdas de inmediato, sin tener que instalar dependencias como torch, matplotlib o ipywidgets.

Si siguió los pasos anteriores, puede ver que puede usar la distribución localmente desde su computadora portátil. En el siguiente paso, usamos la misma distribución en Studio para aprovechar las funciones de Studio.

Mover la experimentación a Studio (opcional)

Opcionalmente, promovamos la experimentación a Studio. Una de las ventajas de Studio es que los recursos informáticos subyacentes son totalmente elásticos, por lo que puede aumentar o disminuir fácilmente los recursos disponibles y los cambios se realizan automáticamente en segundo plano sin interrumpir su trabajo. Si desea ejecutar el mismo cuaderno anterior en un conjunto de datos y una instancia informática más grandes, puede migrar a Studio.

Navegue a la interfaz de usuario de Studio que lanzó anteriormente y elija el icono de carga para cargar el cuaderno.

cargar-archivo-estudio

Después de iniciar el cuaderno, se le pedirá que elija la imagen y el tipo de instancia. En el iniciador del kernel, elija sagemaker-runtime como la imagen y un ml.t3.medium instancia, luego elija Seleccione.

elegir-imagen-estudio

¡Ahora puede ejecutar el cuaderno de principio a fin sin necesidad de realizar ningún cambio en el cuaderno desde su entorno de desarrollo local a los cuadernos de Studio!

Programar el cuaderno como un trabajo

Cuando haya terminado con su experimentación, SageMaker ofrece múltiples opciones para poner en producción su computadora portátil, como trabajos de capacitación y canalizaciones de SageMaker. Una de estas opciones es ejecutar directamente el propio cuaderno como un trabajo de cuaderno programado no interactivo mediante Trabajos de bloc de notas de SageMaker. Por ejemplo, es posible que desee volver a entrenar su modelo periódicamente u obtener inferencias sobre los datos entrantes periódicamente y generar informes para el consumo de sus partes interesadas.

En Studio, elija el icono del trabajo del cuaderno para iniciar el trabajo del cuaderno. Si ha instalado la extensión de trabajos de la computadora portátil localmente en su computadora portátil, también puede programar la computadora portátil directamente desde su computadora portátil. Ver Guía de instalación para configurar la extensión de trabajos del cuaderno localmente.

horario-cuaderno-trabajo-icono

El trabajo del cuaderno usa automáticamente el URI de la imagen ECR de la distribución de código abierto, por lo que puede programar directamente el trabajo del cuaderno.

elegir-imagen-nb-trabajo

Elige Ejecutar según lo programado, elija un horario, por ejemplo cada semana el sábado, y elija Crear. También puedes elegir Corre ahora si desea ver los resultados inmediatamente.

enviar-nb-trabajo

Cuando se completa el primer trabajo del cuaderno, puede ver los resultados del cuaderno directamente desde la interfaz de usuario de Studio eligiendo Notebook bajo Archivos de salida.

ver-trabajo-resultado

Consideraciones adicionales

Además de usar la imagen de ECR disponible públicamente directamente para las cargas de trabajo de ML, la distribución de código abierto ofrece las siguientes ventajas:

El Dockerfile utilizado para crear la imagen está disponible públicamente para que los desarrolladores exploren y creen sus propias imágenes. También puede heredar esta imagen como imagen base e instalar sus bibliotecas personalizadas para tener un entorno reproducible.
Si no está acostumbrado a Docker y prefiere usar entornos Conda en su entorno JupyterLab, le proporcionamos un env.out archivo para cada una de las versiones publicadas. Puede utilizar las instrucciones del archivo para crear su propio entorno Conda que imite el mismo entorno. Por ejemplo, consulte el archivo de entorno de la CPU cpu.env.fuera.
Puede usar las versiones de GPU de la imagen para ejecutar cargas de trabajo compatibles con GPU, como aprendizaje profundo y procesamiento de imágenes.

Limpiar

Complete los siguientes pasos para limpiar sus recursos:

Si ha programado su computadora portátil para que se ejecute según un horario, pause o elimine el horario en el Definiciones de trabajo del cuaderno ficha para evitar pagar por futuros trabajos.
Cierre todas las aplicaciones de Studio para evitar pagar por el uso informático no utilizado. Ver Cierre y actualice las aplicaciones de Studio para obtener instrucciones.
Opcionalmente, elimine el dominio de Studio si creó uno.

Conclusión

Mantener un entorno reproducible en las diferentes etapas del ciclo de vida de ML es uno de los mayores desafíos para los científicos y desarrolladores de datos. Con la distribución de código abierto de SageMaker, proporcionamos una imagen con versiones mutuamente compatibles de los marcos y paquetes de ML más comunes. La distribución también es de código abierto, lo que brinda a los desarrolladores transparencia en los paquetes y procesos de compilación, lo que facilita la personalización de su propia distribución.

En esta publicación, le mostramos cómo usar la distribución en su entorno local, en Studio y como contenedor para sus trabajos de capacitación. Esta función se encuentra actualmente en versión beta pública. Lo alentamos a que pruebe esto y comparta sus comentarios y problemas en el repositorio público de GitHub!

Sobre los autores

Durga Sury es Arquitecto de soluciones de aprendizaje automático en el equipo de Amazon SageMaker Service SA. Le apasiona hacer que el aprendizaje automático sea accesible para todos. En sus 4 años en AWS, ayudó a configurar plataformas de IA/ML para clientes empresariales. Cuando no está trabajando, le encantan los paseos en moto, las novelas de misterio y las largas caminatas con su husky de 5 años.

Ketan Vijayvargiya es ingeniero sénior de desarrollo de software en Amazon Web Services (AWS). Sus áreas de enfoque son el aprendizaje automático, los sistemas distribuidos y el código abierto. Fuera del trabajo, le gusta pasar su tiempo viviendo solo y disfrutando de la naturaleza.

Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
EVM Finanzas. Interfaz unificada para finanzas descentralizadas. Accede Aquí.
Grupo de medios cuánticos. IR/PR amplificado. Accede Aquí.
PlatoAiStream. Inteligencia de datos Web3. Conocimiento amplificado. Accede Aquí.
Fuente: https://aws.amazon.com/blogs/machine-learning/get-started-with-the-open-source-amazon-sagemaker-distribution/

Sello de tiempo: Sábado, Junio 8, 2023

Sello de tiempo: Nov 29, 2023

Reeditado por Platón

Logre un rendimiento de inferencia de ML cuatro veces mayor a un costo por inferencia tres veces menor con instancias Amazon EC2 G5 para modelos NLP y CV PyTorch

Alojar servidor de código en Amazon SageMaker

Procesamiento inteligente de documentos con servicios de IA de AWS: Parte 1

Utilice Amazon SageMaker Data Wrangler en Amazon SageMaker Studio con una configuración de ciclo de vida predeterminada

Sobre Nosotros

Búsqueda vertical y Ai

Productos

Manténganse Conectados

Mi Cuenta