Amazon SageMaker JumpStart를 사용하여 고성능 이미지 분류 모델 구축

플라톤에 의해 재발행

팔로워 : 0

이미지 분류는 이미지를 분류할 수 있는 컴퓨터 비전 기반 기계 학습(ML) 기술입니다. 이미지 분류의 잘 알려진 몇 가지 예에는 손글씨 숫자 분류, 의료 이미지 분류 및 안면 인식이 포함됩니다. 이미지 분류는 여러 비즈니스 애플리케이션에서 유용한 기술이지만 좋은 이미지 분류 모델을 구축하는 것은 쉬운 일이 아닙니다.

ML 모델을 평가할 때 몇 가지 고려 사항이 역할을 할 수 있습니다. 모델 정확도 외에도 중요한 다른 잠재적 메트릭은 모델 훈련 시간과 추론 시간입니다. ML 모델 개발의 반복적 특성을 고려할 때 학습 시간이 빨라 데이터 과학자가 다양한 가설을 빠르게 테스트할 수 있습니다. 더 빠른 추론은 실시간 애플리케이션에서 중요할 수 있습니다.

Amazon SageMaker 점프스타트 일반적인 비즈니스 문제를 해결하는 다양한 종단 간 솔루션은 물론 인기 있는 ML 작업 전반에 걸쳐 사전 훈련된 다양한 모델의 클릭 한 번으로 미세 조정 및 배포를 제공합니다. 이러한 기능은 ML 프로세스의 각 단계에서 무거운 작업을 제거하여 고품질 모델을 더 쉽게 개발하고 배포 시간을 단축합니다. 점프스타트 API 자신의 데이터 세트에서 JumpStart 지원 사전 학습 모델의 방대한 선택을 프로그래밍 방식으로 배포하고 미세 조정할 수 있습니다.

배포 전에 JumpStart에서 제공하는 ML 모델을 증분식으로 교육하고 조정할 수 있습니다. 작성 시점에 JumpStart에서 87개의 딥 러닝 기반 이미지 분류 모델을 사용할 수 있습니다.

그러나 어떤 모델이 최상의 결과를 제공합니까? 이 게시물에서는 여러 모델을 쉽게 실행하고 모델 정확도, 교육 시간 및 추론 시간의 세 가지 관심 차원에서 출력을 비교하는 방법론을 제시합니다.

솔루션 개요

JumpStart를 사용하면 UI 또는 API를 사용하여 JumpStart 콘솔에서 모델을 교육, 조정 및 배포할 수 있습니다. 이번 포스팅에서는 API 루트를 이용하여 다양한 헬퍼 스크립트가 포함된 노트북을 제시합니다. 이 노트북을 실행하고 이러한 모델을 서로 쉽게 비교할 수 있는 결과를 얻은 다음 모델 정확도, 교육 시간 및 추론 시간 측면에서 비즈니스 요구에 가장 적합한 모델을 선택할 수 있습니다.

XNUMXD덴탈의 공개 데이터 세트 이 게시물에 사용된 약 55,000개의 병든 건강한 식물 잎의 이미지는 통제된 조건에서 수집되었으며 클래스 레이블은 0-38입니다. 이 데이터 세트는 훈련 및 검증 데이터 세트로 나뉘며 약 44,000개의 훈련 및 11,000개의 이미지가 검증 중입니다. 다음은 몇 가지 샘플 이미지입니다.

이 연습에서는 JumpStart에서 제공하는 두 가지 프레임워크(PyTorch 및 TensorFlow)에서 모델을 선택했습니다. 다음 15개 모델 알고리즘은 이러한 프레임워크에서 널리 사용되는 광범위한 신경망 아키텍처를 다룹니다.

pytorch-ic-alexnet-FT
pytorch-ic-densenet121-FT
pytorch-ic-densenet201-FT
pytorch-ic-googlenet-FT
pytorch-ic-mobilenet-v2-FT
pytorch-ic-resnet152-FT
pytorch-ic-resnet34-FT
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
tensorflow-ic-imagenet-inception-v3-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

우리는 모델을 사용합니다 tensorflow-ic-imagenet-inception-v3-classification-4-FT 다른 모델의 결과를 비교하는 기준으로 사용합니다. 이 기본 모델은 임의로 선택되었습니다.

이 비교를 실행하는 데 사용된 코드는 AWS 샘플 GitHub 리포지토리.

결과

이 섹션에서는 이러한 15개의 실행 결과를 제시합니다. 이 모든 실행에서 사용된 하이퍼파라미터는 epochs = 5, 학습률 = 0.001, 배치 크기 = 16이었습니다.

모델 정확도, 훈련 시간 및 모델로부터의 추론 시간 tensorflow-ic-imagenet-inception-v3-classification-4-FT 를 기본으로 하고 다른 모든 모델의 결과는 이 기본 모델과 관련하여 표시됩니다. 여기에서 우리의 의도는 어떤 모델이 최고인지 보여주는 것이 아니라 JumpStart API를 통해 다양한 모델의 결과를 비교한 다음 사용 사례에 가장 적합한 모델을 선택할 수 있는 방법을 보여주는 것입니다.

다음 스크린샷은 다른 모든 모델과 비교한 기본 모델을 강조 표시합니다.

다음 플롯은 상대 정확도 대 상대 교육 시간의 세부 보기를 보여줍니다. PyTorch 모델은 빨간색으로 색상 코드가 지정되고 TensorFlow 모델은 파란색으로 코드화됩니다.

이전 플롯에서 녹색 타원으로 강조 표시된 모델은 상대적 정확도와 낮은 상대적 교육 시간의 조합이 좋은 것으로 보입니다. 다음 표는 이 세 가지 모델에 대한 자세한 내용을 제공합니다.

모델 이름	상대 정확도	상대적 교육 시간
tensorflow-ic-imagenet-mobilenet-v2-050-224-분류-4-FT	1.01	0.74
tensorflow-ic-imagenet-mobilenet-v2-140-224-분류-4-FT	1.02	0.74
텐서플로우-ic-bit-s-r101x1-ilsvrc2012-분류-1-FT	1.04	1.16

다음 플롯은 상대 정확도와 상대 추론 시간을 비교합니다. PyTorch 모델은 빨간색으로 색상 코드가 지정되고 TensorFlow 모델은 파란색으로 코드화됩니다.

다음 표는 녹색 타원의 세 가지 모델에 대한 세부 정보를 제공합니다.

모델 이름	상대 정확도	상대 추론 시간
tensorflow-ic-imagenet-mobilenet-v2-050-224-분류-4-FT	1.01	0.94
tensorflow-ic-imagenet-mobilenet-v2-140-224-분류-4-FT	1.02	0.90
텐서플로우-ic-bit-s-r101x1-ilsvrc2012-분류-1-FT	1.04	1.43

두 플롯은 선택된 세 가지 차원에서 특정 모델 알고리즘이 다른 알고리즘보다 더 잘 수행되었음을 분명히 보여줍니다. 이 연습을 통해 제공되는 유연성은 올바른 알고리즘을 선택하는 데 도움이 될 수 있으며 제공된 노트북을 사용하여 87개의 사용 가능한 모델에서 이러한 유형의 실험을 쉽게 실행할 수 있습니다.

결론

이 게시물에서는 JumpStart를 사용하여 모델 정확도, 교육 시간 및 추론 대기 시간과 같은 관심 있는 여러 차원에서 고성능 이미지 분류 모델을 구축하는 방법을 보여주었습니다. 또한 자체 데이터 세트에서 이 연습을 실행할 수 있는 코드도 제공했습니다. 현재 JumpStart 모델 허브에서 이미지 분류에 사용할 수 있는 87개 모델 중에서 원하는 모델을 선택할 수 있습니다. 오늘 시도해 보시기 바랍니다.

JumpStart에 대한 자세한 내용은 다음을 참조하십시오. 세이지메이커 점프스타트.

저자에 관하여

라주 펜마차 박사 AWS AI 플랫폼 분야의 AI/ML 전문가 솔루션 아키텍트입니다. 스탠포드 대학에서 박사 학위를 받았습니다. 그는 고객이 기계 학습 모델 및 솔루션을 쉽게 구축하고 배포할 수 있도록 지원하는 SageMaker의 로우/노코드 서비스 제품군에 대해 긴밀히 협력하고 있습니다. 고객을 돕지 않을 때는 새로운 곳으로 여행하는 것을 좋아합니다.

Ashish Khetan 박사 Amazon SageMaker 내장 알고리즘을 사용하는 수석 응용 과학자이며 기계 학습 알고리즘 개발을 돕습니다. 그는 University of Illinois Urbana-Champaign에서 박사 학위를 받았습니다. 그는 기계 학습 및 통계적 추론 분야에서 활동적인 연구원이며 NeurIPS, ICML, ICLR, JMLR, ACL 및 EMNLP 컨퍼런스에서 많은 논문을 발표했습니다.

타임 스탬프 : 2022 년 11 월 17 일2022 년 11 월 21 일

타임 스탬프 : 11월 16, 2022

Amazon SageMaker JumpStart를 사용하여 고성능 이미지 분류 모델 구축

플라톤에 의해 재발행

솔루션 개요

결과

결론

저자에 관하여

더보기 AWS 기계 학습

AWS Inferentia 및 AWS Trainium을 사용하여 Amazon SageMaker JumpStart에서 Llama 2 모델을 비용 효율적으로 미세 조정하고 배포 | 아마존 웹 서비스

LoRA를 사용하여 Amazon SageMaker에서 Whisper 모델을 미세 조정 | 아마존 웹 서비스

AWS를 사용하는 Amazon 타사 판매자를 위한 AI/ML 기반 실행 가능한 통찰력 및 테마

Amazon SageMaker Studio 및 Amazon SageMaker Autopilot을 사용하여 위성 이미지 기능을 사용하여 맹그로브 숲 식별 – 1부

Amazon SageMaker 자동 모델 조정은 이제 SageMaker 교육 인스턴스 폴백을 지원합니다.

원클릭 Kubeflow on AWS 배포로 Amazon EKS 및 Amazon SageMaker에서 하이브리드 ML 워크플로 활성화

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정