Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함.

Amazon SageMaker JumpStart 솔루션에서 기계 학습을 통해 비즈니스 문제를 엔드 투 엔드로 해결

Amazon SageMaker 점프스타트 머신 러닝(ML)을 시작하는 데 도움이 되도록 다양한 문제 유형에 대해 사전 훈련된 오픈 소스 모델을 제공합니다. 또한 JumpStart는 일반적인 사용 사례를 위한 인프라를 설정하는 솔루션 템플릿과 ML용 실행 가능한 예제 노트북을 제공합니다. 아마존 세이지 메이커.

비즈니스 사용자는 JumpStart 솔루션으로 다음을 수행할 수 있습니다.

  • 솔루션을 탐색하고 비즈니스 요구 사항에 적합한 솔루션을 평가하십시오.
  • 클릭 한 번으로 솔루션 실행 아마존 세이지 메이커 스튜디오. 이것은 시작 AWS 클라우드 포메이션 템플릿을 사용하여 필요한 리소스를 생성합니다.
  • 기본 노트북 및 모델 자산에 액세스하여 요구 사항에 맞게 솔루션을 수정하십시오.
  • 획득한 리소스는 완료되면 삭제합니다.

이 게시물은 23가지 비즈니스 과제를 해결하기 위해 최근에 추가된 XNUMX가지 ML 솔루션에 중점을 둡니다. 이 글을 쓰는 시점에서 JumpStart는 금융 거래의 사기 탐지에서 필기 인식에 이르기까지 다양한 XNUMX가지 비즈니스 솔루션을 제공합니다. JumpStart를 통해 제공되는 솔루션의 수는 더 많은 솔루션이 추가됨에 따라 정기적으로 증가합니다.

솔루션 개요

XNUMX가지 새로운 솔루션은 다음과 같습니다.

  • 가격 최적화 – 수익, 이익 또는 기타 사용자 지정 지표 극대화와 같은 비즈니스 목표를 달성하기 위해 제품 또는 서비스 가격을 설정하기 위한 최적의 결정을 내리는 데 도움이 되는 사용자 지정 가능한 ML 모델을 제공합니다.
  • 조류 종 예측 – 객체 감지 모델을 훈련하고 미세 조정할 수 있는 방법을 보여줍니다. 훈련 이미지 증대를 통한 모델 튜닝을 보여주고 훈련 작업의 반복(에포크)에서 발생하는 정확도 향상을 차트로 표시합니다.
  • 폐암 생존 예측 – 2D 및 3D 방사성 특징과 환자 인구 통계를 ML 알고리즘에 제공하여 환자의 폐암 생존 가능성을 예측하는 방법을 보여줍니다. 이 예측의 결과는 공급자가 적절한 사전 조치를 취하는 데 도움이 될 수 있습니다.
  • 금융결제 구분 – 거래 정보를 기반으로 금융 거래를 분류하기 위해 ML 모델을 교육하고 배포하는 방법을 보여줍니다. 사기 탐지, 개인화 또는 이상 탐지의 중간 단계로 이 솔루션을 사용할 수도 있습니다.
  • 휴대폰 고객을 위한 이탈 예측 – 모바일 통화 트랜잭션 데이터 세트를 사용하여 이탈 예측 모델을 빠르게 개발하는 방법을 보여줍니다. 이것은 ML을 처음 접하는 사용자를 위한 간단한 예입니다.

사전 조건

이러한 솔루션을 사용하려면 SageMaker 기능을 실행할 수 있는 실행 역할로 Studio에 액세스할 수 있는지 확인하십시오. Studio 내 사용자 역할의 경우 다음을 확인하십시오. SageMaker 프로젝트 및 JumpStart 옵션이 켜져 있습니다.

다음 섹션에서는 XNUMX가지 새로운 솔루션 각각을 살펴보고 어떻게 작동하는지 자세히 논의하고 비즈니스 요구 사항에 사용할 수 있는 방법에 대한 몇 가지 권장 사항을 설명합니다.

가격 최적화

기업은 최상의 결과를 얻기 위해 다양한 수단을 사용하는 것을 좋아합니다. 예를 들어, 제품이나 서비스의 가격은 기업이 통제할 수 있는 지렛대입니다. 문제는 이익이나 수익과 같은 비즈니스 목표를 극대화하기 위해 제품이나 서비스를 설정할 가격을 결정하는 방법입니다.

이 솔루션은 사용자 지정 가능한 ML 모델을 제공하여 수익, 이익 또는 기타 사용자 지정 지표 극대화와 같은 목표를 달성하기 위해 제품 또는 서비스 가격을 설정하기 위한 최적의 결정을 내리는 데 도움을 줍니다. 이 솔루션은 ML 및 인과 추론 접근 방식을 사용하여 과거 데이터에서 가격-거래량 관계를 학습하고 실시간으로 동적 가격 권장 사항을 만들어 사용자 지정 목표 메트릭을 최적화할 수 있습니다.

다음 스크린샷은 샘플 입력 데이터를 보여줍니다.

솔루션에는 세 부분이 포함됩니다.

  • 가격탄력성 추정 – 이중 ML 알고리즘을 통한 인과 추론으로 추정
  • 볼륨 예측 – 이것은 Prophet 알고리즘을 사용하여 예측됩니다.
  • 가격 최적화 – 이는 다양한 가격 시나리오를 통한 가정 시뮬레이션으로 달성됩니다.

솔루션은 수익 극대화를 위해 다음날 권장 가격을 제공합니다. 또한, 산출물에는 가격이 거래량에 미치는 영향을 나타내는 값인 추정 가격탄력성과 익일 거래량을 예측할 수 있는 예측 모델이 포함됩니다. 다음 차트는 시계열 데이터를 사용하여 볼륨을 예측하기 위해 Prophet을 사용하는 예측 모델보다 계산된 가격 탄력성을 통합한 인과 모델이 가정 분석(행동 가격과 큰 편차 포함)에서 어떻게 훨씬 더 잘 수행되는지 보여줍니다.

Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함.

다음 사용 사례에 대해 이 솔루션을 비즈니스에 적용할 수 있습니다.

  • 소매점을 위한 최적의 상품 가격 결정
  • 할인쿠폰이 고객 구매에 미치는 영향 추정
  • 모든 비즈니스에서 다양한 인센티브 방법의 효과 예측

조류 종 예측

오늘날 기업을 위한 몇 가지 컴퓨터 비전(CV) 애플리케이션이 있습니다. 이러한 응용 프로그램 중 하나는 ML 알고리즘이 주변에 경계 상자를 그려 이미지에서 개체의 위치를 ​​감지하고 개체 유형을 식별하는 개체 감지입니다. 개체 감지 모델을 적용하고 미세 조정하는 방법을 배우는 것은 CV가 필요한 조직에 큰 가치가 될 수 있습니다.

이 솔루션은 SageMaker 알고리즘에 이미지를 제공할 때 경계 상자 사양을 변환하는 방법의 예를 제공합니다. 이 솔루션은 또한 수평으로 뒤집힌 훈련 이미지(거울 이미지)를 추가하여 객체 감지 모델을 개선하는 방법을 보여줍니다.

많은 수의 클래스(200종 조류)가 있는 경우 개체 감지 문제를 실험할 수 있는 노트북이 제공됩니다. 노트북은 또한 훈련 작업의 에포크 전체에 걸쳐 발생하는 정확도 향상을 차트로 표시하는 방법을 보여줍니다. 다음 이미지는 새 데이터 세트의 예시 이미지를 보여줍니다.

Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함.

이 솔루션에는 XNUMX단계가 포함됩니다.

  1. 다운로드 및 RecordIO 파일 생성.
  2. 객체 감지 모델을 만들고 학습합니다.
  3. 엔드포인트를 배포하고 모델 성능을 평가합니다.
  4. 확장된 데이터 세트를 사용하여 객체 감지 모델을 다시 만들고 학습합니다.
  5. 엔드포인트를 배포하고 확장된 모델 성능을 평가합니다.

출력으로 다음을 얻습니다.

  • 테스트 이미지에 대한 본딩 박스를 사용한 물체 감지 결과
  • 훈련된 객체 감지 모델
  • 추가 확장(뒤집힌) 데이터 세트가 있는 훈련된 객체 감지 모델
  • 각 모델 중 하나와 함께 배포된 두 개의 개별 엔드포인트

다음 차트는 훈련 중 모델 반복(에포크)에 대한 모델 개선을 보여줍니다.

Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함.

다음 예는 두 개의 테스트 이미지에서 출력됩니다.

Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함.

Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함.

다음 사용 사례에 대해 이 솔루션을 비즈니스에 적용할 수 있습니다.

  • 포장 산업에서 컨베이어 벨트의 물체 감지
  • 피자의 토핑 감지
  • 객체 감지와 관련된 공급망 운영 애플리케이션 구현

폐암 생존 예측

COVID-19는 폐와 관련된 의학적 문제에 더 많은 관심을 가져왔습니다. 또한 병원, 의사, 간호사 및 방사선 전문의에게도 많은 압력을 가했습니다. 의료 종사자를 지원하고 작업 속도를 높이는 데 도움이 되는 강력한 도구로 ML을 적용할 수 있는 가능성을 상상해 보십시오. 이 솔루션에서 우리는 2D 및 3D 방사선 특징과 환자 인구 통계를 ML 알고리즘에 제공하여 환자의 폐암 생존 가능성을 예측하는 방법을 보여줍니다. 이 예측의 결과는 공급자가 적절한 사전 조치를 취하는 데 도움이 될 수 있습니다.

이 솔루션은 RNA 시퀀싱 데이터, 임상 데이터(EHR 데이터 반영) 및 의료 이미지로 구성된 비소세포폐암(NSCLC) 방사선유전체학 데이터세트를 위한 확장 가능한 ML 파이프라인을 구축하는 방법을 보여줍니다. 여러 유형의 데이터를 사용하여 기계 모델을 만드는 것을 멀티 모달 ML. 이 솔루션은 비소세포폐암 진단을 받은 환자의 생존 결과를 예측합니다.

다음 이미지는 NSCLC(Non-Small Cell Lung Cancer) Radiogenomics 데이터 세트의 입력 데이터 예를 보여줍니다.

Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함.

솔루션의 일부로 전체 RNA를 종양 조직에서 추출하고 RNA 시퀀싱 기술로 분석했습니다. 원래 데이터에는 22,000개 이상의 유전자가 포함되어 있지만, 공개적으로 이용 가능한 유전자 발현 코호트에서 확인되고 검증되었으며 예후와 상관관계가 있는 21개의 고도로 동시 발현된 유전자 클러스터(메타유전자)에서 10개의 유전자를 유지합니다.

임상 기록은 CSV 형식으로 저장됩니다. 각 행은 환자에 해당하고 열에는 인구 통계, 종양 병기 및 생존 상태를 포함하여 환자에 대한 정보가 포함됩니다.

게놈 데이터의 경우 공개적으로 사용 가능한 유전자 발현 코호트에서 확인되고 검증되었으며 예후와 상관 관계가 있는 21개의 고도로 동시 발현된 유전자 클러스터(메타유전자)에서 10개의 유전자를 유지합니다.

의료 영상 데이터의 경우 CT 스캔에서 관찰된 종양의 크기, 모양 및 시각적 속성을 설명하는 환자 수준의 3D 방사선 특징을 만듭니다. 각 환자 연구에 대해 다음 단계가 수행됩니다.

  1. CT 스캔 및 종양 분할 모두에 대한 2D DICOM 슬라이스 파일을 읽고 3D 볼륨으로 결합하고 볼륨을 NIfTI 형식으로 저장합니다.
  2. CT 볼륨과 종양 분할을 정렬하여 종양 내부의 계산에 집중할 수 있습니다.
  3. 피라미드형 라이브러리를 사용하여 종양 영역을 설명하는 방사성 특징을 계산합니다.
  4. 관심 있는 종양 영역 내 강도의 분포 및 동시 발생에 대한 통계적 표현, 종양을 형태학적으로 설명하는 모양 기반 측정과 같은 120개 클래스의 XNUMX개의 방사성 특징을 추출합니다.

모델 훈련을 위한 환자의 다중 모드 보기를 생성하기 위해 세 가지 모드의 특징 벡터를 결합합니다. 그런 다음 데이터를 처리합니다. 먼저 기능 스케일링을 사용하여 독립 기능의 범위를 정규화합니다. 그런 다음 특성에 대한 주성분 분석(PCA)을 수행하여 차원을 줄이고 데이터의 95% 분산에 기여하는 가장 구별되는 특성을 식별합니다.

결과적으로 215개 기능에서 지도 학습자의 기능을 구성하는 45개 주요 구성 요소로 차원이 감소합니다.

이 솔루션은 NSCLC 환자의 생존 상태(사망 또는 생존)를 확률 형태로 예측하는 ML 모델을 생성합니다. 모델 및 예측 외에도 모델을 설명하는 보고서도 생성합니다. 의료 영상 파이프라인은 시각화 목적으로 3D 폐 CT 볼륨 및 종양 세분화를 생성합니다.

이 솔루션을 의료 및 생명 과학 사용 사례에 적용할 수 있습니다.

금융결제 구분

기업이나 소비자의 모든 금융 거래를 가져와 다양한 범주로 정리하는 것은 꽤 도움이 될 수 있습니다. 사용자가 어느 카테고리에서 얼마를 지출했는지 알 수 있고, 특정 카테고리에서 거래나 지출이 예기치 않게 오르거나 내릴 때 경고를 표시할 수도 있습니다.

이 솔루션은 ML 모델을 훈련하고 배포하여 거래 정보를 기반으로 금융 거래를 분류하는 방법을 보여줍니다. 많은 은행에서 최종 사용자에게 지출 습관에 대한 개요를 제공하는 서비스로 이를 제공합니다. 사기 탐지, 개인화 또는 이상 탐지의 중간 단계로 이 솔루션을 사용할 수도 있습니다. SageMaker를 사용하여 필요한 기본 인프라로 XGBoost 모델을 교육하고 배포합니다.

이 솔루션을 시연할 합성 데이터 세트에는 다음과 같은 기능이 있습니다.

  • 거래_범주 – 다음 19개 옵션 중 트랜잭션 범주: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, HomePension and insurances.
  • 수신기_id – 수신 당사자의 식별자입니다. 식별자는 16개의 숫자로 구성됩니다.
  • 발신인 아이디 – 보내는 당사자의 식별자입니다. 식별자는 16개의 숫자로 구성됩니다.
  • – 이체되는 금액.
  • 따라서 오른쪽 하단에 – YYYY-MM-DD HH:MM:SS 형식의 트랜잭션 타임스탬프입니다.

데이터 세트의 처음 XNUMX개 관찰은 다음과 같습니다.

Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함.

이 솔루션을 위해 우리는 그라디언트 부스트 트리 알고리즘의 대중적이고 효율적인 오픈 소스 구현인 XGBoost를 사용합니다. 그라디언트 부스팅은 더 단순하고 약한 모델 세트에서 추정의 앙상블을 결합하여 대상 변수를 정확하게 예측하려고 시도하는 지도 학습 알고리즘입니다. 구현은 SageMaker 내장 알고리즘에서 사용할 수 있습니다.

금융 지불 분류 솔루션에는 XNUMX단계가 포함됩니다.

  1. 데이터를 준비하십시오.
  2. 기능 저장소를 구축하십시오.
  3. XGBoost 모델을 만들고 훈련시킵니다.
  4. 엔드포인트를 배포하고 모델 성능을 평가합니다.

다음 출력을 얻습니다.

  • 예제 데이터 세트를 기반으로 하는 훈련된 XGBoost 모델
  • 트랜잭션 범주를 예측할 수 있는 SageMaker 끝점

이 솔루션을 실행하면 다음과 유사한 분류 보고서가 표시됩니다.

Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함.

귀하의 비즈니스에 가능한 응용 프로그램은 다음과 같습니다.

  • 소매 및 투자 은행의 다양한 금융 애플리케이션
  • 거래를 어떤 사용 사례로 분류해야 하는 경우(단순한 금융이 아님)

휴대폰 고객을 위한 이탈 예측

고객 이탈을 예측하는 것은 매우 일반적인 비즈니스 요구 사항입니다. 수많은 연구에 따르면 기존 고객을 유지하는 비용이 새로운 고객을 확보하는 것보다 훨씬 적습니다. 고객이 이탈하는 이유를 이해하는 데 어려움을 겪거나 이탈을 예측하는 모델을 구축하는 데 어려움을 겪는 기업에서 종종 문제가 발생합니다.

이 예에서 ML을 처음 사용하는 사용자는 모바일 통화 트랜잭션 데이터 세트를 사용하여 이탈 예측 모델을 빠르게 개발할 수 있는 방법을 경험할 수 있습니다. 이 솔루션은 SageMaker를 사용하여 고객 프로필 데이터 세트에서 XGBoost 모델을 교육하고 배포하여 고객이 이동 전화 사업자를 떠날 가능성이 있는지 여부를 예측합니다.

이 솔루션이 사용하는 데이터 세트는 공개적으로 사용 가능하며 Daniel T. Larose의 Discovering Knowledge in Data 책에 언급되어 있습니다. 저자는 University of California Irvine Repository of Machine Learning Datasets에 귀속했습니다.

이 데이터 세트는 다음 21개 속성을 사용하여 알 수 없는 미국 이동통신사의 고객 프로필을 설명합니다.

  • 주: 고객이 거주하는 미국 주(두 글자 약어로 표시됨). 예: OH 또는 NJ
  • 계정 길이: 이 계정이 활성화된 일수
  • 지역번호 : 해당 고객 전화번호의 XNUMX자리 지역번호
  • 전화번호 : 나머지 XNUMX자리 전화번호
  • 국제 요금제: 고객이 국제 전화 요금제를 가지고 있는지 여부: 예/아니요
  • VMail 계획: 고객에게 음성 메일 기능이 있는지 여부: 예/아니요
  • VMail 메시지: 월 평균 음성 메일 메시지 수
  • Day Mins: 하루 동안 사용한 총 통화 시간(분)
  • Day Calls: 하루 동안 걸려온 총 통화 수
  • 주간 요금: 주간 통화의 청구 비용
  • Eve Mins, Eve Calls, Eve Charge: 저녁 시간에 걸려온 전화에 대한 청구 비용
  • 야간 통화, 야간 통화, 야간 요금: 야간 통화에 대한 청구 비용
  • 국제 통화(Intl Mins), 국제 통화(Intl Calls), 국제 요금(Intl Charge): 국제 전화 요금
  • CustServ 통화: 고객 서비스에 걸려온 통화 수
  • Churn?: 고객이 서비스를 떠났는지 여부: true/false

이 솔루션에는 세 단계가 포함됩니다.

  1. 데이터를 준비하십시오.
  2. XGBoost 모델을 만들고 훈련시킵니다.
  3. 엔드포인트를 배포하고 모델 성능을 평가합니다.

다음 출력을 얻습니다.

  • 사용자 이탈을 예측하기 위해 예제 데이터 세트를 기반으로 하는 훈련된 XGBoost 모델
  • 사용자 이탈을 예측할 수 있는 SageMaker 엔드포인트

이 모델은 5,000명의 휴대전화 고객 중 얼마나 많은 사람들이 현재 휴대전화 사업자의 사용을 중단할 것인지 추정하는 데 도움이 됩니다.

다음 차트는 모델의 출력으로 이탈 확률 분포를 보여줍니다.

Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함.

다음 사용 사례에 대해 이를 비즈니스에 적용할 수 있습니다.

  • 자신의 비즈니스에서 고객 이탈 예측
  • 마케팅 이메일을 열 수 있는 고객과 열지 않을 고객 분류(이진 분류)
  • 어떤 학생이 과정에서 중도 탈락할 가능성이 있는지 예측

자원 정리

JumpStart에서 솔루션 실행을 완료한 후 다음을 선택해야 합니다. 모든 리소스 삭제 따라서 프로세스에서 생성한 모든 리소스가 삭제되고 청구가 중지됩니다.

Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함.

요약

이 포스트에서는 JumpStart 솔루션을 기반으로 ML을 적용하여 다양한 비즈니스 문제를 해결하는 방법을 보여주었습니다. 이 게시물은 최근 JumpStart에 추가된 23가지 새로운 솔루션에 중점을 두었지만 총 XNUMX개의 사용 가능한 솔루션이 있습니다. Studio에 로그인하여 직접 JumpStart 솔루션을 살펴보고 그로부터 즉각적인 가치를 이끌어내는 것이 좋습니다. 자세한 내용은 다음을 참조하십시오. 아마존 세이지 메이커 스튜디오세이지메이커 점프스타트.

참고: AWS 리전의 JumpStart 콘솔에 위의 XNUMX가지 솔루션이 모두 표시되지 않으면 일주일 동안 기다렸다가 다시 확인하십시오. 다양한 지역에 단계적으로 출시하고 있습니다.


저자에 관하여

Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함. 라주 펜마차 박사 AWS AI 플랫폼의 AI/ML 전문가 솔루션 아키텍트입니다. 그는 고객이 기계 학습 모델 및 솔루션을 쉽게 구축하고 배포할 수 있도록 지원하는 SageMaker의 로우 코드/노코드 서비스 제품군에서 일하고 있습니다. 그는 고객을 돕지 않을 때 새로운 곳으로 여행하는 것을 좋아합니다.

Amazon SageMaker JumpStart 솔루션 PlatoBlockchain Data Intelligence의 기계 학습을 통해 엔드투엔드 비즈니스 문제를 해결하세요. 수직 검색. 일체 포함.마난 샤 Amazon Web Services의 소프트웨어 개발 관리자입니다. 그는 ML 애호가이며 코드 없는/낮은 코드의 AI/ML 제품 구축에 중점을 둡니다. 그는 다른 재능 있고 기술적인 사람들이 훌륭한 소프트웨어를 만들 수 있도록 힘을 실어주기 위해 노력합니다.

타임 스탬프 :

더보기 AWS 기계 학습