기계 학습(ML)은 조직이 마케팅, 제조, 운영, 영업, 재무 및 고객 서비스와 같은 여러 비즈니스 단위에서 핵심 비즈니스 기능을 최적화하여 수익을 창출하고, 비용을 절감하고, 위험을 완화하고, 효율성을 높이고, 품질을 개선하도록 돕습니다. 조직은 AWS ML을 사용하여 가치 창출을 몇 달에서 며칠로 가속화할 수 있습니다. Amazon SageMaker 캔버스 비즈니스 분석가가 한 줄의 코드를 작성하거나 ML 전문 지식이 없어도 정확한 ML 예측을 생성할 수 있는 시각적 포인트 앤 클릭 서비스입니다. 모델을 사용하여 대화식으로 예측하고 대량 데이터 세트에 대한 일괄 점수를 매길 수 있습니다.
이 게시물에서는 비즈니스 팀이 Canvas에서 예측을 생성하여 어디서나 구축된 ML 모델을 사용하고 효과적인 비즈니스 결과를 달성하는 방법에 대한 아키텍처 패턴을 보여줍니다.
이러한 모델 개발과 공유의 통합은 비즈니스와 데이터 사이언스 팀 간의 긴밀한 협업을 생성하고 가치 실현 시간을 단축합니다. 비즈니스 팀은 외부 환경에서 새 모델을 다시 구축하는 대신 데이터 과학자 또는 다른 부서에서 구축한 기존 모델을 사용하여 비즈니스 문제를 해결할 수 있습니다.
마지막으로 비즈니스 분석가는 몇 번의 클릭만으로 공유 모델을 Canvas로 가져오고 프로덕션에 배포하기 전에 예측을 생성할 수 있습니다.
솔루션 개요
다음 그림은 데이터 과학자가 비즈니스 분석가와 모델을 공유한 다음 Canvas의 시각적 인터페이스에서 해당 모델로부터 직접 예측을 생성할 수 있는 방법을 보여주기 위해 세 가지 아키텍처 패턴을 설명합니다.
사전 조건
SageMaker를 사용하여 모델을 훈련 및 구축하고 모델을 Canvas로 가져오려면 다음 전제 조건을 완료하십시오.
- SageMaker 도메인 및 Studio 사용자가 아직 없는 경우 SageMaker 도메인에 Studio 사용자 설정 및 온보딩.
- 캔버스 활성화 및 설정 사용자에 대한 기본 권한 및 사용자에게 Studio와 공동 작업할 수 있는 권한 부여.
- Autopilot, JumpStart 또는 모델 레지스트리에서 훈련된 모델이 있어야 합니다. SageMaker 외부에서 구축한 모든 모델의 경우 모델을 Canvas로 가져오기 전에 모델 레지스트리에 모델을 등록해야 합니다.
이제 이러한 세 가지 아키텍처 패턴 각각에 대해 비즈니스 분석가와 ML 모델을 교육, 구축, 배포 및 공유하려는 데이터 과학자의 역할을 가정해 보겠습니다.
Autopilot 및 캔버스 사용
Autopilot은 데이터 탐색, 문제 유형에 대한 관련 알고리즘 선택, 학습 및 조정과 같은 자동 ML(AutoML) 프로세스의 주요 작업을 자동화합니다. 데이터 세트에 대한 완전한 제어와 가시성을 유지하면서 이 모든 것을 달성할 수 있습니다. Autopilot은 다양한 솔루션을 자동으로 탐색하여 최상의 모델을 찾고 사용자는 ML 모델을 반복하거나 클릭 한 번으로 모델을 프로덕션에 직접 배포할 수 있습니다.
이 예에서는 고객 이탈 합성을 사용합니다. 데이터 세트 통신 도메인에서 잠재적으로 이탈 위험이 있는 고객을 식별하는 임무를 맡고 있습니다. Autopilot AutoML을 사용하여 비즈니스 분석가와 ML 모델을 구축, 교육, 배포 및 공유하려면 다음 단계를 완료하세요.
- 를 다운로드 데이터 세트, Amazon S3(아마존 단순 스토리지 서비스) 버킷을 만들고 S3 URI를 기록해 둡니다.
- Studio 콘솔에서 다음을 선택합니다. AutoML 탐색 창에서
- 왼쪽 메뉴에서 AutoML 실험 만들기.
- 실험 이름 지정(이 게시물의 경우,
Telecom-Customer-Churn-AutoPilot
), S3 데이터 입력 및 출력 위치. - 대상 열을 변동으로 설정합니다.
- 배포 설정에서 자동 배포 옵션을 활성화하여 최상의 모델을 배포하고 엔드포인트에서 추론을 실행하는 엔드포인트를 생성할 수 있습니다.
자세한 내용은 Amazon SageMaker Autopilot 실험 생성.
- 실험을 선택한 다음 최상의 모델을 선택하고 모델 공유.
- Canvas 사용자를 추가하고 선택 공유 모델을 공유합니다.
(주의 사항: Studio 로그인에 사용된 것과 동일한 Canvas 사용자와 모델을 공유할 수 없습니다. 예를 들어 Studio 사용자 A는 Canvas 사용자 A와 모델을 공유할 수 없습니다. 그러나 사용자 A는 사용자 B와 모델을 공유할 수 있으므로 모델 공유에 대해 다른 용도를 선택합니다.)
자세한 내용은 Studio 사용자: SageMaker Canvas에 모델 공유.
JumpStart 및 캔버스 사용
JumpStart는 사기 감지, 신용 위험 예측 및 제품 결함 감지와 같은 광범위한 ML 사용 사례를 위해 사전 학습된 오픈 소스 모델을 제공하는 ML 허브입니다. 테이블 형식, 비전, 텍스트 및 오디오 데이터에 대해 300개 이상의 사전 훈련된 모델을 배포할 수 있습니다.
이 게시물에서는 JumpStart의 LightGBM 회귀 사전 학습 모델을 사용합니다. 맞춤형 데이터 세트에서 모델을 교육하고 Canvas 사용자(비즈니스 분석가)와 모델을 공유합니다. 선행 학습된 모델은 추론을 위해 엔드포인트에 배포할 수 있습니다. JumpStart는 배포 후 모델에 액세스할 수 있는 예제 노트북을 제공합니다.
이 예에서 우리는 전복 데이터 셋. 이 데이터 세트에는 전복의 나이를 예측하기 위한 길이, 지름 및 높이와 같은 XNUMX가지 물리적 측정의 예가 포함되어 있습니다(회귀 문제).
- 를 다운로드 전복 데이터 셋 캐글에서.
- S3 버킷을 생성하고 훈련, 검증 및 사용자 지정 헤더 데이터 세트를 업로드합니다.
- Studio 콘솔에서 세이지메이커 점프스타트 탐색 창에서 모델, 노트북, 솔루션.
- $XNUMX Million 미만 테이블 형식 모델선택한다.
LightGBM 회귀.
- $XNUMX Million 미만 기차 모형, 훈련, 검증 및 열 헤더 데이터 세트에 대한 S3 URI를 지정합니다.
- 왼쪽 메뉴에서 Train
.
- 탐색 창에서 출시된 JumpStart 자산.
- 에 훈련 직업 탭에서 학습 작업을 선택합니다.
- 에 공유 메뉴, 선택 캔버스에 공유.
- 공유할 Canvas 사용자를 선택하고 모델 세부 정보를 지정한 다음 공유.
자세한 내용은 Studio 사용자: SageMaker Canvas에 모델 공유.
SageMaker 모델 레지스트리 및 Canvas 사용
SageMaker 모델 레지스트리를 사용하면 프로덕션용 모델을 카탈로그화하고, 모델 버전을 관리하고, 메타데이터를 연결하고, 모델의 승인 상태를 관리하고, 모델을 프로덕션에 배포하고, CI/CD로 모델 배포를 자동화할 수 있습니다.
데이터 과학자의 역할을 가정해 봅시다. 이 예에서는 데이터 준비, 모델 교육, 모델 호스팅, 모델 레지스트리 및 비즈니스 분석가와의 모델 공유를 포함하는 종단 간 ML 프로젝트를 구축하고 있습니다. 선택적으로 데이터 준비 및 전처리 또는 후처리 단계를 위해 다음을 사용할 수 있습니다. Amazon SageMaker 데이터 랭글러 및 Amazon SageMaker 처리 작업. 이 예제에서는 LIBSVM에서 다운로드한 전복 데이터 세트를 사용합니다. 대상 변수는 전복의 연령입니다.
- Studio에서 GitHub 레포.
- README 파일에 나열된 단계를 완료하십시오.
- Studio 콘솔에서 모델 탐색 창에서 모델 레지스트리.
- 모델 선택
sklearn-reg-ablone
. - 모델 레지스트리에서 Canvas로 모델 버전 1을 공유합니다.
- 공유할 Canvas 사용자를 선택하고 모델 세부 정보를 지정한 다음 공유.
지침은 다음을 참조하십시오. 모델 레지스트리 ~의 섹션 Studio 사용자: SageMaker Canvas에 모델 공유.
공유 모델 관리
앞의 방법 중 하나를 사용하여 모델을 공유한 후 다음으로 이동할 수 있습니다. 모델 Studio의 섹션을 보고 모든 공유 모델을 검토합니다. 다음 스크린샷에서는 Studio 사용자(데이터 과학자)가 다른 Canvas 사용자(비즈니스 팀)와 공유하는 3가지 모델을 볼 수 있습니다.
공유 모델 가져오기 및 Canvas로 예측하기
비즈니스 분석가의 역할을 가정하고 Canvas 사용자로 Canvas에 로그인해 보겠습니다.
데이터 과학자 또는 Studio 사용자가 Canvas 사용자와 모델을 공유하면 Studio 사용자가 모델을 공유했다는 알림이 Canvas 애플리케이션 내에서 수신됩니다. Canvas 애플리케이션에서 알림은 다음 스크린샷과 유사합니다.
선택할 수 있습니다. 업데이트 보기 공유 모델을 보거나 모델 Canvas 애플리케이션의 페이지에서 나와 공유된 모든 모델을 찾을 수 있습니다. Studio에서 모델을 가져오는 데 최대 20분이 걸릴 수 있습니다.
모델을 가져온 후 메트릭을 보고 생성할 수 있습니다. 가상 분석 또는 일괄 예측을 통한 실시간 예측.
고려
Canvas와 모델을 공유할 때 다음 사항에 유의하십시오.
- 교육 및 검증 데이터 세트를 Amazon S3에 저장하고 S3 URI는 다음과 같이 Canvas로 전달됩니다. AWS 자격 증명 및 액세스 관리 (IAM) 권한.
- Canvas에 대상 열을 제공하거나 첫 번째 열을 기본값으로 사용합니다.
- Canvas 컨테이너가 추론 데이터를 구문 분석하기 위해 Canvas 엔드포인트는 텍스트(CSV) 또는 애플리케이션(JSON)을 허용합니다.
- Canvas는 여러 컨테이너 또는 추론 파이프라인을 지원하지 않습니다.
- 교육 및 유효성 검사 데이터 세트에 헤더가 제공되지 않은 경우 데이터 스키마가 Canvas에 제공됩니다. 기본적으로 JumpStart 플랫폼은 교육 및 검증 데이터 세트에 헤더를 제공하지 않습니다.
- Jumpstart를 사용하면 학습 작업을 완료해야 Canvas와 공유할 수 있습니다.
인용하다 제한 사항 및 문제 해결 모델을 공유할 때 발생하는 모든 문제를 해결하는 데 도움이 됩니다.
정리
향후 요금이 발생하지 않도록 하려면 이 게시물을 팔로우하는 동안 생성한 리소스를 삭제하거나 종료하세요. 인용하다 Amazon SageMaker 캔버스에서 로그아웃 상세 사항은. 노트북, 터미널, 커널, 앱 및 인스턴스를 포함한 개별 리소스를 종료합니다. 자세한 내용은 다음을 참조하십시오. 리소스 종료. 삭제 모델 버전, SageMaker 엔드포인트 및 리소스, Autopilot 실험 리소스및 S3 버킷.
결론
Studio를 사용하면 데이터 과학자가 몇 가지 간단한 단계를 거쳐 비즈니스 분석가와 ML 모델을 공유할 수 있습니다. 비즈니스 분석가는 Canvas에서 새 모델을 만드는 대신 비즈니스 문제를 해결하기 위해 데이터 과학자가 이미 구축한 ML 모델을 활용할 수 있습니다. 그러나 기술 요구 사항 및 모델을 가져오는 수동 프로세스로 인해 이러한 모델이 구축된 환경 외부에서 사용하기 어려울 수 있습니다. 이로 인해 종종 사용자는 ML 모델을 다시 빌드해야 하므로 작업이 중복되고 시간과 리소스가 추가됩니다. Canvas는 이러한 제한을 제거하므로 어디서나 학습한 모델을 사용하여 Canvas에서 예측을 생성할 수 있습니다. 이 게시물에서 설명한 세 가지 패턴을 사용하여 ML 모델의 메타데이터 저장소인 SageMaker 모델 레지스트리에 ML 모델을 등록하고 Canvas로 가져올 수 있습니다. 그런 다음 비즈니스 분석가는 Canvas의 모든 모델에서 예측을 분석하고 생성할 수 있습니다.
SageMaker 서비스 사용에 대해 자세히 알아보려면 다음 리소스를 확인하십시오.
질문이나 제안 사항이 있으면 의견을 남겨주세요.
저자 소개
아만 샴마 AWS의 선임 솔루션 아키텍트입니다. 그는 컨설팅, 설계 및 솔루션 분야에서 19년 이상의 경험을 바탕으로 APJ 지역의 신생 기업, 중소기업 및 기업 고객과 협력하고 있습니다. 그는 AI 및 ML을 민주화하고 고객이 데이터 및 ML 전략을 설계하도록 돕는 데 열정적입니다. 업무 외에는 자연과 야생 동물을 탐험하는 것을 좋아합니다.
니에 지첸 작년에 SageMaker Canvas에 나만의 모델 가져오기 프로젝트를 이끄는 AWS SageMaker의 선임 소프트웨어 엔지니어입니다. 그녀는 Amazon에서 7년 이상 근무했으며 Amazon Supply Chain Optimization 및 AWS AI 서비스에 대한 경험이 있습니다. 그녀는 퇴근 후 Barre 운동과 음악을 즐깁니다.
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- PlatoAiStream. Web3 데이터 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 미래 만들기 w Adryenn Ashley. 여기에서 액세스하십시오.
- 출처: https://aws.amazon.com/blogs/machine-learning/bring-your-own-ml-model-into-amazon-sagemaker-canvas-and-generate-accurate-predictions/
- :있다
- :이다
- $UP
- 1
- 100
- 20
- 7
- a
- 소개
- 가속
- 수락
- ACCESS
- 정확한
- 달성
- 달성
- 가로질러
- 추가
- 후
- AI
- AI 서비스
- 연산
- All
- 허용
- 수
- 이미
- 아마존
- 아마존 세이지 메이커
- Amazon SageMaker 자동 조종 장치
- Amazon SageMaker 캔버스
- an
- 분석
- 분석자
- 애널리스트
- 분석하다
- 및
- 어떤
- 어딘가에
- 어플리케이션
- 승인
- 앱
- 건축
- 아키텍처
- 있군요
- AS
- 준
- At
- 오디오
- 자동
- 자동화
- 오토마타
- Automatic
- 자동적으로
- AutoML
- 피하기
- AWS
- 기지
- BE
- 된
- 전에
- 이익
- BEST
- 사이에
- 두
- 가져
- 빌드
- 건물
- 내장
- 사업
- 비즈니스 기능
- 사업
- 비자 면제 프로그램에 해당하는 국가의 시민권을 가지고 있지만
- by
- CAN
- 캔버스
- 가지 경우
- 목록
- 체인
- 요금
- 검사
- 왼쪽 메뉴에서
- 클릭
- 암호
- 협력
- 협동
- 단
- 본문
- 완전한
- 콘솔에서
- 컨설팅
- 컨테이너
- 이 포함되어 있습니다
- 제어
- 핵심
- 비용
- 만들
- 만든
- 생성
- 만들기
- 창조
- 신용
- 관습
- 고객
- 고객 센터
- 고객
- 데이터
- 데이터 준비
- 데이터 과학
- 데이터 과학자
- 데이터 세트
- 일
- 태만
- 민주화
- 보여
- 부서
- 배포
- 배포
- 배치
- 전개
- 배치하다
- 설계
- 세부설명
- Detection System
- 개발
- 다른
- 어려운
- 직접
- 발견
- 하지 않습니다
- 도메인
- 말라
- 아래 (down)
- 드라이브
- 두
- 마다
- 유효한
- 효율성
- 노력
- 중
- 가능
- 끝으로 종료
- 종점
- 기사
- Enterprise
- 환경
- 예
- 예
- 현존하는
- 경험
- 실험
- 전문적 지식
- 탐험
- 탐구하다
- 탐색
- 를
- 그림
- 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에
- 재원
- Find
- 먼저,
- 수행원
- 럭셔리
- 군
- 사기
- 사기 탐지
- 에
- 가득 찬
- 기능
- 미래
- 생성
- 생성
- Go
- 있다
- he
- 헤더
- 신장
- 도움
- 도움이
- 도움이
- 금후
- 호스팅
- 방법
- 그러나
- HTML
- HTTP
- HTTPS
- 허브
- 식별
- 통합 인증
- if
- import
- 가져 오기
- 개선
- in
- 포함
- 포함
- 개인
- 정보
- 입력
- 를 받아야 하는 미국 여행자
- 명령
- 완성
- 인터페이스
- 으로
- 문제
- IT
- 그
- 일
- JPG
- JSON
- 다만
- 키
- 성
- 작년
- 지도
- 배우다
- 배우기
- 휴가
- 길이
- 처럼
- 좋아하는
- 한계
- 라인
- 상장 된
- 위치
- 기록
- 로그인
- 찾고
- 유지하다
- 확인
- 관리
- 조작
- 제조
- 마케팅
- 측정 시간 상관관계
- 매질
- 메타 데이터
- 방법
- 통계
- 수도
- 신경
- 회의록
- 완화
- ML
- 모델
- 모델
- 개월
- 배우기
- 여러
- 음악
- 절대로 필요한 것
- name
- 자연
- 카테고리
- 요구
- 신제품
- 아니
- 수첩
- 공고
- of
- 자주
- on
- 온보드
- ONE
- 오픈 소스
- 행정부
- 최적화
- 최적화
- 선택권
- or
- 조직
- 기타
- 아웃
- 결과
- 출력
- 외부
- 자신의
- 페이지
- 빵
- 합격
- 열렬한
- 패턴
- 권한
- 물리적
- 플랫폼
- 플라톤
- 플라톤 데이터 인텔리전스
- 플라토데이터
- 게시하다
- 잠재적으로
- 예측
- 예측
- 예측
- 전제 조건
- 문제
- 문제
- 방법
- 프로세스
- 처리
- 프로덕트
- 생산
- 프로젝트
- 제공
- 제공
- 제공
- 품질
- 문의
- 범위
- 받다
- 감소
- 지방
- 회원가입
- 레지스트리
- 관련된
- 요구조건 니즈
- 제품 자료
- 결과
- 수익
- 리뷰
- 위험
- 직위별
- 현자
- 판매
- 같은
- 과학
- 과학자
- 과학자
- 점수
- 섹션
- 참조
- 선택
- 연장자
- 서비스
- 서비스
- 세트
- 설정
- 공유
- 공유
- 공유
- 공유
- 그녀
- 소개
- 종료
- 비슷한
- 단순, 간단, 편리
- 단일
- 작은
- So
- 소프트웨어
- 소프트웨어 엔지니어
- 솔루션
- 풀다
- 신생 기업
- Status
- 단계
- 저장
- 저장
- 전략들
- 스튜디오
- 이러한
- 공급
- 공급망
- 공급망 최적화
- SUPPORT
- 인조
- 받아
- 목표
- 작업
- 팀
- 테크니컬
- 통신
- 단말기
- 보다
- 그
- XNUMXD덴탈의
- 그들의
- 그들
- 그때
- Bowman의
- 그들
- 이
- 그
- 세
- 단단한
- 시간
- 에
- Train
- 훈련 된
- 트레이닝
- 유형
- 아래에
- 단위
- 사용
- 익숙한
- 사용자
- 사용자
- 사용
- 확인
- 가치
- 가치 창출
- 버전
- 관측
- 가시성
- 시력
- we
- 언제
- 어느
- 동안
- 누구
- 넓은
- 넓은 범위
- 과
- 이내
- 없이
- 작업
- 일하는
- 일
- 쓰기
- year
- 년
- 자신의
- 너의
- 제퍼 넷