Amazon SageMaker의 RStudio 클라우드에서 업계 최초의 완전 관리형 RStudio Workbench입니다. 친숙한 RStudio 통합 개발 환경(IDE)을 빠르게 시작하고 작업을 중단하지 않고 기본 컴퓨팅 리소스를 확장 및 축소할 수 있으므로 R에서 머신 러닝(ML) 및 분석 솔루션을 대규모로 쉽게 구축할 수 있습니다. SageMaker의 RStudio는 이미 내장 이미지 R 프로그래밍 및 데이터 과학 도구로 사전 구성됨 그러나 종종 IDE 환경을 사용자 정의해야 합니다. 오늘부터 원하는 패키지 및 도구를 사용하여 고유한 사용자 지정 이미지를 가져와서 클릭 몇 번으로 SageMaker의 모든 RStudio 사용자가 사용할 수 있도록 할 수 있습니다.
나만의 맞춤 이미지를 가져오면 여러 가지 이점이 있습니다. 스타터 이미지를 제공하고, 데이터 저장소에 연결하는 데 필요한 드라이버를 사전 구성하거나, 비즈니스 도메인에 대한 전문 데이터 과학 소프트웨어를 사전 설치하여 데이터 과학자 및 개발자를 위한 시작 환경을 표준화하고 단순화할 수 있습니다. 또한 이전에 자체 RStudio Workbench를 호스팅한 조직에는 SageMaker의 RStudio에서 계속 사용하려는 기존 컨테이너화된 환경이 있을 수 있습니다.
이 게시물에서는 사용자 지정 이미지를 만들고 다음을 사용하여 SageMaker의 RStudio로 가져오는 단계별 지침을 공유합니다. AWS 관리 콘솔 or AWS 명령 줄 인터페이스 (AWS CLI). 몇 가지 간단한 단계로 첫 번째 사용자 지정 IDE 환경을 시작하고 실행할 수 있습니다. 이 게시물에서 논의된 내용에 대한 자세한 내용은 다음을 참조하십시오. 나만의 RStudio 이미지 가져오기.
솔루션 개요
데이터 과학자가 SageMaker의 RStudio에서 새 세션을 시작하면 새로운 주문형 ML 컴퓨팅 인스턴스가 프로비저닝되고 런타임 환경(운영 체제, 라이브러리, R 버전 등)을 정의하는 컨테이너 이미지가 ML에서 실행됩니다. 사례. 다음 스크린샷과 같이 사용자 정의 컨테이너 이미지를 생성하고 RStudio Workbench 실행기에서 사용할 수 있도록 하여 데이터 과학자에게 런타임 환경에 대한 다양한 선택을 제공할 수 있습니다.
다음 다이어그램은 사용자 정의 이미지를 가져오는 프로세스를 설명합니다. 먼저 Dockerfile에서 사용자 정의 컨테이너 이미지를 빌드하고 저장소에 푸시합니다. Amazon Elastic Container Registry (아마존 ECR). 다음으로 Amazon ECR의 컨테이너 이미지를 가리키는 SageMaker 이미지를 생성하고 해당 이미지를 SageMaker 도메인. 이렇게 하면 RStudio에서 새 세션을 시작하는 데 사용자 지정 이미지를 사용할 수 있습니다.
사전 조건
이 솔루션을 구현하려면 다음 전제 조건이 있어야합니다.
- SageMaker 도메인의 RStudio
- AWS 자격 증명 및 액세스 관리 (IAM) Amazon ECR과 상호 작용하는 정책
- 적절한 AWS CLI 버전
이 섹션에서 각각에 대한 자세한 내용을 제공합니다.
SageMaker 도메인의 RStudio
7년 2022월 XNUMX일 이전에 RStudio가 활성화된 기존 SageMaker 도메인이 있는 경우 해당 도메인을 삭제하고 다시 생성해야 합니다. RStudioServerPro
사용자 프로필 이름 아래의 앱 domain-shared
고유한 사용자 지정 이미지 기능을 가져오기 위한 최신 업데이트를 받으십시오. AWS CLI 명령어는 다음과 같습니다. 이 작업은 SageMaker에서 RStudio 사용자를 방해합니다.
SageMaker에서 RStudio를 처음 사용하는 경우에는 에 설명된 단계별 설정 프로세스를 따르십시오. Amazon SageMaker에서 RStudio 시작하기, 또는 다음을 실행합니다. AWS 클라우드 포메이션 템플릿을 사용하여 SageMaker 도메인에 첫 번째 RStudio를 설정합니다. SageMaker 도메인에 이미 작동하는 RStudio가 있는 경우 이 단계를 건너뛸 수 있습니다.
다음 RStudio on SageMaker CloudFormation 템플릿에는 AWS License Manager를 통해 승인된 RStudio 라이선스가 필요합니다. 라이선스에 대한 자세한 내용은 RStudio 라이선스. 또한 AWS 리전당 하나의 SageMaker 도메인만 허용되므로 기존 도메인이 없는 AWS 계정 및 리전을 사용해야 합니다.
- 왼쪽 메뉴에서 발사 스택.
링크를 클릭하면 us-east-1 리전으로 이동하지만 원하는 리전으로 변경할 수 있습니다. - . 템플릿 지정 섹션 선택 다음 보기.
- . 스택 세부 사항 지정 섹션 스택 이름이름을 입력하십시오.
- 럭셔리 파라미터, SageMaker 사용자 프로필 이름을 입력합니다.
- 왼쪽 메뉴에서 다음 보기.
- . 스택 옵션 구성 섹션 선택 다음 보기.
- . 검토 섹션에서 선택 AWS CloudFormation이 IAM 리소스를 생성 할 수 있음을 인정합니다 선택하고 다음 보기.
- 스택 상태가 다음으로 변경되면
CREATE_COMPLETE
,로 이동 제어 패널 SageMaker 콘솔에서 도메인과 새 사용자를 찾습니다.
Amazon ECR과 상호 작용하는 IAM 정책
프라이빗 Amazon ECR 리포지토리와 상호 작용하려면 Docker 이미지를 빌드하고 푸시하는 데 사용할 IAM 사용자 또는 역할에 다음 IAM 권한이 필요합니다.
이 게시물에 표시된 대로 처음에 퍼블릭 Amazon ECR 이미지에서 빌드하려면 AWS 관리 AmazonElasticContainerRegistryPublicReadOnly 정책을 IAM 사용자 또는 역할에도 적용합니다.
Docker 컨테이너 이미지를 빌드하려면 로컬 Docker 클라이언트 또는 SageMaker 도커 빌드 SageMaker의 RStudio 내 터미널에서 CLI 도구. 후자의 경우 다음의 전제 조건을 따르십시오. Amazon SageMaker Studio 이미지 빌드 CLI를 사용하여 Studio 노트북에서 컨테이너 이미지 빌드 IAM 권한 및 CLI 도구를 설정합니다.
AWS CLI 버전
이 게시물에 언급된 명령을 실행하기 위한 AWS CLI 도구의 최소 버전 요구 사항이 있습니다. 선택한 터미널에서 AWS CLI를 업그레이드해야 합니다.
- AWS CLI v1 >= 1.23.6
- AWS CLI v2 >= 2.6.2
Dockerfile 준비
Dockerfile의 RStudio에서 런타임 환경을 사용자 지정할 수 있습니다. 사용자 지정은 사용 사례 및 요구 사항에 따라 다르므로 이 예에서는 필수 사항과 가장 일반적인 사용자 지정 사항을 보여줍니다. 당신은 전체를 다운로드 할 수 있습니다 샘플 Dockerfile.
RStudio Workbench 세션 구성 요소 설치
사용자 정의 컨테이너 이미지에 설치해야 할 가장 중요한 소프트웨어는 RStudio Workbench입니다. 우리는에서 다운로드 RStudio PBC에서 호스팅하는 공개 S3 버킷. 사용할 많은 버전 릴리스 및 OS 배포판이 있습니다. 설치 버전은 SageMaker의 RStudio에서 사용되는 RStudio Workbench 버전(작성 당시 1.4.1717-3)과 호환되어야 합니다. OS(다음 스니펫의 인수 OS)는 기본과 일치해야 합니다. OS
컨테이너 이미지에 사용됩니다. 우리의 샘플에서 도커 파일, 우리가 사용하는 기본 이미지는 AWS 관리형 퍼블릭 Amazon ECR 리포지토리의 Amazon Linux 2입니다. 호환되는 RStudio Workbench OS는 centos7입니다.
다음 명령을 사용하여 모든 OS 릴리스 옵션을 찾을 수 있습니다.
R(및 R 버전) 설치
사용자 지정 RStudio 컨테이너 이미지의 런타임에는 R 버전이 하나 이상 필요합니다. 먼저 R 버전을 설치하고 /usr/local/bin/
:
데이터 과학자는 프로젝트와 코드 기반 간에 쉽게 전환할 수 있도록 여러 버전의 R이 필요한 경우가 많습니다. SageMaker의 RStudio는 다음 스크린샷과 같이 R 버전 간의 간편한 전환을 지원합니다.
SageMaker의 RStudio 다음 디렉토리에서 R 버전을 자동으로 스캔하고 발견합니다.:
다음 스니펫과 같이 컨테이너 이미지에 더 많은 버전을 설치할 수 있습니다. 그들은 다음에 설치됩니다 /opt/R/
.
RStudio 전문가용 드라이버 설치
데이터 과학자는 종종 다음과 같은 소스에서 데이터에 액세스해야 합니다. 아마존 아테나 와 아마존 레드 시프트 SageMaker의 RStudio 내에서. 다음을 사용하여 할 수 있습니다. RStudio 전문 드라이버 와 RStudio 연결. 다음 스니펫에 표시된 대로 관련 라이브러리 및 드라이버를 설치했는지 확인하십시오.
사용자 지정 라이브러리 설치
데이터 과학자가 즉석에서 설치할 필요가 없도록 추가 R 및 Python 라이브러리를 설치할 수도 있습니다.
Dockerfile에서 사용자 지정을 마쳤으면 컨테이너 이미지를 빌드하고 Amazon ECR에 푸시해야 합니다.
Amazon ECR에 빌드 및 푸시
Docker 엔진이 설치된 터미널(예: 로컬 터미널 또는 AWS 클라우드9. SageMaker의 RStudio 내 터미널에서 빌드하는 경우 다음을 사용할 수 있습니다. SageMaker 스튜디오 이미지 빌드. 우리는 두 가지 접근 방식에 대한 단계를 보여줍니다.
Docker 엔진이 있는 로컬 터미널에서 Dockerfile이 있는 위치에서 다음 명령을 실행할 수 있습니다. 샘플 스크립트를 사용할 수 있습니다. 생성 및 업데이트 이미지.sh.
SageMaker의 RStudio 터미널에서 다음 명령을 실행합니다.
이 명령 후에 Amazon ECR에 리포지토리와 Docker 컨테이너 이미지가 있는 다음 단계에서는 SageMaker의 RStudio에서 사용할 컨테이너 이미지를 연결합니다. Amazon ECR의 이미지 URI 기록 <ACCOUNT_ID>.dkr.ecr.<REGION>.amazonaws.com/<REPO>:<TAG>
나중에 사용하기 위해.
콘솔을 통해 SageMaker에서 RStudio 업데이트
SageMaker의 RStudio는 사용자 정의 SageMaker 이미지를 사용하여 런타임 사용자 정의를 허용합니다. SageMaker 이미지는 SageMaker 이미지 버전 세트의 홀더입니다. 각 이미지 버전은 SageMaker의 RStudio와 호환되고 Amazon ECR 리포지토리에 저장된 컨테이너 이미지를 나타냅니다. 도메인 내의 모든 RStudio 사용자가 사용자 정의 SageMaker 이미지를 사용할 수 있도록 하려면 이 섹션의 단계에 따라 이미지를 도메인에 첨부할 수 있습니다.
- SageMaker 콘솔에서 도메인에 연결된 사용자 정의 SageMaker Studio 이미지 페이지를 선택하고 이미지 첨부.
- 선택 새로운 이미지, Amazon ECR 이미지 URI를 입력합니다.
- 왼쪽 메뉴에서 다음 보기.
- . 이미지 속성 섹션, 제공 이미지 이름 (필수의), 이미지 표시 이름 (선택 과목), 상품 설명 (선택 사항), IAM 역할 및 태그.
XNUMXD덴탈의 이미지 표시 이름, 제공되는 경우 SageMaker에서 RStudio의 세션 시작 관리자에 표시됩니다. 만약 이미지 표시 이름 필드가 비어 있으면 이미지 이름 대신 SageMaker의 RStudio에 표시됩니다. - 휴가 EFS 마운트 경로 와 고급 구성 (사용자 ID 와 그룹 ID) SageMaker의 RStudio가 구성을 관리하기 때문에 기본값입니다.
- . 이미지 타입 섹션에서 선택 RStudio 이미지.
- 왼쪽 메뉴에서 문의하기.
이제 목록에서 새 항목을 볼 수 있습니다. 커스텀 RStudio 이미지 지원이 도입되면서 새로운 사용 유형 이미지가 RStudio 이미지인지 아니면 아마존 세이지 메이커 스튜디오 영상.
세션 시작 관리자 UI에서 사용자 정의 이미지를 사용할 수 있으려면 최대 5-10분이 소요될 수 있습니다. 그런 다음 사용자 정의 이미지를 사용하여 SageMaker의 RStudio에서 새 R 세션을 시작할 수 있습니다.
시간이 지나면 오래되고 오래된 이미지를 폐기할 수 있습니다. RStudio의 사용자 지정 이미지 목록에서 사용자 지정 이미지를 제거하려면 목록에서 이미지를 선택하고 떼다.
왼쪽 메뉴에서 떼다 다시 확인하십시오.
AWS CLI를 통해 SageMaker에서 RStudio 업데이트
다음 섹션에서는 SageMaker 콘솔의 SageMaker에서 RStudio와 AWS CLI를 사용하여 SageMaker 이미지를 생성하고 연결하는 단계를 설명합니다. 샘플 스크립트를 사용할 수 있습니다. 생성 및 업데이트 이미지.sh.
SageMaker 이미지 및 이미지 버전 생성
첫 번째 단계는 다음 두 명령을 실행하여 Amazon ECR의 사용자 지정 컨테이너 이미지에서 SageMaker 이미지를 생성하는 것입니다.
SageMaker에서 RStudio의 세션 시작 관리자에 표시되는 사용자 정의 이미지는 다음 입력에 의해 결정됩니다. --display-name
. 선택적 표시 이름이 제공되지 않으면 --image-name
대신 사용됩니다. 또한 IAM 역할을 통해 SageMaker는 Amazon ECR 이미지를 SageMaker의 RStudio에 연결할 수 있습니다.
AppImageConfig 만들기
Amazon ECR에서 이미지 URI를 캡처하는 SageMaker 이미지 외에도 앱 이미지 구성(앱 이미지 구성)은 SageMaker 도메인에서 사용하는 데 필요합니다. 에 대한 구성을 단순화합니다. RSessionApp
다음 명령을 사용하여 자리 표시자 구성을 생성할 수 있습니다.
SageMaker 도메인에 연결
SageMaker 이미지와 앱 이미지 구성이 생성되면 사용자 정의 컨테이너 이미지를 SageMaker 도메인에 연결할 준비가 되었습니다. 도메인 내의 모든 RStudio 사용자가 사용자 정의 SageMaker 이미지를 사용할 수 있도록 하려면 기본 사용자 설정으로 이미지를 도메인에 연결합니다. 모든 기존 사용자와 새 사용자는 사용자 정의 이미지를 사용할 수 있습니다.
더 나은 가독성을 위해 다음 구성을 JSON 파일에 배치합니다. 기본 사용자 설정.json:
이 파일에서 이미지를 지정하고 AppImageConfig
목록의 이름 쌍 DefaultUserSettings.RSessionAppSettings.CustomImages
. 이 앞의 스니펫은 두 개의 사용자 정의 이미지가 생성되고 있다고 가정합니다.
그런 다음 다음 명령을 실행하여 SageMaker 도메인을 업데이트합니다.
도메인을 업데이트한 후 세션 시작 관리자 UI에서 사용자 지정 이미지를 사용할 수 있게 되는 데 최대 5-10분이 소요될 수 있습니다. 그런 다음 사용자 정의 이미지를 사용하여 SageMaker의 RStudio에서 새 R 세션을 시작할 수 있습니다.
SageMaker 도메인에서 이미지 분리
제거하기만 하면 이미지를 분리할 수 있습니다. ImageName
와 AppImageConfigName
에서 쌍 default-user-settings.json
및 도메인 업데이트.
예를 들어 다음을 사용하여 도메인을 업데이트합니다. default-user-settings.json
제거하다 r-4.1.3-rstudio-2022
R 세션 시작 UI에서 r-4.1.3-rstudio-1.4.1717-3
도메인의 모든 사용자가 사용할 수 있는 유일한 사용자 지정 이미지:
정리
SageMaker 도메인에서 이미지와 리소스를 안전하게 제거하려면 다음 단계를 완료하십시오. 이미지 리소스 정리.
SageMaker 및 SageMaker 도메인에서 RStudio를 안전하게 제거하려면 다음 단계를 완료하십시오. Amazon SageMaker 도메인 삭제 RSessionGateway 앱, 사용자 프로필 및 도메인을 삭제합니다.
Amazon ECR에서 이미지와 리포지토리를 안전하게 제거하려면 다음 단계를 완료하십시오. 이미지 삭제.
마지막으로 CloudFormation 템플릿을 삭제하려면:
- AWS CloudFormation 콘솔에서 스택을 선택합니다.
- 이 솔루션에 배포한 스택을 선택합니다.
- 삭제를 선택하십시오.
결론
SageMaker의 RStudio를 사용하면 데이터 과학자가 R에서 ML 및 분석 솔루션을 대규모로 구축하고 관리자가 개발자를 위해 강력한 데이터 과학 환경을 관리할 수 있습니다. 데이터 과학자는 올바른 작업에 올바른 라이브러리를 사용하고 각 ML 프로젝트에 대해 원하는 재현성을 달성할 수 있도록 환경을 사용자 지정하려고 합니다. 관리자는 규정 및 보안상의 이유로 데이터 과학 환경을 표준화해야 합니다. 이제 조직 요구 사항을 충족하는 사용자 지정 컨테이너 이미지를 생성하고 데이터 과학자가 SageMaker의 RStudio에서 사용하도록 허용할 수 있습니다.
우리는 당신이 그것을 시도하는 것이 좋습니다. 행복한 개발!
저자에 관하여
마이클 시에 수석 AI/ML 전문가 솔루션 아키텍트입니다. 그는 고객과 협력하여 AWS ML 제품과 ML 도메인 지식을 결합하여 고객의 ML 여정을 진행합니다. 시애틀 이식자로서 그는 하이킹 코스, SLU의 경치 카약, Shilshole Bay의 일몰과 같이 도시가 제공하는 대자연을 탐험하는 것을 좋아합니다.
데클란 켈리 Amazon SageMaker Studio 팀의 소프트웨어 엔지니어입니다. 그는 AWS re:Invent 2019에서 출시된 이후로 Amazon SageMaker Studio에서 작업해 왔습니다. 업무 외에는 하이킹과 등산을 즐깁니다.
션 모건 AWS의 AI/ML 솔루션 아키텍트입니다. 그는 반도체 및 학술 연구 분야에서 경험을 쌓았고 자신의 경험을 사용하여 고객이 AWS에서 목표를 달성할 수 있도록 돕습니다. 여가 시간에 Sean은 활발한 오픈 소스 기고자이자 유지 관리자이며 TensorFlow Add-ons의 특별 이익 그룹 책임자입니다.
- "
- &
- 1.3
- 10
- 100
- 2019
- 2022
- 7
- a
- 소개
- ACCESS
- 계정
- 달성
- 동작
- 활동적인
- 또한
- 추가
- 관리자
- 전진
- All
- 수
- 이미
- 아마존
- 분석
- 앱
- 구혼
- 적당한
- XNUMX월
- 가능
- AWS
- 만
- 때문에
- 존재
- 혜택
- 더 나은
- 사이에
- 경계
- 가져
- 빌드
- 건물
- 사업
- 얻을 수 있습니다
- 캡처
- 케이스
- 이전 단계로 돌아가기
- 선택
- 선택
- 왼쪽 메뉴에서
- City
- 클라우드
- 암호
- 단
- 결합
- 공통의
- 호환
- 완전한
- 계산
- 구성
- 연결
- 콘솔에서
- 컨테이너
- 함유량
- 계속
- 기부자
- 만들
- 만든
- 만들기
- 관습
- 고객
- 사용자 정의
- 데이터
- 데이터 과학
- 데이터 과학자
- 보여
- 따라
- 배포
- 설명
- 기술 된
- 세부설명
- 개발자
- 개발
- 디스플레이
- 배포
- 도커
- 하지 않습니다
- 도메인
- 아래 (down)
- 다운로드
- 마다
- 용이하게
- 효과
- 격려
- 엔진
- 기사
- 엔터 버튼
- 환경
- 필수
- 예
- 현존하는
- 경험
- 익숙한
- Fields
- 먼저,
- 처음으로
- 따라
- 수행원
- 다음
- 무료
- 에
- 가득 찬
- 게다가
- 점점
- 목표
- 큰
- 그룹
- 행복한
- 도움
- 보유자
- 호스팅
- 그러나
- HTTPS
- 통합 인증
- 영상
- 형상
- 구현
- 중대한
- 업계
- 정보
- 입력
- 설치
- 예
- 통합 된
- 관심
- IT
- 일
- 여행
- 지식
- 최근
- 시작
- 진수
- 리드
- 배우기
- 특허
- Licensing
- 라인
- LINK
- 모래밭
- 리눅스
- 명부
- 지방의
- 기계
- 기계 학습
- 확인
- 제작
- 유튜브 영상을 만드는 것은
- 관리
- 관리
- 구축
- 매니저
- 경기
- 말하는
- 수도
- 최저한의
- ML
- 배우기
- 모건
- 가장
- 어머니
- 여러
- 자연
- 이동
- 요구
- 다음 것
- 제공
- 오퍼링
- 운영
- 운영 체제
- 옵션
- 조직
- 조직
- 자신의
- 전철기
- 정책
- 정책
- 선호하는
- 제시
- 사설
- 방법
- 링크를
- 프로필
- 프로그램 작성
- 프로젝트
- 프로젝트
- 제공
- 제공
- 제공
- 공개
- 빨리
- RE
- 도달
- 이유
- 지방
- 규정하는
- 공개
- 보도 자료
- 관련된
- 제거
- 저장소
- 대표
- 필수
- 요구조건 니즈
- 필요
- 연구
- 의지
- 자료
- 직위별
- 달리기
- 달리는
- 안전하게
- 규모
- 과학
- 과학자
- 과학자
- 션
- 보안
- 반도체
- 세트
- 설정
- 설치
- 몇몇의
- 공유
- 표시
- 표시
- 단순, 간단, 편리
- 이후
- So
- 부드러움
- 소프트웨어
- 소프트웨어 엔지니어
- 고체
- 해결책
- 솔루션
- 특별한
- 전문가
- 전문
- 스택
- 시작
- 시작
- 성명서
- Status
- 상점
- 스튜디오
- 일몰
- SUPPORT
- 지원
- 스위치
- 체계
- 팀
- 단말기
- XNUMXD덴탈의
- 을 통하여
- 시간
- 오늘
- 수단
- 검색을
- ui
- 아래에
- 업데이트
- 업데이트
- 업데이트
- us
- 사용
- 사용자
- 버전
- 여부
- 이내
- 없이
- 작업
- 일하는
- 일
- 가치
- 쓰기
- 너의