Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함.

Amazon SageMaker Autopilot은 이제 시계열 데이터를 지원합니다.

Amazon SageMaker 자동 조종 장치 데이터를 기반으로 최고의 머신 러닝(ML) 모델을 자동으로 구축, 교육 및 조정하는 동시에 완전한 제어 및 가시성을 유지할 수 있습니다. 우리는 최근에 발표했습니다 Autopilot에서 시계열 데이터 지원. Autopilot을 사용하여 시계열 데이터 또는 일반적으로 시퀀스 데이터에 대한 회귀 및 분류 작업을 처리할 수 있습니다. 시계열 데이터는 데이터 포인트가 일정한 시간 간격으로 수집되는 특수한 유형의 시퀀스 데이터입니다.

데이터를 수동으로 준비하고, 올바른 ML 모델을 선택하고, 해당 매개변수를 최적화하는 것은 전문 실무자에게도 복잡한 작업입니다. 최상의 모델과 해당 매개변수를 찾을 수 있는 자동화된 접근 방식이 있지만 일반적으로 시간 경과에 따라 기록된 네트워크 트래픽, 전력 소비 또는 가계 지출과 같은 시퀀스로 오는 데이터를 처리할 수 없습니다. 이 데이터는 서로 다른 시점에서 수집된 관찰의 형태를 취하기 때문에 연속적인 관찰은 서로 독립적으로 취급될 수 없으며 전체적으로 처리되어야 합니다. 자동 조종 장치는 순차 데이터를 다루는 광범위한 문제에 사용할 수 있습니다. 예를 들어, 시간이 지남에 따라 기록된 네트워크 트래픽을 분류하여 악의적인 활동을 식별하거나 개인이 신용 기록을 기반으로 모기지 자격이 있는지 결정할 수 있습니다. 시계열 데이터가 포함된 데이터 세트를 제공하면 Autopilot이 나머지를 처리하고 특수 기능 변환을 통해 순차적 데이터를 처리하고 사용자를 대신하여 최상의 모델을 찾습니다.

Autopilot은 ML 모델을 구축하는 번거로움을 없애고 데이터를 기반으로 최고의 ML 모델을 자동으로 구축, 교육 및 조정할 수 있도록 도와줍니다. Autopilot은 데이터에서 여러 알고리즘을 실행하고 완전 관리형 컴퓨팅 인프라에서 하이퍼파라미터를 조정합니다. 이 게시물에서 우리는 당신이 어떻게 사용할 수 있는지 보여줍니다 자동 조종 장치 시계열 데이터에 대한 분류 및 회귀 문제를 해결합니다. Autopilot 모델 생성 및 교육에 대한 지침은 다음을 참조하세요. Amazon SageMaker Autopilot을 통한 고객 이탈 예측.

Autopilot을 사용한 시계열 데이터 분류

실행 예제로 시계열에 대한 다중 클래스 문제를 고려합니다. 데이터 세트 UWaveGestureLibraryX, 896개의 미리 정의된 손 제스처 중 하나를 수행하는 동안 가속도계 센서의 등거리 판독값을 포함합니다. 단순화를 위해 가속도계의 X 차원만 고려합니다. 작업은 센서 판독값의 시계열 데이터를 미리 정의된 제스처에 매핑하는 분류 모델을 구축하는 것입니다. 다음 그림은 CSV 형식의 데이터 세트의 첫 번째 행을 보여줍니다. 전체 테이블은 XNUMX개의 행과 두 개의 열로 구성되어 있습니다. 첫 번째 열은 제스처 레이블이고 두 ​​번째 열은 센서 판독값의 시계열입니다.

Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함.

Amazon SageMaker Data Wrangler를 사용하여 데이터를 올바른 형식으로 변환

숫자, 범주 및 표준 텍스트 열을 허용하는 것 외에도 Autopilot은 이제 시퀀스 입력 열도 허용합니다. 시계열 데이터가 이 형식을 따르지 않는 경우 다음을 통해 쉽게 변환할 수 있습니다. Amazon SageMaker 데이터 랭글러. Data Wrangler는 ML용 데이터를 집계하고 준비하는 데 걸리는 시간을 몇 주에서 몇 분으로 단축합니다. Data Wrangler를 사용하면 데이터 준비 및 기능 엔지니어링 프로세스를 단순화하고 단일 시각적 인터페이스에서 데이터 선택, 정리, 탐색 및 시각화를 포함한 데이터 준비 워크플로의 각 단계를 완료할 수 있습니다. 예를 들어, 동일한 데이터 세트이지만 다른 입력 형식을 고려하십시오. 각 제스처(ID로 지정됨)는 가속도계의 등거리 측정 시퀀스입니다. 세로로 저장하면 각 행에는 타임스탬프와 하나의 값이 포함됩니다. 다음 그림은 이 데이터를 원래 형식과 시퀀스 형식으로 비교합니다.

Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함.

Data Wrangler를 사용하여 이 데이터세트를 앞에서 설명한 형식으로 변환하려면 다음에서 데이터세트를 로드합니다. 아마존 단순 스토리지 서비스 (아마존 S3). 그런 다음 사용 시계열 변환 기준 그룹화, 다음 스크린샷과 같이 데이터를 CSV 형식으로 Amazon S3로 다시 내보냅니다.

Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함.

데이터 세트가 지정된 형식이면 Autopilot을 진행할 수 있습니다. Data Wrangler의 다른 시계열 변환기를 확인하려면 다음을 참조하십시오. Amazon SageMaker Data Wrangler로 시계열 데이터 준비.

AutoML 작업 시작

Autopilot에서 지원하는 다른 입력 유형과 마찬가지로 데이터 세트의 각 행은 다른 관찰이며 각 열은 기능입니다. 이 예에는 시계열 데이터가 포함된 단일 열이 있지만 여러 시계열 열이 있을 수 있습니다. 시계열, 텍스트 및 숫자와 같은 입력 유형이 다른 여러 열을 가질 수도 있습니다.

Autopilot 실험 만들기, 데이터 세트를 S3 버킷에 배치하고 내에서 새 실험을 생성합니다. 아마존 세이지 메이커 스튜디오. 다음 스크린샷과 같이 실험 이름, 데이터 세트의 S3 위치, 출력 아티팩트의 S3 위치, 예측할 열 이름을 지정해야 합니다.

Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함.

Autopilot은 데이터를 분석하고 ML 파이프라인을 생성하며 이 분류 작업에서 초매개변수 최적화의 기본 250회 반복을 실행합니다. 다음 모델 리더보드에서 볼 수 있듯이 Autopilot은 0.821의 정확도에 도달하며 단 한 번의 클릭으로 최고의 모델을 배포할 수 있습니다.

Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함.

또한 Autopilot은 데이터 탐색 보고서, 데이터를 시각화하고 탐색할 수 있습니다.

Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함.

투명성은 Autopilot의 기본입니다. 후보 정의 노트북 내에서 생성된 ML 파이프라인을 검사하고 수정할 수 있습니다. 다음 스크린샷은 Autopilot이 시계열 변환기를 결합하여 다양한 파이프라인을 권장하는 방법을 보여줍니다. TSFeatureExtractor 그래디언트 부스트 결정 트리 및 선형 모델과 같은 다양한 ML 알고리즘을 사용합니다. 그만큼 TSFeatureExtractor 수백 개의 시계열 기능을 추출한 다음 다운스트림 알고리즘에 제공하여 예측합니다. 시계열 기능의 전체 목록은 다음을 참조하십시오. 추출된 기능에 대한 개요.

Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함.

결론

이 게시물에서는 SageMaker Autopilot을 사용하여 단 몇 번의 클릭으로 시계열 분류 및 회귀 문제를 해결하는 방법을 시연했습니다.

자동 조종 장치에 대한 자세한 내용은 Amazon SageMaker 자동 조종 장치. SageMaker의 관련 기능을 탐색하려면 다음을 참조하십시오. Amazon SageMaker 데이터 랭글러.


저자에 관하여

Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함.니키타 이브킨 응용 과학자, Amazon SageMaker 데이터 랭글러입니다.

Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함.앤 밀버트 Amazon SageMaker Automatic Model Tuning에서 일하는 소프트웨어 개발 엔지니어입니다.

Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함.발레리오 페로네 Amazon SageMaker 자동 모델 조정 및 자동 조종 장치에서 일하는 응용 과학 관리자입니다.

Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함.메가나 사티시 Amazon SageMaker Automatic Model Tuning에서 일하는 소프트웨어 개발 엔지니어입니다.

Amazon SageMaker Autopilot은 이제 시계열 데이터 PlatoBlockchain Data Intelligence를 지원합니다. 수직 검색. 일체 포함. 알리 탁비리 AI/ML 전문 솔루션 아키텍트이며 기계 학습을 사용하여 AWS 클라우드에서 비즈니스 문제를 해결함으로써 고객을 돕습니다.

타임 스탬프 :

더보기 AWS 기계 학습