Amazon Forecast 시계열 예측 모델 배포 자동화

플라톤에 의해 재발행

팔로워 : 0

시계열 예측이란 시계열 데이터(시간에 따라 일정한 간격으로 수집되는 데이터)의 미래 값을 예측하는 과정을 말합니다. 시계열 예측을 위한 간단한 방법은 미래 값을 예측해야 하는 동일한 변수의 과거 값을 사용하는 반면 더 복잡한 기계 학습(ML) 기반 방법은 관련 변수의 시계열 데이터와 같은 추가 정보를 사용합니다.

아마존 예측 에서 사용하는 20년 이상의 예측 경험을 기반으로 하는 알고리즘을 포함하는 ML 기반 시계열 예측 서비스입니다. Amazon.com, Amazon에서 사용하는 것과 동일한 기술을 완전 관리형 서비스로 개발자에게 제공하여 리소스를 관리할 필요가 없습니다. Forecast는 ML을 사용하여 각 항목에 대한 최상의 알고리즘뿐만 아니라 각 항목에 대한 최상의 알고리즘 앙상블을 학습하여 데이터에 대한 최상의 모델을 자동으로 생성합니다.

이 게시물에서는 다음을 사용하여 코드 없이 반복적인 Forecast 워크로드(시계열 예측 워크로드)를 배포하는 방법을 설명합니다. AWS 클라우드 포메이션, AWS 단계 함수및 AWS 시스템 관리자. 여기에 제시된 방법은 시계열 예측 실험의 첫 날부터 시작하여 모델 배포를 통해 프로덕션으로 동일한 워크플로를 사용할 수 있는 파이프라인을 구축하는 데 도움이 됩니다.

Forecast를 사용한 시계열 예측

Forecast 워크플로에는 다음과 같은 공통 개념이 포함됩니다.

데이터세트 가져오기 – 예측에서 데이터 세트 그룹 데이터 세트, 스키마 및 함께 가는 예측 결과의 모음입니다. 각 데이터 세트 그룹은 최대 XNUMX개의 데이터 세트를 가질 수 있습니다. 데이터 세트 유형: 대상 시계열(TTS), 관련 시계열(RTS) 및 항목 메타데이터. 데이터 세트는 예측 작업과 관련된 데이터가 포함된 파일 모음입니다. 데이터 세트는 Forecast 내에 정의된 스키마를 준수해야 합니다. 자세한 내용은 다음을 참조하십시오. 데이터 세트 가져오기.
학습 예측기 - A 예언자 시계열 데이터를 기반으로 예측하는 데 사용되는 예측 훈련 모델입니다. 교육 중에 Forecast는 예측자를 평가하고 예측자를 사용하여 예측을 생성할지 여부를 결정하는 데 사용하는 정확도 지표를 계산합니다. 자세한 내용은 다음을 참조하십시오. 훈련 예측자.
예측 생성 – 그런 다음 훈련된 모델을 사용하여 미래 기간에 대한 예측을 생성할 수 있습니다. 예측 범위. Forecast는 다양한 지정된 Quantile에서 예측을 제공합니다. 예를 들어, 0.90 분위수에서의 예측은 시간의 90%에서 관측된 값보다 낮은 값을 추정합니다. 기본적으로 Forecast는 예측자 예측 유형에 대해 0.1(P10), 0.5(P50) 및 0.9(P90) 값을 사용합니다. 다양한 분위수에서의 예측은 일반적으로 예측 불확실성을 설명하기 위해 예측 간격(예측의 상한 및 하한)을 제공하는 데 사용됩니다.

Forecast에서 이 워크플로를 구현할 수 있습니다. AWS 관리 콘솔Walk Through California 프로그램, AWS 명령 줄 인터페이스 (AWS CLI)를 통해 Python 노트북을 사용한 API 호출, 또는 자동화 솔루션을 통해. 그만큼 콘솔 및 AWS CLI 방법은 데이터를 사용하여 시계열 예측의 타당성을 확인하기 위한 빠른 실험에 가장 적합합니다. Python 노트북 방법은 Jupyter 노트북 및 코딩에 이미 익숙한 데이터 과학자에게 적합하며 최대 제어 및 튜닝을 제공합니다. 그러나 노트북 기반 방식은 운영이 어렵다. 당사의 자동화 접근 방식은 신속한 실험을 촉진하고 반복 작업을 제거하며 다양한 환경(개발, 스테이징, 프로덕션) 간에 보다 쉽게 전환할 수 있도록 합니다.

이 게시물에서는 자신의 데이터를 사용할 수 있고 실험의 첫 날부터 배포에 이르기까지 예측 솔루션 개발의 전체 수명 주기 동안 원활하게 사용할 수 있는 단일 워크플로를 제공하는 Forecast 사용에 대한 자동화 접근 방식을 설명합니다. 생산 환경에서 솔루션의

솔루션 개요

다음 섹션에서는 Forecast를 사용하여 시계열 예측 모델을 자동으로 배포하기 위해 따라야 할 템플릿 역할을 하는 전체 종단 간 워크플로에 대해 설명합니다. 이 워크플로우는 오픈 소스 입력 데이터 세트에서 예측 데이터 포인트를 생성합니다. 그러나 이 게시물에 설명된 단계에 따라 데이터 형식을 지정할 수 있는 한 자신의 데이터에 대해 동일한 워크플로를 사용할 수 있습니다. 데이터를 업로드한 후 예측 데이터 세트 그룹을 생성하고, 데이터를 가져오고, ML 모델을 교육하고, 원시 데이터에서 미래의 보이지 않는 시간대에 대한 예측 데이터 포인트를 생성하는 단계를 안내합니다. 이 모든 것은 코드를 작성하거나 컴파일하지 않고도 가능합니다.

다음 다이어그램은 예측 워크플로우를 보여줍니다.

순환 예측 워크플로우

이 솔루션은 종속성 템플릿과 워크로드 템플릿이라는 두 가지 CloudFormation 템플릿을 사용하여 배포됩니다. CloudFormation을 사용하면 배포할 리소스를 설명하는 템플릿을 사용하여 예측 가능하고 반복적으로 AWS 인프라 배포를 수행할 수 있습니다. 배포된 템플릿을 스택. 제공된 두 템플릿에서 솔루션의 인프라 정의를 처리했습니다. 종속성 템플릿은 다음과 같이 워크로드 템플릿에서 사용하는 필수 리소스를 정의합니다. 아마존 단순 스토리지 서비스 (Amazon S3) 객체 스토리지용 버킷 및 AWS 자격 증명 및 액세스 관리 (IAM) AWS API 작업에 대한 권한. 종속성 템플릿에 정의된 리소스는 여러 워크로드 템플릿에서 공유할 수 있습니다. 워크로드 템플릿은 데이터 수집, 예측기 교육 및 예측 생성에 사용되는 리소스를 정의합니다.

배포 워크플로

종속성 CloudFormation 템플릿 배포

먼저 종속성 템플릿을 배포하여 필수 리소스를 생성해 보겠습니다. 종속성 템플릿은 선택적 S3 버킷을 배포합니다. AWS 람다 기능 및 IAM 역할. Amazon S3는 저비용, 고가용성, 복원력을 갖춘 객체 스토리지 서비스입니다. 이 솔루션에서 S3 버킷을 사용하여 소스 데이터를 저장하고 워크플로를 트리거하여 결과를 예측합니다. Lambda는 서버를 프로비저닝하거나 관리하지 않고도 코드를 실행할 수 있는 서버리스 이벤트 기반 컴퓨팅 서비스입니다. 종속성 템플릿에는 Forecast에서 데이터 세트 그룹을 생성하고 버킷을 삭제하기 전에 S3 버킷 내의 객체를 제거하는 등의 작업을 수행하는 기능이 포함되어 있습니다. IAM 역할은 사용자 및 서비스에 대한 AWS 내 권한을 정의합니다. 종속성 템플릿은 Lambda에서 사용할 역할과 데이터 수집 및 처리 작업을 조정하는 워크플로우 관리 서비스인 Step Functions용 역할과 Forecast를 사용한 예측기 교육 및 추론을 배포합니다.

종속성 템플릿을 배포하려면 다음 단계를 완료하세요.

콘솔에서 원하는 항목을 선택합니다. Forecast에서 지원하는 지역 솔루션 배포용.
AWS CloudFormation 콘솔에서 스택 탐색 창에서
왼쪽 메뉴에서 스택 생성 선택하고 새로운 리소스 사용(표준).
럭셔리 템플릿 소스, 고르다 아마존 S3 URL.
템플릿 URL 입력: https://amazon-forecast-samples.s3.us-west-2.amazonaws.com/ml_ops/forecast-mlops-dependency.yaml.
왼쪽 메뉴에서 다음 보기.
럭셔리 스택 이름, 입력 forecast-mlops-dependency.
$XNUMX Million 미만 파라미터, 기존 S3 버킷을 사용하거나 새 버킷을 생성하도록 선택한 다음 버킷 이름을 제공합니다.
왼쪽 메뉴에서 다음 보기.
왼쪽 메뉴에서 다음 보기 기본 스택 옵션을 수락합니다.
스택이 IAM 리소스를 생성함을 확인하는 확인란을 선택한 다음 스택 생성 템플릿을 배포합니다.

템플릿 배포가 다음과 같이 표시되어야 합니다. forecast-mlops-dependency 스택. 상태가 다음으로 변경되면 CREATE_COMPLETE, 다음 단계로 이동할 수 있습니다.

워크로드 CloudFormation 템플릿 배포

다음으로 워크로드 템플릿을 배포하여 필수 리소스를 생성해 보겠습니다. 워크로드 템플릿은 워크플로 관리를 위해 Step Functions 상태 시스템을 배포합니다. AWS Systems Manager 파라미터 스토어 AWS CloudFormation의 매개변수 값을 저장하고 워크플로, 아마존 단순 알림 서비스 (Amazon SNS) 워크플로 알림을 위한 주제 및 워크플로 서비스 권한을 위한 IAM 역할.

이 솔루션은 XNUMX개의 상태 시스템을 생성합니다.

CreateDatasetGroupStateMachine – 가져올 데이터에 대한 Forecast 데이터 세트 그룹을 생성합니다.
CreateImportDatasetStateMachine – 교육을 위해 Amazon S3에서 데이터 세트 그룹으로 소스 데이터를 가져옵니다.
CreateForecastState머신 – 예측자를 교육하고 예측을 생성하는 데 필요한 작업을 관리합니다.
Athena커넥터상태기계 – 다음을 사용하여 SQL 쿼리를 작성할 수 있습니다. 아마존 아테나 Amazon S3에 데이터를 저장하는 커넥터. Amazon S3에 파일을 수동으로 배치하는 대신 Athena를 사용하여 Forecast에 필요한 형식으로 기록 데이터를 가져오는 선택적 프로세스입니다.
StepFunctionWorkflowStateMachine – Coordinates는 다른 XNUMX개의 상태 시스템을 호출하고 전체 워크플로우를 관리합니다.

Systems Manager의 기능인 Parameter Store는 안전한 계층적 스토리지와 구성 데이터 관리 및 비밀 관리의 프로그래밍 방식 검색을 제공합니다. Parameter Store는 워크로드 스택에 설정된 매개변수와 워크플로에서 사용하는 기타 매개변수를 저장하는 데 사용됩니다.

워크로드 템플릿을 배포하려면 다음 단계를 완료하세요.

AWS CloudFormation 콘솔에서 스택 탐색 창에서
왼쪽 메뉴에서 스택 생성 선택하고 새로운 리소스 사용(표준).
럭셔리 템플릿 소스, 고르다 아마존 S3 URL.
템플릿 URL 입력: https://amazon-forecast-samples.s3.us-west-2.amazonaws.com/ml_ops/forecast-mlops-solution-guidance.yaml.
왼쪽 메뉴에서 다음 보기.
럭셔리 스택 이름이름을 입력하십시오.
기본값을 승인하거나 매개변수를 수정하십시오.

다음에 대한 종속성 스택의 S3 버킷 이름을 입력해야 합니다. S3 버킷 유효한 이메일 주소 SNS엔드포인트 기본 매개변수 값을 수락하는 경우에도 마찬가지입니다.

다음 표에서는 각 매개변수에 대해 설명합니다.

매개 변수	상품 설명	더 알아보기
`DatasetGroupFrequencyRTS`	RTS 데이터 세트에 대한 데이터 수집 빈도입니다.	.
`DatasetGroupFrequencyTTS`	TTS 데이터 세트에 대한 데이터 수집 빈도입니다.	.
`DatasetGroupName`	자체 포함 워크로드인 데이터 세트 그룹의 짧은 이름입니다.	데이터 세트 그룹 생성
`DatasetIncludeItem`	이 사용 사례에 대한 항목 메타데이터를 제공할지 여부를 지정합니다.	.
`DatasetIncludeRTS`	이 사용 사례에 대한 관련 시계열을 제공할지 여부를 지정합니다.	.
`ForecastForecastTypes`	CreateForecast 작업이 실행되면 예측을 생성할 분위수를 선언합니다. 이 배열에서 최대 XNUMX개의 값을 선택할 수 있습니다. 필요에 따라 값을 포함하도록 이 값을 편집합니다.	예측 생성
`PredictorAttributeConfigs`	TTS의 대상 변수와 RTS 데이터 세트의 각 숫자 필드에 대해 각 항목의 각 시간 간격에 대해 레코드를 생성해야 합니다. 이 구성은 누락된 레코드를 채우는 방법(0, NaN 등)을 결정하는 데 도움이 됩니다. 0 대신 NaN을 사용하여 TTS의 간격을 채우는 것이 좋습니다. 0을 사용하면 모델이 예측을 0으로 치우치도록 잘못 학습할 수 있습니다. NaN은 지침이 제공되는 방식입니다. 이에 대한 질문이 있으면 AWS Solutions Architect에게 문의하십시오.	자동예측기 생성
`PredictorExplainPredictor`	유효한 값은 TRUE 또는 FALSE입니다. 이는 예측자에 대해 설명 가능성이 활성화되었는지 여부를 결정합니다. 이는 RTS 및 항목 메타데이터의 값이 모델에 미치는 영향을 이해하는 데 도움이 될 수 있습니다.	설명 가능성
`PredictorForecastDimensions`	항목보다 더 세밀하게 예측할 수 있습니다. 여기에서 위치, 비용 센터 또는 필요에 따라 차원을 지정할 수 있습니다. 이는 RTS 및 TTS의 치수와 일치해야 합니다. 치수가 없는 경우 올바른 매개변수는 null이며 그 자체는 모두 소문자입니다. null은 차원에 대한 매개변수가 없음을 시스템에 알리는 예약어입니다.	자동예측기 생성
`PredictorForecastFrequency`	매일, 매주 또는 매월과 같이 모델 및 예측이 생성되는 시간 척도를 정의합니다. 드롭다운 메뉴는 허용되는 값을 선택하는 데 도움이 됩니다. RTS를 사용하는 경우 RTS 시간 척도와 일치해야 합니다.	자동예측기 생성
`PredictorForecastHorizon`	모델이 예측하는 시간 단계의 수입니다. 예측 범위는 다음과 같이 불립니다. 예측 길이.	자동예측기 생성
`PredictorForecastOptimizationMetric`	예측자를 최적화하는 데 사용되는 정확도 메트릭을 정의합니다. 드롭다운 메뉴는 과대 또는 과소 예측에 대한 가중 분위수 손실 균형을 선택하는 데 도움이 됩니다. RMSE는 단위와 관련이 있고 WAPE/MAPE는 백분율 오류와 관련이 있습니다.	자동예측기 생성
`PredictorForecastTypes`	때 `CreateAutoPredictor` 작업이 실행되면 예측 지점을 훈련하는 데 사용되는 분위수를 선언합니다. 이 배열에서 최대 XNUMX개의 값을 선택하여 초과 및 과소 예측의 균형을 맞출 수 있습니다. 필요에 따라 값을 포함하도록 이 값을 편집합니다.	자동예측기 생성
`S3Bucket`	이 워크로드에 대해 입력 데이터 및 출력 데이터가 기록되는 S3 버킷의 이름입니다.	.
`SNSEndpoint`	예측자 및 예측 작업이 완료될 때 알림을 받을 유효한 이메일 주소입니다.	.
`SchemaITEM`	이는 항목 메타데이터 데이터 세트의 물리적 순서, 열 이름 및 데이터 유형을 정의합니다. 솔루션 예제에서 제공되는 선택적 파일입니다.	데이터세트 생성
`SchemaRTS`	이는 RTS 데이터세트의 물리적 순서, 열 이름 및 데이터 유형을 정의합니다. 치수는 TTS와 일치해야 합니다. 이 파일의 시간 단위는 예측이 이루어질 수 있는 시간 단위를 제어합니다. 솔루션 예제에서 제공되는 선택적 파일입니다.	데이터세트 생성
`SchemaTTS`	이것은 유일한 필수 데이터 세트인 TTS 데이터 세트의 물리적 순서, 열 이름 및 데이터 유형을 정의합니다. 파일에는 최소한 대상 값, 타임스탬프 및 항목이 포함되어야 합니다.	데이터세트 생성
`TimestampFormatRTS`	RTS 파일에 제공된 타임스탬프 형식을 정의합니다.	데이터세트가져오기작업 만들기
`TimestampFormatTTS`	TTS 파일에 제공된 타임스탬프 형식을 정의합니다.	데이터세트가져오기작업 만들기

왼쪽 메뉴에서 다음 보기 기본 스택 옵션을 수락합니다.
스택이 IAM 리소스를 생성함을 확인하는 확인란을 선택한 다음 스택 생성 템플릿을 배포합니다.

이전에 선택한 스택 이름으로 템플릿 배포가 표시되어야 합니다. 상태가 다음으로 변경되면 CREATE_COMPLETE, 데이터 업로드 단계로 이동할 수 있습니다.

데이터 업로드

이전 섹션에서 스택 이름과 S3 버킷을 제공했습니다. 이 섹션에서는 공개적으로 사용 가능한 데이터 세트를 저장하는 방법을 설명합니다. 식량 수요 이 양동이에. 자체 데이터세트를 사용하는 경우 다음을 참조하세요. 데이터 세트 배포가 예상하는 형식으로 데이터 세트를 준비합니다. 데이터 세트에는 최소한 대상 시계열과 선택적으로 관련 시계열 및 항목 메타데이터가 포함되어야 합니다.

TTS는 예측을 생성하려는 필드를 포함하는 시계열 데이터입니다. 이 필드는 대상 필드
RTS는 대상 필드를 포함하지 않지만 관련 필드를 포함하는 시계열 데이터입니다.
항목 데이터 파일은 시계열 데이터가 아니지만 TTS 또는 RTS 데이터 세트의 항목에 대한 메타데이터 정보를 포함합니다.

다음 단계를 완료하십시오.

제공된 샘플 데이터세트를 사용하는 경우 데이터세트를 다운로드합니다. 식량 수요 컴퓨터에 다운로드하고 파일의 압축을 풉니다. 그러면 XNUMX개의 디렉터리 내에 XNUMX개의 파일이 생성됩니다(rts, tts, item).
Amazon S3 콘솔에서 이전에 생성한 버킷으로 이동합니다.
왼쪽 메뉴에서 폴더 만들기.
폴더 이름에는 워크로드 스택 이름과 동일한 문자열을 사용하십시오.
왼쪽 메뉴에서 가이드라가.
세 개의 데이터 세트 폴더를 선택한 다음 가이드라가.

업로드가 완료되면 다음 스크린샷과 같은 내용이 표시됩니다. 이 예에서 폴더는 aiml42. S3 폴더 구조

Forecast 데이터 세트 그룹 생성

이 섹션의 단계를 완료하여 각 워크로드에 대한 일회성 이벤트로 데이터 세트 그룹을 생성합니다. 앞으로 매일, 매주 등의 일정에 따라 데이터 가져오기 실행, 예측 변수 생성, 예측 단계 생성을 시리즈로 적절하게 계획해야 합니다.

Step Functions 콘솔에서 다음을 포함하는 상태 시스템을 찾습니다. Create-Dataset-Group.
상태 시스템 세부 정보 페이지에서 다음을 선택합니다. 실행 시작.
왼쪽 메뉴에서 실행 시작 다시 확인하십시오.

상태 시스템을 실행하는 데 약 1분이 걸립니다. 완료되면 아래 값이 실행 상태 부터 변경해야 합니다 달리는 에 성공

Forecast로 데이터 가져오기

이 섹션의 단계에 따라 S3 버킷에 업로드한 데이터 세트를 데이터 세트 그룹으로 가져옵니다.

Step Functions 콘솔에서 다음을 포함하는 상태 시스템을 찾습니다. Import-Dataset.
상태 시스템 세부 정보 페이지에서 다음을 선택합니다. 실행 시작.
왼쪽 메뉴에서 실행 시작 다시 확인하십시오.

상태 시스템을 실행하는 데 걸리는 시간은 처리 중인 데이터 세트에 따라 다릅니다.

그래프 검사기

이것이 실행되는 동안 브라우저에서 다른 탭을 열고 Forecast 콘솔로 이동합니다.
Forecast 콘솔에서 데이터세트 그룹 보기 이름이 지정된 데이터 세트 그룹으로 이동합니다. DataGroupName 워크로드 스택에서
왼쪽 메뉴에서 데이터세트 보기.

진행 중인 데이터 가져오기가 표시되어야 합니다.

데이터 가져오기 진행 중

상태 머신이 Import-Dataset 완료되면 다음 단계로 진행하여 시계열 데이터 모델을 구축할 수 있습니다.

AutoPredictor 만들기(시계열 모델 교육)

이 섹션에서는 Forecast를 사용하여 초기 예측 변수를 교육하는 방법을 설명합니다. 새 예측기(첫 번째 기준 예측기)를 만들거나 매일, 매주 등의 각 생산 주기 동안 예측기를 재훈련하도록 선택할 수 있습니다. 또한 매 주기마다 예측 변수를 생성하지 않도록 선택하고 예측 변수 모니터링을 통해 예측 변수를 생성해야 할 때 안내를 받을 수도 있습니다. 다음 그림은 생산 준비가 완료된 Forecast 예측자를 생성하는 프로세스를 시각화합니다.

생산 준비 예측기 워크플로

새 예측자를 만들려면 다음 단계를 완료하세요.

Step Functions 콘솔에서 다음을 포함하는 상태 시스템을 찾습니다. Create-Predictor.
상태 시스템 세부 정보 페이지에서 다음을 선택합니다. 실행 시작.
왼쪽 메뉴에서 실행 시작 다시 확인하십시오.
실행 시간은 처리 중인 데이터 세트에 따라 달라질 수 있습니다. 완료하는 데 최대 XNUMX시간 이상이 소요될 수 있습니다.
이것이 실행되는 동안 브라우저에서 다른 탭을 열고 Forecast 콘솔로 이동합니다.
Forecast 콘솔에서 데이터세트 그룹 보기 이름이 지정된 데이터 세트 그룹으로 이동합니다. DataGroupName 워크로드 스택에서
왼쪽 메뉴에서 예측 변수 보기.

진행 중인 예측자 훈련이 표시되어야 합니다(훈련 상태는 "진행 중 만들기..."로 표시됨).

데이터 가져오기 진행 중

상태 머신이 Create-Predictor 완료되면 성능을 평가할 수 있습니다.

상태 시스템의 일부로 시스템은 예측자를 생성하고 BacktestExport 시계열 수준 예측 지표를 Amazon S3에 기록하는 작업입니다. 이들은 아래 두 개의 S3 폴더에 있는 파일입니다. backtest-export 폴더 :

정확도 메트릭 값 – 단일 시계열의 성능을 이해할 수 있도록 항목 수준 정확도 메트릭 계산을 제공합니다. 이를 통해 글로벌 메트릭에만 집중하는 대신 스프레드를 조사할 수 있습니다.
예상 값 – 백 테스트 창에서 각 시계열에 대한 단계별 예측을 제공합니다. 이를 통해 홀드아웃 테스트 세트의 실제 대상 값을 예측 분위수 값과 비교할 수 있습니다. 이를 검토하면 RTS 또는 항목 메타데이터에 추가 데이터 기능을 제공하여 미래 가치를 더 잘 예측하고 손실을 줄이는 방법에 대한 아이디어를 공식화하는 데 도움이 됩니다. 당신은 다운로드 할 수 있습니다 backtest-export Amazon S3에서 파일을 가져오거나 Athena를 사용하여 제자리에서 쿼리합니다.

S3 버킷 콘텐츠

자체 데이터를 사용하여 예측 결과를 면밀히 검사하고 백 테스트 내보내기 데이터를 사용하여 메트릭이 예상 결과를 충족하는지 확인해야 합니다. 만족하면 다음 섹션에 설명된 대로 미래 예측 생성을 시작할 수 있습니다.

예측 생성(미래 시간대에 대한 추론)

이 섹션에서는 Forecast를 사용하여 예측 데이터 요소를 생성하는 방법에 대해 설명합니다. 앞으로 소스 시스템에서 새 데이터를 수집하고 데이터를 Forecast로 가져온 다음 예측 데이터 포인트를 생성해야 합니다. 선택적으로 가져오기 후와 예측 전에 새 예측 변수 생성을 삽입할 수도 있습니다. 다음 그림은 Forecast를 사용하여 생산 시계열 예측을 생성하는 프로세스를 시각화합니다.

생산 시계열 예측 워크플로우

다음 단계를 완료하십시오.

Step Functions 콘솔에서 다음을 포함하는 상태 시스템을 찾습니다. Create-Forecast.
상태 시스템 세부 정보 페이지에서 다음을 선택합니다. 실행 시작.
왼쪽 메뉴에서 실행 시작 다시 확인하십시오.
시스템이 예측을 생성하도록 구성되지 않았기 때문에 이 상태 시스템은 매우 빠르게 완료됩니다. 추론을 위해 어떤 예측 모델을 승인했는지 알 수 없습니다.
학습된 예측자를 사용하도록 시스템을 구성해 보겠습니다.
Forecast 콘솔에서 예측자의 ARN을 찾습니다.
이후 단계에서 사용할 ARN을 복사합니다.
브라우저에서 다른 탭을 열고 Systems Manager 콘솔로 이동합니다.
Systems Manager 콘솔에서 다음을 선택합니다. 파라미터 저장소 탐색 창에서
스택과 관련된 매개변수를 찾습니다(/forecast/<StackName>/Forecast/PredictorArn).
예측기에 대해 복사한 ARN을 입력합니다.
훈련된 예측 변수를 Forecast의 추론 기능과 연결하는 방법입니다.
매개변수 찾기 /forecast/<StackName>/Forecast/Generate 값을 편집하고 FALSE 과 TRUE.
이제 이 데이터 세트 그룹에 대한 예측 작업을 실행할 준비가 되었습니다.
Step Functions 콘솔에서 다음을 실행합니다. Create-Forecast 상태 머신.

이번에는 작업이 예상대로 실행됩니다. 상태 시스템의 일부로 시스템은 예측 및 ForecastExport 시계열 예측을 Amazon S3에 기록하는 작업. 이러한 파일은 다음 위치에 있습니다. forecast 폴더

예측 폴더 내용

내부 forecast 폴더에서 선택 항목에 따라 많은 CSV 또는 Parquet 파일에 있는 항목에 대한 예측을 찾을 수 있습니다. 각 시간 단계 및 선택한 시계열에 대한 예측은 레코드당 선택한 모든 분위수 값과 함께 존재합니다. Amazon S3에서 이러한 파일을 다운로드하거나 Athena를 사용하여 해당 위치에서 쿼리하거나 다른 전략을 선택하여 데이터를 사용할 수 있습니다.

이것으로 전체 워크플로를 마무리합니다. 이제 다음과 같이 선택한 시각화 도구를 사용하여 출력을 시각화할 수 있습니다. 아마존 퀵 사이트. 또는 데이터 과학자는 팬더를 사용하여 자체 플롯을 생성할 수 있습니다. QuickSight를 사용하기로 선택한 경우 다음을 수행할 수 있습니다. 예측 결과를 QuickSight에 연결 데이터 변환을 수행하고, 하나 이상의 데이터 분석을 만들고, 시각화 만들기.

이 프로세스는 따라야 할 템플릿을 제공합니다. 샘플을 스키마에 맞게 조정하고 사용 사례에 따라 예측 범위, 시간 해상도 등을 설정해야 합니다. 또한 소스 시스템에서 데이터를 수집하고 데이터를 가져오고 예측을 생성하는 반복 일정을 설정해야 합니다. 원하는 경우 가져오기 단계와 예측 단계 사이에 예측자 작업을 삽입할 수 있습니다.

예측기 다시 훈련

우리는 새로운 예측자를 교육하는 과정을 살펴보았지만 예측자를 재교육하는 것은 어떻습니까? 예측기 재훈련은 사용 가능한 최신 데이터에 대한 예측기 훈련과 관련된 비용과 시간을 줄이는 한 가지 방법입니다. 새 예측자를 생성하고 전체 데이터 세트에서 훈련하는 대신 예측자가 마지막으로 훈련된 이후 사용 가능한 새로운 증분 데이터만 제공하여 기존 예측자를 재훈련할 수 있습니다. 자동화 솔루션을 사용하여 예측자를 재교육하는 방법을 살펴보겠습니다.

Forecast 콘솔에서 데이터세트 그룹 보기.
재교육하려는 예측자와 연결된 데이터 세트 그룹을 선택합니다.
왼쪽 메뉴에서 예측 변수 보기을 클릭한 다음 재교육하려는 예측 변수를 선택합니다.
에 설정 탭에서 예측기 ARN을 복사합니다.
재교육할 예측자를 식별하기 위해 워크플로우에서 사용하는 매개변수를 업데이트해야 합니다.
Systems Manager 콘솔에서 다음을 선택합니다. 파라미터 저장소 탐색 창에서
매개변수 찾기 /forecast/<STACKNAME>/Forecast/Predictor/ReferenceArn.
매개변수 세부 정보 페이지에서 다음을 선택합니다. 편집.
럭셔리 가치관, 예측기 ARN을 입력합니다.
이것은 재교육할 워크플로에 대한 올바른 예측 변수를 식별합니다. 다음으로 훈련 전략을 변경하기 위해 워크플로에서 사용하는 매개변수를 업데이트해야 합니다.
매개변수 찾기 /forecast/<STACKNAME>/Forecast/Predictor/Strategy.
파라미터 세부 정보 페이지에서 편집을 선택합니다.
값에 다음을 입력합니다. RETRAIN.
워크플로는 기본적으로 새 예측자를 교육합니다. 그러나 이 값을 NONE. 데이터가 비교적 안정적이거나 자동 예측기 모니터링 재교육이 필요한 시기를 결정합니다.
증분 교육 데이터를 S3 버킷에 업로드합니다.
Step Functions 콘솔에서 상태 시스템을 찾습니다. <STACKNAME>-Create-Predictor.
상태 시스템 세부 정보 페이지에서 다음을 선택합니다. 실행 시작 재교육을 시작합니다.

재교육이 완료되면 워크플로가 종료되고 워크로드 템플릿 매개변수에 제공된 이메일 주소로 SNS 이메일 알림을 받게 됩니다.

정리

이 솔루션을 완료하면 이 섹션의 단계에 따라 관련 리소스를 삭제합니다.

S3 버킷 삭제

Amazon S3 콘솔에서 버킷 탐색 창에서
데이터가 업로드된 버킷을 선택하고 빈 소스 데이터를 포함하여 솔루션과 관련된 모든 데이터를 삭제합니다.
엔터 버튼 permanently delete 버킷 내용을 영구적으로 삭제합니다.
에 버킷 페이지에서 버킷을 선택하고 ..
버킷 이름을 입력하여 삭제를 확인하고 선택 버킷 삭제.

예측 리소스 삭제

Forecast 콘솔에서 데이터세트 그룹 보기.
솔루션과 연결된 데이터 세트 그룹 이름을 선택한 다음 ..
엔터 버튼 delete 데이터 세트 그룹 및 관련 예측자, 예측자 백테스트 내보내기 작업, 예측 및 예측 내보내기 작업을 삭제합니다.
왼쪽 메뉴에서 . 확인.

CloudFormation 스택 삭제

AWS CloudFormation 콘솔에서 스택 탐색 창에서
워크로드 스택을 선택하고 ..
왼쪽 메뉴에서 스택 삭제 스택 및 모든 관련 리소스의 삭제를 확인합니다.
삭제가 완료되면 종속성 스택을 선택하고 ..
왼쪽 메뉴에서 . 확인.

결론

이 게시물에서는 Forecast 사용을 시작하는 몇 가지 다른 방법에 대해 논의했습니다. 인프라 지식이 거의 필요 없이 데이터 수집에서 추론까지 Forecast 파이프라인의 신속하고 반복 가능한 솔루션 배포를 위해 AWS CloudFormation 기반의 자동화된 예측 솔루션을 살펴보았습니다. 마지막으로 Lambda를 사용하여 모델 재교육을 자동화하여 비용과 교육 시간을 줄이는 방법을 살펴보았습니다.

Forecast로 예측을 시작하기에 지금보다 더 좋은 때는 없습니다. 자동화된 워크플로 구축 및 배포를 시작하려면 다음을 방문하십시오. Amazon Forecast 리소스. 행복한 예측!

저자에 관하여

Amazon Forecast 시계열 예측 모델 PlatoBlockchain 데이터 인텔리전스 배포를 자동화합니다. 수직 검색. 일체 포함. 아론 페이건 뉴욕에 본사를 둔 AWS의 수석 전문 솔루션 아키텍트입니다. 그는 고객이 머신 러닝 및 클라우드 보안 솔루션을 설계하도록 돕는 일을 전문으로 합니다.

Amazon Forecast 시계열 예측 모델 PlatoBlockchain 데이터 인텔리전스 배포를 자동화합니다. 수직 검색. 일체 포함. 라주 파틸 AWS Professional Services의 데이터 과학자입니다. 그는 AWS 고객이 비즈니스 문제를 극복할 수 있도록 AI/ML 솔루션을 구축하고 배포합니다. 그의 AWS 계약은 컴퓨터 비전, 시계열 예측, 예측 분석 등과 같은 광범위한 AI/ML 사용 사례를 금융 서비스, 통신, 의료 등을 포함한 수많은 산업에서 다루었습니다. 그 전에는 광고 기술에서 데이터 과학 팀을 이끌었고 컴퓨터 비전 및 로봇 공학의 수많은 연구 및 개발 이니셔티브에 크게 기여했습니다. 업무 외에는 사진, 하이킹, 여행, 요리 탐험을 즐깁니다.

SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
PlatoAiStream. Web3 데이터 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
미래 만들기 w Adryenn Ashley. 여기에서 액세스하십시오.
PREIPO®로 PRE-IPO 회사의 주식을 사고 팔 수 있습니다. 여기에서 액세스하십시오.
출처: https://aws.amazon.com/blogs/machine-learning/automate-the-deployment-of-an-amazon-forecast-time-series-forecasting-model/

타임 스탬프 : 2023 년 5 월 4 일

타임 스탬프 : 24년 2022월 XNUMX일

플라톤에 의해 재발행

Amazon Personalize, 더 짧은 지연 시간으로 더 큰 항목 카탈로그를 지원하는 새로운 레시피 출시 | 아마존 웹 서비스

Amazon SageMaker Canvas에서 Llama 2 및 Mistral 모델과 스트리밍 응답에 대한 지원 발표 | 아마존 웹 서비스

Amazon SageMaker Canvas 및 Amazon QuickSight로 지능적인 의사 결정 지원

Amazon SageMaker Data Wrangler를 사용하여 기계 학습을 위해 Amazon EMR에서 데이터 준비

Amazon SageMaker 내장 테이블 형식 알고리즘 LightGBM, CatBoost, TabTransformer 및 AutoGluon-Tabular를 사용한 이탈 예측

서버리스 추론 엔드포인트에 Amazon SageMaker Autopilot 모델 배포

Amazon SageMaker 내장 LightGBM은 이제 Dask를 사용하여 분산 교육을 제공합니다.

Amazon SageMaker를 사용하여 사용자 지정 앙상블을 효율적으로 훈련, 조정 및 배포 | 아마존 웹 서비스

Amazon Forecast로 예측할 특정 시계열 선택

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정