Carrier가 AWS Glue 및 Amazon SageMaker를 사용하여 HVAC 결함을 예측하는 방법 | 아마존 웹 서비스

Carrier가 AWS Glue 및 Amazon SageMaker를 사용하여 HVAC 결함을 예측하는 방법 | 아마존 웹 서비스

“1902년 윌리스 캐리어(Willis Carrier)는 현대식 에어컨을 통해 실내 환경을 제어하는 ​​인류의 가장 어려운 과제 중 하나를 해결했습니다. 오늘날 캐리어 제품은 편안한 환경을 만들고, 전 세계 식량 공급을 보호하며, 까다로운 조건에서 필수 의료 용품을 안전하게 운송할 수 있게 해줍니다.”

At 반송파, 우리 성공의 기반은 고객이 일년 내내 편안하고 안전하게 사용할 수 있도록 신뢰할 수 있는 제품을 만드는 것입니다. 기후 변화로 인해 극한의 온도가 점점 더 일반화됨에 따라 높은 신뢰성과 낮은 장비 가동 중지 시간이 점점 더 중요해지고 있습니다. 우리는 지금까지 엔지니어링 팀에서 정의한 매개변수를 사용하여 비정상적인 장비 동작을 경고하는 임계값 기반 시스템에 의존해 왔습니다. 이러한 시스템은 효과적이지만 장비 문제를 예측하기보다는 식별하고 진단하는 데 목적이 있습니다. 결함이 발생하기 전에 예측하면 HVAC 딜러가 문제를 사전에 해결하고 고객 경험을 개선할 수 있습니다.

장비 신뢰성 향상을 위해 당사는 아마존 머신 러닝 솔루션 랩 고장이 발생하기 전에 장비 문제를 예측할 수 있는 맞춤형 기계 학습(ML) 모델을 개발합니다. 우리 팀은 50TB가 넘는 과거 센서 데이터를 처리하고 91%의 정밀도로 오류를 예측하기 위한 프레임워크를 개발했습니다. 이제 장비 고장이 임박했음을 딜러에게 알릴 수 있으므로 딜러는 검사 일정을 예약하고 장치 가동 중지 시간을 최소화할 수 있습니다. 솔루션 프레임워크는 더 많은 장비가 설치됨에 따라 확장 가능하며 다양한 다운스트림 모델링 작업에 재사용될 수 있습니다.

이 게시물에서는 Carrier와 AWS 팀이 ML을 적용하여 단일 모델을 사용하여 대규모 장비 전체의 결함을 예측하는 방법을 보여줍니다. 먼저 사용 방법을 강조합니다. AWS 접착제 고도의 병렬 데이터 처리를 위한 것입니다. 그런 다음 방법을 논의합니다. 아마존 세이지 메이커 기능 엔지니어링과 확장 가능한 감독 딥 러닝 모델 구축에 도움이 됩니다.

사용 사례, 목표, 위험 개요

이 프로젝트의 주요 목표는 임박한 장비 고장을 예측하고 딜러에게 통보하여 가동 중지 시간을 줄이는 것입니다. 이를 통해 딜러는 사전에 유지 관리 일정을 계획하고 탁월한 고객 서비스를 제공할 수 있습니다. 우리는 이 솔루션을 작업할 때 세 가지 주요 과제에 직면했습니다.

  • 데이터 확장성 – 데이터 처리 및 특징 추출은 대규모로 증가하는 과거 센서 데이터 전반에 걸쳐 확장되어야 합니다.
  • 모델 확장성 – 모델링 접근 방식은 10,000개 이상의 단위로 확장할 수 있어야 합니다.
  • 모델 정밀도 – 불필요한 유지보수 검사를 피하기 위해 낮은 오탐률이 필요합니다.

데이터 및 모델링 관점 모두에서 확장성은 이 솔루션의 핵심 요구 사항입니다. 우리는 50TB가 넘는 과거 장비 데이터를 보유하고 있으며 더 많은 HVAC 장치가 클라우드에 연결됨에 따라 이 데이터가 빠르게 증가할 것으로 예상합니다. 데이터 처리 및 모델 추론은 데이터가 증가함에 따라 확장되어야 합니다. 모델링 접근 방식을 10,000개 이상의 장치로 확장하려면 단일 장치에 대한 변칙적인 판독값에 의존하기보다는 여러 장비에서 학습할 수 있는 모델이 필요합니다. 이를 통해 단위 전체에 걸쳐 일반화가 가능하고 단일 모델을 호스팅하여 추론 비용을 줄일 수 있습니다.

이 사용 사례에 대한 또 다른 우려 사항은 잘못된 경보를 유발하는 것입니다. 이는 딜러나 기술자가 현장에 가서 고객의 장비를 검사하고 모든 것이 적절하게 작동하는지 찾는다는 것을 의미합니다. 이 솔루션에는 딜러가 경고를 받을 때 장비가 고장날 가능성이 있음을 보장하는 고정밀 모델이 필요합니다. 이를 통해 딜러, 기술자, 주택 소유자 모두의 신뢰를 얻고 불필요한 현장 검사와 관련된 비용을 줄일 수 있습니다.

우리는 14주간의 개발 노력을 위해 Amazon ML Solutions Lab의 AI/ML 전문가와 협력했습니다. 결국 우리 솔루션에는 두 가지 주요 구성 요소가 포함됩니다. 첫 번째는 장비 동작을 요약하고 효율적인 다운스트림 처리를 위해 훈련 데이터의 크기를 줄이는 AWS Glue로 구축된 데이터 처리 모듈입니다. 두 번째는 SageMaker를 통해 관리되는 모델 교육 인터페이스로, 이를 통해 모델을 프로덕션 엔드포인트에 배포하기 전에 모델을 교육, 조정 및 평가할 수 있습니다.

데이터 처리

우리가 설치하는 각 HVAC 장치는 시스템 전체의 RPM, 온도 및 압력에 대한 판독값을 포함하여 90개의 서로 다른 센서로부터 데이터를 생성합니다. 이는 하루에 장치당 생성되는 대략 8만 개의 데이터 포인트에 달하며, 수만 개의 장치가 설치됩니다. 더 많은 HVAC 시스템이 클라우드에 연결됨에 따라 데이터의 양이 빠르게 증가할 것으로 예상되므로 다운스트림 작업에 사용하기 위해 데이터의 크기와 복잡성을 관리하는 것이 중요해졌습니다. 센서 데이터 기록의 길이 또한 모델링 문제를 제시합니다. 장치는 실제로 결함이 발생하기 몇 달 전부터 결함이 임박했다는 징후를 표시하기 시작할 수 있습니다. 이로 인해 예측 신호와 실제 오류 사이에 상당한 지연이 발생합니다. ML 모델링에서는 입력 데이터의 길이를 압축하는 방법이 중요합니다.

센서 데이터의 크기와 복잡성을 해결하기 위해 그림 1과 같이 이를 사이클 기능으로 압축합니다. 이렇게 하면 장비 동작을 특징짓는 기능을 캡처하는 동시에 데이터 크기가 크게 줄어듭니다.

Carrier가 AWS Glue 및 Amazon SageMaker를 사용하여 HVAC 결함을 예측하는 방법 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.

그림 1: HVAC 센서 데이터 샘플

AWS Glue는 대량의 데이터를 대규모로 처리하기 위한 서버리스 데이터 통합 ​​서비스입니다. AWS Glue를 사용하면 병렬 데이터 전처리 및 기능 추출을 쉽게 실행할 수 있었습니다. 우리는 AWS Glue를 사용하여 엔지니어링 팀에서 식별한 주요 기능을 사용하여 주기를 감지하고 단위 동작을 요약했습니다. 이로 인해 데이터 세트의 크기가 단위당 하루 8만 개가 넘는 데이터 포인트에서 약 1,200개로 크게 줄었습니다. 결정적으로 이 접근 방식은 훨씬 작은 데이터 공간으로 장치 동작에 대한 예측 정보를 보존합니다.

AWS Glue 작업의 출력은 각 주기의 단위 동작을 요약한 것입니다. 그런 다음 Amazon SageMaker 처리 주기 전반에 걸쳐 특징을 계산하고 데이터에 라벨을 붙이는 작업입니다. 우리는 향후 60일 이내에 장비 결함을 예측하는 것을 목표로 ML 문제를 이진 분류 작업으로 공식화합니다. 이를 통해 당사 대리점 네트워크는 잠재적인 장비 오류를 적시에 해결할 수 있습니다. 모든 장치가 60일 이내에 고장나는 것은 아니라는 점에 유의하는 것이 중요합니다. 성능 저하가 느린 장치는 실패하는 데 더 많은 시간이 걸릴 수 있습니다. 모델 평가 단계에서 이 문제를 해결합니다. 우리는 미국의 대부분의 HVAC 시스템이 일관되게 작동하고 더욱 극한적인 조건에서 작동하는 시기이기 때문에 여름철에 모델링을 집중했습니다.

모델링

Transformer 아키텍처는 시간 데이터를 처리하기 위한 최첨단 접근 방식이 되었습니다. 경사가 사라지는 문제 없이 각 시간 단계에서 긴 과거 데이터 시퀀스를 사용할 수 있습니다. 특정 시점에서 우리 모델에 대한 입력은 대략 128주일의 단위 작동에 해당하는 이전 2개의 장비 주기에 대한 특징으로 구성됩니다. 이는 출력이 평균화되어 MLP(다층 퍼셉트론) 분류기에 공급되는 XNUMX계층 인코더에 의해 처리됩니다. MLP 분류기는 ReLU 활성화 기능이 포함된 XNUMX개의 선형 레이어와 LogSoftMax 활성화가 포함된 최종 레이어로 구성됩니다. 우리는 손실 함수에 대해 양수 클래스에 다른 가중치를 부여한 가중 음수 로그 우도 손실을 사용합니다. 이는 우리 모델을 높은 정밀도로 편향시키고 비용이 많이 드는 잘못된 경보를 방지합니다. 또한 비즈니스 목표를 모델 교육 프로세스에 직접 통합합니다. 그림 XNUMX는 변환기 아키텍처를 보여줍니다.

트랜스포머 아키텍처

그림 2: 시간 변환기 아키텍처

트레이닝

이 시간적 학습 모델을 훈련할 때 한 가지 과제는 데이터 불균형입니다. 일부 장치는 다른 장치보다 작동 이력이 길기 때문에 데이터 세트에 더 많은 주기가 있습니다. 데이터 세트에서 과도하게 표현되기 때문에 이러한 단위는 모델에 더 많은 영향을 미칩니다. 우리는 해당 시점의 고장 확률을 평가하는 장치 기록에서 100개의 주기를 무작위로 샘플링하여 이 문제를 해결합니다. 이렇게 하면 훈련 과정에서 각 단위가 동일하게 표현됩니다. 불균형한 데이터 문제를 제거하는 동시에 이 접근 방식은 프로덕션에서 사용될 일괄 처리 접근 방식을 복제하는 추가 이점이 있습니다. 이 샘플링 접근 방식은 훈련, 검증 및 테스트 세트에 적용되었습니다.

훈련은 SageMaker에서 GPU 가속 인스턴스를 사용하여 수행되었습니다. 손실을 모니터링하면 그림 180에 표시된 것처럼 3회의 훈련 에포크 후에 최상의 결과를 달성하는 것으로 나타났습니다. 그림 4는 결과 시간 분류 모델의 ROC 곡선 아래 면적이 81%임을 보여줍니다.

훈련 곡선

그림 3: 에포크에 따른 훈련 손실

Carrier가 AWS Glue 및 Amazon SageMaker를 사용하여 HVAC 결함을 예측하는 방법 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.

그림 4: 60일 잠금에 대한 ROC-AUC

평가

모델이 주기 수준에서 훈련되는 동안 평가는 단위 수준에서 이루어져야 합니다. 이러한 방식으로 여러 개의 참양성 검색이 있는 하나의 단위는 여전히 단위 수준에서 단일 참양성으로만 계산됩니다. 이를 위해 예측된 결과와 결함 이전 60일 기간 간의 중복을 분석합니다. 이는 결과를 예측하는 네 가지 사례를 보여주는 다음 그림에 설명되어 있습니다.

  • 진정한 부정 – 예측 결과가 모두 부정적(보라색)임(그림 5)
  • 거짓 긍정 – 긍정적인 예측은 잘못된 경보입니다(그림 6).
  • 위음성 – 예측은 모두 부정적이지만 실제 레이블은 긍정적일 수 있습니다(녹색)(그림 7).
  • 진정한 긍정 – 예측 중 일부는 부정적(녹색)일 수 있으며 적어도 하나의 예측은 긍정적(노란색)입니다(그림 8).
참 음성

그림 5.1: 참 부정 사례

오탐 영역

그림 5.2: 거짓 긍정 사례

미탐 영역

그림 5.3: 거짓 부정 사례

진정한 긍정

그림 5.4: 참양성 사례

훈련 후에는 평가 세트를 사용하여 경고 전송을 위한 임계값을 조정합니다. 모델 신뢰 임계값을 0.99로 설정하면 대략 81%의 정밀도가 생성됩니다. 이는 초기 성공 기준 90%에 미치지 못합니다. 그러나 우리는 60일 평가 기간이 끝나자마자 장치의 상당 부분이 실패했다는 사실을 발견했습니다. 장치가 결함 있는 동작을 적극적으로 표시할 수 있지만 실패하는 데 60일 이상이 걸릴 수 있으므로 이는 의미가 있습니다. 이를 처리하기 위해 우리는 다음과 같은 측정항목을 정의했습니다. 유효 정밀도이는 참양수 정밀도(81%)와 목표인 30일 기간을 넘어 60일 동안 발생한 잠금의 추가 정밀도를 결합한 것입니다.

HVAC 딜러에게 가장 중요한 것은 현장 검사가 고객의 향후 HVAC 문제를 예방하는 데 도움이 된다는 것입니다. 이 모델을 사용하면 검사 시간의 81.2%가 향후 60일 이내에 폐쇄 발생을 방지할 수 있을 것으로 추정됩니다. 또한, 검사 후 10.4일 이내에 폐쇄가 발생한 경우는 90%였습니다. 나머지 8.4%는 잘못된 경보가 됩니다. 훈련된 모델의 유효 정밀도는 91.6%입니다.

결론

이 게시물에서는 우리 팀이 AWS Glue와 SageMaker를 사용하여 예측 유지 관리를 위한 확장 가능한 지도 학습 솔루션을 만드는 방법을 보여주었습니다. 우리 모델은 센서 데이터의 장기간 기록에 걸쳐 추세를 포착하고 몇 주 전에 수백 건의 장비 고장을 정확하게 감지할 수 있습니다. 결함을 사전에 예측하면 출고 시간이 단축되어 딜러가 보다 적시에 기술 지원을 제공하고 전반적인 고객 경험을 향상할 수 있습니다. 매년 더 많은 클라우드 연결 HVAC 장치가 설치됨에 따라 이 접근 방식의 영향은 시간이 지남에 따라 커질 것입니다.

다음 단계는 이러한 통찰력을 곧 출시될 Carrier의 Connected Dealer Portal에 통합하는 것입니다. 포털은 이러한 예측 경고를 AWS 기반 데이터 레이크에서 얻은 다른 통찰력과 결합하여 딜러가 전체 클라이언트 기반의 장비 상태에 대해 더 명확하게 알 수 있도록 합니다. 우리는 추가 소스의 데이터를 통합하고 센서 데이터에서 더 많은 고급 기능을 추출하여 모델을 지속적으로 개선할 것입니다. 이 프로젝트에 사용된 방법은 우리 팀이 보증 청구를 줄이고 현장에서 장비 효율성을 향상시키는 데 도움이 될 수 있는 다른 주요 질문에 답할 수 있는 강력한 기반을 제공합니다.

제품 및 서비스에서 ML 사용을 가속화하는 데 도움이 필요하면 Amazon ML 솔루션 랩. 이 프로젝트에 사용된 서비스에 대한 자세한 내용은 다음을 참조하세요. AWS Glue 개발자 안내서 그리고 Amazon SageMaker 개발자 안내서.


저자에 관하여

Carrier가 AWS Glue 및 Amazon SageMaker를 사용하여 HVAC 결함을 예측하는 방법 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.라비 파탄카르 Carrier's Residential HVAC Unit의 IoT 관련 분석 기술 리더입니다. 그는 진단 및 예측과 관련된 분석 문제를 공식화하고 ML/딥 러닝 기반 분석 솔루션 및 아키텍처에 대한 방향을 제시합니다.

Carrier가 AWS Glue 및 Amazon SageMaker를 사용하여 HVAC 결함을 예측하는 방법 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.댄 볼크 AWS Generative AI Innovation Center의 데이터 과학자입니다. 그는 기계 학습, 딥 러닝 및 시계열 분석 분야에서 XNUMX년의 경험을 갖고 있으며 UC Berkeley에서 데이터 과학 석사 학위를 취득했습니다. 그는 최첨단 AI 기술을 활용하여 복잡한 비즈니스 과제를 기회로 전환하는 데 열정을 쏟고 있습니다.

Carrier가 AWS Glue 및 Amazon SageMaker를 사용하여 HVAC 결함을 예측하는 방법 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.유 잉웨이 AWS Generative AI Innovation Center의 응용 과학자입니다. 그는 NLP, 시계열 분석, 생성 AI 기술을 포함한 기계 학습의 다양한 개념 증명에 대해 업계 전반의 여러 조직과 협력한 경험이 있습니다. Yingwei는 텍사스 A&M 대학교에서 컴퓨터 과학 박사 학위를 받았습니다.

Carrier가 AWS Glue 및 Amazon SageMaker를 사용하여 HVAC 결함을 예측하는 방법 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.유 옌샹 Amazon Web Services의 응용 과학자로 Generative AI Innovation Center에서 일하고 있습니다. 산업용 애플리케이션을 위한 AI 및 기계 학습 모델을 구축한 8년 이상의 경험을 보유한 그는 생성 AI, 컴퓨터 비전 및 시계열 모델링을 전문으로 합니다. 그의 작업은 실제 문제에 고급 생성 기술을 적용하는 혁신적인 방법을 찾는 데 중점을 두고 있습니다.

Carrier가 AWS Glue 및 Amazon SageMaker를 사용하여 HVAC 결함을 예측하는 방법 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.디에고 소콜린스키 그는 AWS Generative AI 혁신 센터의 수석 응용 과학 관리자로서 미국 동부 및 라틴 아메리카 지역의 제공 팀을 이끌고 있습니다. 그는 기계 학습 및 컴퓨터 비전 분야에서 XNUMX년 이상의 경험을 갖고 있으며 존스 홉킨스 대학교에서 수학 박사 학위를 취득했습니다.

Carrier가 AWS Glue 및 Amazon SageMaker를 사용하여 HVAC 결함을 예측하는 방법 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.케신 딩 XNUMX년차 박사입니다. UNC-Charlotte의 컴퓨터 공학 후보자입니다. 그녀의 연구는 의료 이미지 및 유전체학 시퀀싱 데이터를 포함한 다중 모드 데이터를 분석하기 위해 딥 러닝 방법을 적용하는 데 중점을 두고 있습니다.

타임 스탬프 :

더보기 AWS 기계 학습