Hogyan jósolja meg a Carrier a HVAC hibákat az AWS Glue és az Amazon SageMaker segítségével | Amazon webszolgáltatások

Hogyan jósolja meg a Carrier a HVAC hibákat az AWS Glue és az Amazon SageMaker segítségével | Amazon webszolgáltatások

Saját szavaikkal élve: „1902-ben Willis Carrier megoldotta az emberiség egyik legmegfoghatatlanabb kihívását, a beltéri környezet szabályozását modern légkondicionálással. Ma a Carrier termékek kényelmes környezetet teremtenek, biztosítják a globális élelmiszerellátást, és lehetővé teszik a létfontosságú orvosi kellékek biztonságos szállítását szigorú feltételek mellett.”

At Hordozó, sikerünk alapja az, hogy olyan termékeket készítsünk, amelyekben ügyfeleink megbízhatnak, hogy kényelmesen és biztonságban maradjanak egész évben. A nagy megbízhatóság és a berendezések alacsony leállási ideje egyre fontosabb, mivel az éghajlatváltozás miatt egyre gyakoribbak a szélsőséges hőmérsékletek. Történelmileg küszöb alapú rendszerekre támaszkodtunk, amelyek mérnökcsapatunk által meghatározott paraméterek segítségével figyelmeztetnek bennünket a rendellenes berendezések viselkedésére. Noha az ilyen rendszerek hatékonyak, inkább a berendezésekkel kapcsolatos problémák azonosítására és diagnosztizálására szolgálnak, nem pedig előrejelzésükre. A hibák fellépésük előtti előrejelzése lehetővé teszi HVAC-kereskedőink számára, hogy proaktív módon kezeljék a problémákat, és javítsák az ügyfélélményt.

Berendezéseink megbízhatóságának javítása érdekében partnerséget kötöttünk a Amazon Machine Learning Solutions Lab olyan egyedi gépi tanulási (ML) modell kifejlesztésére, amely képes előre jelezni a berendezésekkel kapcsolatos problémákat a meghibásodás előtt. Csapatunk egy keretrendszert fejlesztett ki több mint 50 TB érzékelő történeti adat feldolgozására és a hibák 91%-os pontosságú előrejelzésére. Mostantól értesíthetjük a kereskedőket a közelgő berendezéshibákról, így ütemezhetik az ellenőrzéseket és minimalizálhatják az egység leállási idejét. A megoldás keretrendszere skálázható, amint több berendezést telepítenek, és újrafelhasználható számos későbbi modellezési feladathoz.

Ebben a bejegyzésben bemutatjuk, hogy a Carrier és az AWS csapata hogyan alkalmazta az ML-t, hogy egyetlen modellt használva előre jelezzék a hibákat nagy berendezésparkokban. Először kiemeljük, hogyan használjuk AWS ragasztó nagymértékben párhuzamos adatfeldolgozáshoz. Ezután megbeszéljük, hogyan Amazon SageMaker segít a funkciótervezésben és egy méretezhető, felügyelt mély tanulási modell felépítésében.

A használati esetek, célok és kockázatok áttekintése

A projekt fő célja az állásidő csökkentése a közelgő berendezéshibák előrejelzésével és a kereskedők értesítésével. Ez lehetővé teszi a kereskedők számára, hogy proaktívan ütemezzék be a karbantartást, és kivételes ügyfélszolgálatot nyújtsanak. Három fő kihívással kellett szembenéznünk, amikor ezen a megoldáson dolgoztunk:

  • Adatok méretezhetősége – Az adatfeldolgozásnak és a funkciók kinyerésének a nagy, növekvő előzményadatokra kell kiterjednie
  • Modell méretezhetőség – A modellezési megközelítésnek képesnek kell lennie több mint 10,000 XNUMX egység skálázására
  • Modell pontosság – Alacsony hamis pozitív arányra van szükség a szükségtelen karbantartási ellenőrzések elkerülése érdekében

A skálázhatóság mind adat-, mind modellezési szempontból kulcsfontosságú követelmény ennél a megoldásnál. Több mint 50 TB korábbi berendezésadattal rendelkezünk, és arra számítunk, hogy ezek az adatok gyorsan növekedni fognak, ahogy egyre több HVAC egység csatlakozik a felhőhöz. Az adatfeldolgozásnak és a modellkövetkeztetésnek az adataink növekedésével skálázhatónak kell lennie. Ahhoz, hogy modellezési megközelítésünk több mint 10,000 XNUMX egységre kiterjedjen, szükségünk van egy olyan modellre, amely képes tanulni a berendezésparkból, nem pedig egyetlen egység rendellenes leolvasására hagyatkozni. Ez lehetővé teszi az egységek közötti általánosítást, és csökkenti a következtetés költségeit egyetlen modell elhelyezésével.

A másik probléma ezzel a használati esettel kapcsolatban a téves riasztások kiváltása. Ez azt jelenti, hogy egy kereskedő vagy technikus a helyszínre megy, hogy átvizsgálja az ügyfél berendezését, és minden megfelelően működik. A megoldáshoz nagy pontosságú modellre van szükség annak biztosítására, hogy a kereskedő riasztása esetén a berendezés valószínűleg meghibásodjon. Ez segít elnyerni a kereskedők, a technikusok és a lakástulajdonosok bizalmát, és csökkenti a szükségtelen helyszíni ellenőrzésekkel járó költségeket.

Az Amazon ML Solutions Lab AI/ML szakértőivel 14 hetes fejlesztési erőfeszítést kötöttünk. Végül a megoldásunk két elsődleges összetevőből áll. Az első az AWS Glue-val épített adatfeldolgozó modul, amely összefoglalja a berendezések viselkedését, és csökkenti a képzési adataink méretét a hatékony továbbfeldolgozás érdekében. A második a SageMakeren keresztül kezelt modell betanítási felület, amely lehetővé teszi, hogy betanítsuk, hangoljuk és értékeljük a modellünket, mielőtt üzembe helyeznénk egy éles végponton.

Adatfeldolgozás

Minden általunk telepített HVAC egység 90 különböző érzékelőből állít elő adatokat, amelyek a rendszerben leolvassák a fordulatszámot, a hőmérsékletet és a nyomást. Ez nagyjából 8 millió adatpontot jelent egységenként naponta, több tízezer telepített egység mellett. Ahogy egyre több HVAC-rendszer csatlakozik a felhőhöz, az adatok mennyiségének gyors növekedésére számítunk, ezért kritikus fontosságú számunkra, hogy kezeljük azok méretét és összetettségét a későbbi feladatokhoz. Az érzékelő adattörténetének hossza modellezési kihívást is jelent. Előfordulhat, hogy az egység hónapokkal azelőtt elkezdheti megjeleníteni a közelgő meghibásodás jeleit, hogy a hiba ténylegesen kiváltana. Ez jelentős késést hoz létre a prediktív jel és a tényleges hiba között. A bemeneti adatok hosszának tömörítésére szolgáló módszer kritikussá válik az ML modellezésben.

Az érzékelőadatok méretének és összetettségének kezelése érdekében az 1. ábrán látható módon ciklusjellemzőkké tömörítjük azokat. Ez drámaian csökkenti az adatok méretét, miközben rögzíti a berendezés viselkedését jellemző jellemzőket.

How Carrier predicts HVAC faults using AWS Glue and Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

1. ábra: Minta a HVAC érzékelő adataiból

Az AWS Glue egy szerver nélküli adatintegrációs szolgáltatás nagy mennyiségű adat feldolgozásához. Az AWS Glue lehetővé tette számunkra, hogy egyszerűen futtassuk párhuzamosan az adat-előfeldolgozást és a funkciók kivonását. Az AWS Glue segítségével észleltük a ciklusokat és összegeztük az egység viselkedését a mérnöki csapatunk által azonosított kulcsfontosságú funkciók segítségével. Ez drámaian csökkentette adatkészletünk méretét, a napi egységenkénti több mint 8 millió adatpontról nagyjából 1,200-ra. Lényeges, hogy ez a megközelítés megőrzi az egység viselkedésére vonatkozó prediktív információkat sokkal kisebb adatlábnyom mellett.

Az AWS ragasztófeladat kimenete az egység viselkedésének összegzése az egyes ciklusokhoz. Ezután használunk egy Amazon SageMaker feldolgozás feladat a ciklusok jellemzőinek kiszámítása és az adataink címkézése. Az ML problémát bináris osztályozási feladatként fogalmazzuk meg azzal a céllal, hogy a következő 60 napban előre jelezzük a berendezés meghibásodását. Ez lehetővé teszi kereskedői hálózatunknak, hogy időben kezelje a lehetséges berendezéshibákat. Fontos megjegyezni, hogy nem minden egység hibásodik meg 60 napon belül. A lassú teljesítményromlást tapasztaló egység meghibásodása több időt vehet igénybe. Ezzel a modellértékelési lépés során foglalkozunk. Modellezésünket a nyári időszakra összpontosítottuk, mert ezekben a hónapokban a legtöbb HVAC rendszer az Egyesült Államokban egyenletesen működik és szélsőségesebb körülmények között működik.

Modellezés

A transzformátor architektúrák az időbeli adatok kezelésének legkorszerűbb megközelítésévé váltak. A korábbi adatok hosszú sorozatait használhatják minden egyes időlépésben anélkül, hogy az eltűnő gradiensektől szenvednének. A modellünk egy adott időpontban történő bemenete az előző 128 berendezési ciklus jellemzőiből tevődik össze, ami nagyjából egy hét egység működését jelenti. Ezt egy háromrétegű kódoló dolgozza fel, amelynek kimenetét átlagolják, és egy többrétegű perceptron (MLP) osztályozóba táplálják. Az MLP osztályozó három lineáris rétegből áll ReLU aktiválási funkciókkal és egy utolsó rétegből LogSoftMax aktiválással. A veszteségfüggvényünkhöz eltérő súllyal súlyozott negatív log-likelihood veszteséget használunk a pozitív osztályon. Ez a modellünket a nagy pontosság felé torzítja, és elkerüli a költséges téves riasztásokat. Üzleti céljainkat is közvetlenül beépíti a modellképzési folyamatba. A 2. ábra a transzformátor architektúráját szemlélteti.

Transzformátor építészet

2. ábra: Időbeli transzformátor architektúra

Képzések

Ennek az időbeli tanulási modellnek a képzése során az egyik kihívás az adatok kiegyensúlyozatlansága. Egyes egységek hosszabb működési előzményekkel rendelkeznek, mint mások, ezért adatkészletünkben több ciklus van. Mivel felülreprezentáltak az adatkészletben, ezek az egységek nagyobb befolyást gyakorolnak a modellünkre. Ezt úgy oldjuk meg, hogy véletlenszerűen mintavételezünk 100 ciklust egy egység történetében, ahol felmérjük a meghibásodás valószínűségét abban az időben. Ez biztosítja, hogy minden egység egyformán képviselve legyen a képzési folyamat során. A kiegyensúlyozatlan adatok problémájának megszüntetése mellett ennek a megközelítésnek az a további előnye, hogy replikálja a termelésben használt kötegelt feldolgozási megközelítést. Ezt a mintavételi megközelítést alkalmazták a képzési, érvényesítési és tesztkészleteknél.

A képzés egy GPU-gyorsított példány használatával történt a SageMakeren. A veszteség monitorozása azt mutatja, hogy 180 edzési periódus után éri el a legjobb eredményeket, amint az a 3. ábrán látható. A 4. ábra azt mutatja, hogy a kapott időbeli osztályozási modell ROC görbe alatti területe 81%.

Képzési görbe

3. ábra: Edzésveszteség korszakokon át

How Carrier predicts HVAC faults using AWS Glue and Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

4. ábra: ROC-AUC 60 napos zároláshoz

Értékelés

Míg modellünket a ciklus szintjén képezzük, az értékelésnek az egység szintjén kell megtörténnie. Ily módon a több valódi pozitív észleléssel rendelkező egység továbbra is csak egyetlen valódi pozitívnak számít egységszinten. Ehhez elemezzük az előre jelzett eredmények és a hibát megelőző 60 napos időszak közötti átfedést. Ezt szemlélteti a következő ábra, amely az eredmények előrejelzésének négy esetét mutatja be:

  • Igaz negatív – Az összes előrejelzési eredmény negatív (lila) (5. ábra)
  • Álpozitív – A pozitív előrejelzések téves riasztások (6. ábra)
  • Hamis negatív – Bár az előrejelzések mind negatívak, a tényleges címkék lehetnek pozitívak (zöld) (7. ábra)
  • Igaz pozitív – Egyes előrejelzések lehetnek negatívak (zöld), és legalább egy előrejelzés pozitív (sárga) (8. ábra)
Igaz negatív

5.1. ábra: Valódi negatív eset

álpozitív

5.2. ábra: Hamis pozitív eset

Hamis negatív

5.3. ábra: Hamis negatív eset

Igaz pozitív

5.4. ábra: Valódi pozitív eset

Edzés után a kiértékelő készlet segítségével hangoljuk a riasztás küldésének küszöbét. A modell megbízhatósági küszöbének 0.99-re állítása nagyjából 81%-os pontosságot eredményez. Ez elmarad a siker kezdeti 90%-os kritériumától. Azt tapasztaltuk azonban, hogy az egységek jó része meghibásodott a 60 napos értékelési időszakon kívül. Ez logikus, mert előfordulhat, hogy egy egység hibásan viselkedik, de 60 napnál tovább tart a meghibásodás. Ennek kezelésére definiáltunk egy mérőszámot hatékony precizitás, amely a valódi pozitív precizitás (81%) és a 30 napos célkereten túli 60 napon belül bekövetkezett kizárások további pontosságának kombinációja.

A HVAC-kereskedő számára az a legfontosabb, hogy a helyszíni ellenőrzés segít megelőzni a jövőbeni HVAC-problémákat az ügyfelek számára. Ezzel a modellel úgy becsüljük, hogy az esetek 81.2%-ában az ellenőrzés megakadályozza, hogy a következő 60 napban bekövetkezzen a blokkolás. Ezenkívül az esetek 10.4%-ában a zárolás az ellenőrzést követő 90 napon belül következett volna be. A fennmaradó 8.4% téves riasztás lesz. A betanított modell effektív pontossága 91.6%.

Következtetés

Ebben a bejegyzésben bemutattuk, hogyan használta csapatunk az AWS Glue-t és a SageMaker-t egy méretezhető, felügyelt tanulási megoldás létrehozásához a prediktív karbantartáshoz. Modellünk képes megragadni a trendeket az érzékelőadatok hosszú távú történetében, és pontosan észlelni több száz berendezés meghibásodását hetekkel előre. A hibák előrejelzése lerövidíti a megfékezésig tartó időt, lehetővé téve viszonteladóink számára, hogy időben nyújtsanak technikai segítséget, és javítsák az általános ügyfélélményt. Ennek a megközelítésnek a hatásai idővel növekedni fognak, mivel évről évre egyre több felhőhöz csatlakoztatott HVAC egységet telepítenek.

Következő lépésünk az, hogy ezeket az ismereteket integráljuk a Carrier's Connected Dealer Portal közelgő kiadásába. A portál egyesíti ezeket a prediktív riasztásokat az AWS-alapú adatforrásunkból származó egyéb betekintésekkel, hogy kereskedőinknek pontosabb képet adjon a berendezések állapotáról a teljes ügyfélbázisukban. Folytatjuk modellünk fejlesztését további forrásokból származó adatok integrálásával és fejlettebb funkciók kinyerésével az érzékelő adatainkból. A projektben alkalmazott módszerek szilárd alapot biztosítanak csapatunk számára ahhoz, hogy más kulcsfontosságú kérdések megválaszolását megkezdhesse, amelyek segítségével csökkenthetjük a garanciális igényeket és javíthatjuk a berendezések hatékonyságát a területen.

Ha segítségre van szüksége az ML használatának felgyorsításához termékeiben és szolgáltatásaiban, kérjük, forduljon a Amazon ML Solutions Lab. Ha többet szeretne megtudni a projektben használt szolgáltatásokról, tekintse meg a AWS Glue fejlesztői útmutató és a Amazon SageMaker fejlesztői útmutató.


A szerzőkről

How Carrier predicts HVAC faults using AWS Glue and Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Ravi Patankar az IoT-vel kapcsolatos elemzések műszaki vezetője a Carrier's Residential HVAC Unitnál. Megfogalmazza a diagnosztikával és prognosztikával kapcsolatos analitikai problémákat, irányt ad az ML/deep learning alapú analitikai megoldásokhoz és architektúrához.

How Carrier predicts HVAC faults using AWS Glue and Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Dan Volk az AWS Generatív AI Innovációs Központ adattudósa. Tíz éves tapasztalattal rendelkezik a gépi tanulás, a mély tanulás és az idősorelemzés terén, és a Berkeley Egyetemen szerzett mesterfokozatot adattudományból. Szenvedélyesen törekszik arra, hogy az összetett üzleti kihívásokat lehetőségekké alakítsa az élvonalbeli AI-technológiák kihasználásával.

How Carrier predicts HVAC faults using AWS Glue and Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Yingwei Yu az AWS Generatív AI Innovációs Központ alkalmazott tudósa. Számos iparágban szerzett tapasztalattal rendelkezik a gépi tanulás különféle bizonyítási koncepcióinak fejlesztésében, beleértve az NLP-t, az idősoros elemzést és a generatív AI-technológiákat. Yingwei a Texas A&M Egyetemen szerzett PhD fokozatot számítástechnikából.

How Carrier predicts HVAC faults using AWS Glue and Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Yanxiang Yu az Amazon Web Services alkalmazott tudósa, a Generatív AI Innovációs Központon dolgozik. Több mint 8 éves tapasztalattal rendelkezik az ipari alkalmazásokhoz szükséges mesterséges intelligencia és gépi tanulási modellek építésében, és a generatív mesterséges intelligencia, a számítógépes látás és az idősoros modellezésre specializálódott. Munkája arra összpontosít, hogy innovatív módszereket találjon a fejlett generatív technikák valós problémákra való alkalmazására.

How Carrier predicts HVAC faults using AWS Glue and Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Diego Socolinsky Senior Applied Science Manager az AWS Generative AI Innovation Centernél, ahol az USA keleti és latin-amerikai régióinak szállítási csapatát vezeti. Több mint húsz éves tapasztalattal rendelkezik a gépi tanulás és a számítógépes látás területén, és a Johns Hopkins Egyetemen szerzett PhD fokozatot matematikából.

How Carrier predicts HVAC faults using AWS Glue and Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Kexin Ding ötödéves Ph.D. Számítástechnika kandidátus az UNC-Charlotte-ban. Kutatása a mély tanulási módszerek alkalmazására összpontosít multimodális adatok elemzésére, beleértve az orvosi képi és genomikai szekvenálási adatokat.

Időbélyeg:

Még több AWS gépi tanulás