Tämän viestin ovat kirjoittaneet Jyoti Sharma ja Sharmo Sarkar Vericastista.
Kaikissa koneoppimisongelmissa datatieteilijä aloittaa tiedon käsittelemisestä. Tämä sisältää tietojen keräämisen, tutkimisen ja ymmärtämisen liiketoiminnallisten ja teknisten näkökohtien sekä mallinrakennusprosessissa mahdollisesti tarvittavien manipulointien arvioinnin. Yksi osa tätä tietojen valmistelua on ominaisuussuunnittelu.
Ominaisuuksien suunnittelu viittaa prosessiin, jossa relevantit muuttujat tunnistetaan, valitaan ja manipuloidaan raakadatan muuntamiseksi hyödyllisempään ja käyttökelpoisempaan muotoon käytettäväksi ML-algoritmin kanssa, jota käytetään mallin kouluttamiseen ja johtopäätösten tekemiseen sitä vastaan. Tämän prosessin tavoitteena on parantaa algoritmin ja tuloksena olevan ennustavan mallin suorituskykyä. Ominaisuuden suunnitteluprosessi sisältää useita vaiheita, mukaan lukien ominaisuuden luominen, tietojen muuntaminen, piirteiden poimiminen ja ominaisuuksien valinta.
Alustan rakentaminen yleiselle ominaisuussuunnittelulle on yleinen tehtävä asiakkaille, jotka tarvitsevat useita ML-malleja erilaisilla tietojoukoilla. Tämäntyyppiseen alustaan kuuluu ohjelmallisesti ohjatun prosessin luominen viimeistellyn, ominaisuussuunnitellun datan tuottamiseksi, joka on valmis mallikoulutukseen ilman ihmisen puuttumista. Ominaisuussuunnittelun yleistäminen on kuitenkin haastavaa. Jokainen liiketoimintaongelma on erilainen, jokainen tietojoukko on erilainen, datamäärät vaihtelevat hurjasti asiakkaiden välillä, ja tiedon laadulla ja usein tietyn sarakkeen kardinaaluudella (strukturoidun tiedon tapauksessa) saattaa olla merkittävä rooli ominaisuussuunnittelun monimutkaisuuteen. käsitellä asiaa. Lisäksi asiakkaan tietojen dynaaminen luonne voi myös johtaa suureen vaihteluun käsittelyajassa ja resursseissa, joita tarvitaan ominaisuuksien suunnittelun optimaaliseen loppuun saattamiseen.
AWS-asiakas Vericast on markkinointiratkaisuja tarjoava yritys, joka tekee tietoihin perustuvia päätöksiä parantaakseen asiakkaidensa markkinoinnin sijoitetun pääoman tuottoprosenttia. Vericastin sisäinen pilvipohjainen koneoppimisalusta, joka on rakennettu CRISP-ML(Q)-prosessin ympärille, käyttää erilaisia AWS-palveluita, mm. Amazon Sage Maker, Amazon SageMaker -käsittely, AWS Lambdaja AWS-vaihetoiminnot, tuottaa parhaat mahdolliset mallit, jotka on räätälöity tietyn asiakkaan tietoihin. Tämän alustan tavoitteena on vangita erilaisten ML-työnkulkujen rakentamiseen liittyvien vaiheiden toistettavuus ja niputtaminen alustan vakiomuotoisiksi yleistettäviksi työnkulkumoduuleiksi.
Tässä viestissä kerromme, kuinka Vericast optimoi ominaisuuksien suunnittelun SageMaker Processingin avulla.
Ratkaisun yleiskatsaus
Vericastin koneoppimisalusta auttaa uusien liiketoimintamallien nopeampaa käyttöönottoa olemassa olevien työnkulkujen perusteella tai olemassa olevien mallien nopeampaa aktivointia uusille asiakkaille. Esimerkiksi malli, joka ennustaa suoramainontaalttiutta, on aivan erilainen kuin malli, joka ennustaa Vericast-asiakkaan asiakkaiden alennuskuponkien herkkyyttä. Ne ratkaisevat erilaisia liiketoimintaongelmia ja siksi niillä on erilaisia käyttöskenaarioita markkinointikampanjan suunnittelussa. Mutta ML:n näkökulmasta molemmat voidaan tulkita binääriluokittelumalleiksi, ja siksi niillä voi olla monia yhteisiä vaiheita ML-työnkulun näkökulmasta, mukaan lukien mallin viritys ja koulutus, arviointi, tulkittavuus, käyttöönotto ja päättely.
Koska nämä mallit ovat binaarisia luokitteluongelmia (ML-termeillä), jaamme yrityksen asiakkaat kahteen luokkaan (binääri): niihin, jotka reagoivat kampanjaan myönteisesti ja niihin, jotka eivät. Lisäksi näitä esimerkkejä pidetään epätasapainoisena luokituksena, koska mallin kouluttamiseen käytetyt tiedot eivät sisällä yhtä paljon asiakkaita, jotka vastaisivat ja eivät vastaisi myönteisesti.
Tämän kaltaisen mallin varsinainen luominen noudattaa seuraavassa kaaviossa esitettyä yleistettyä mallia.
Suurin osa tästä prosessista on sama kaikille binääriluokitteluille paitsi ominaisuuden suunnitteluvaiheessa. Tämä on ehkä monimutkaisin, mutta toisinaan huomiotta jäänyt vaihe prosessissa. ML-mallit ovat suurelta osin riippuvaisia sen luomiseen käytetyistä ominaisuuksista.
Vericastin pilvipohjainen koneoppimisalusta pyrkii yleistämään ja automatisoimaan erilaisten ML-työnkulkujen ominaisuuksien suunnitteluvaiheet ja optimoimaan niiden suorituskyvyn kustannus-aika-metriikassa käyttämällä seuraavia ominaisuuksia:
- Alustan ominaisuustekniikan kirjasto – Tämä koostuu jatkuvasti kehittyvästä joukosta muunnoksia, jotka on testattu tuottamaan korkealaatuisia yleistettäviä ominaisuuksia, jotka perustuvat tiettyihin asiakaskonsepteihin (esimerkiksi asiakkaiden demografiset tiedot, tuotetiedot, tapahtumatiedot ja niin edelleen).
- Älykkäät resurssien optimoijat – Alusta käyttää AWS:n on-demand-infrastruktuurikykyä optimaalisimman tyyppisten prosessointiresurssien kehittämiseen tiettyä ominaisuuden suunnittelutyötä varten vaiheen odotetun monimutkaisuuden ja sen läpikäytävän tiedon määrän perusteella.
- Ominaisuussuunnittelutöiden dynaaminen skaalaus – Tähän käytetään yhdistelmää eri AWS-palveluita, mutta erityisesti SageMaker Processing. Tämä varmistaa, että alusta tuottaa korkealaatuisia ominaisuuksia kustannustehokkaasti ja oikea-aikaisesti.
Tämä viesti keskittyy tämän luettelon kolmanteen kohtaan ja näyttää, kuinka SageMaker Processing -töiden dynaaminen skaalaus saadaan aikaan hallitumman, tehokkaamman ja kustannustehokkaamman tietojenkäsittelykehyksen saavuttamiseksi suurille tietomäärille.
SageMaker Processing mahdollistaa työkuormat, jotka suorittavat vaiheita tietojen esi- tai jälkikäsittelyyn, ominaisuuksien suunnitteluun, tietojen validointiin ja mallien arviointiin SageMakerissa. Se tarjoaa myös hallitun ympäristön ja poistaa monimutkaisen eriyttämättömän raskaan noston, jota tarvitaan työkuormien suorittamiseen tarvittavan infrastruktuurin perustamiseen ja ylläpitoon. Lisäksi SageMaker Processing tarjoaa API-rajapinnan työmäärän suorittamiseen, seurantaan ja arviointiin.
SageMaker-käsittelytöiden suorittaminen tapahtuu täysin hallitussa SageMaker-klusterissa, ja yksittäiset työt sijoitetaan ilmentymäsäiliöihin ajon aikana. Hallittu klusteri, ilmentymät ja säilöt raportoivat tiedot osoitteeseen amazonin pilvikello, mukaan lukien grafiikkasuorittimen, suorittimen, muistin, grafiikkasuorittimen muistin, levymittareiden ja tapahtumien kirjaamisen käyttö.
Nämä ominaisuudet tarjoavat etuja Vericastin tietoinsinööreille ja tutkijoille auttamalla yleisten esikäsittelytyönkulkujen kehittämisessä ja poistamalla vaikeudet ylläpitää luotuja ympäristöjä, joissa niitä voidaan ajaa. Teknisiä ongelmia voi kuitenkin syntyä, kun otetaan huomioon tietojen dynaaminen luonne ja sen monipuoliset ominaisuudet, jotka voidaan syöttää tällaiseen yleiseen ratkaisuun. Järjestelmän on tehtävä perusteltu alustava arvaus klusterin koosta ja sen muodostavista esiintymistä. Tämän arvauksen on arvioitava tietojen kriteerit ja pääteltävä suorittimen, muistin ja levyn vaatimukset. Tämä arvaus voi olla täysin asianmukainen ja toimia asianmukaisesti työhön, mutta muissa tapauksissa se ei välttämättä. Tietyssä tietojoukossa ja esikäsittelytyössä CPU voi olla alimitoitettu, mikä johtaa maksimaaliseen käsittelyn suorituskykyyn ja pitkiin aikoihin. Vielä pahempaa, muistista voi tulla ongelma, mikä voi johtaa joko huonoon suorituskykyyn tai muistin loppumiseen liittyviin tapahtumiin, mikä aiheuttaa koko työn epäonnistumisen.
Nämä tekniset esteet mielessään Vericast päätti luoda ratkaisun. Niiden piti pysyä luonteeltaan yleisinä ja sopia laajempaan kuvaan esikäsittelyn työnkulun joustavasta vaiheista. Tärkeää oli myös ratkaista sekä mahdollinen tarve laajentaa ympäristöä tapauksissa, joissa suorituskyky heikkeni, että sulavasti toipua tällaisesta tapahtumasta tai kun työ päättyi ennenaikaisesti jostain syystä.
Vericastin rakentama ratkaisu tämän ongelman ratkaisemiseksi käyttää useita AWS-palveluita yhdessä saavuttaakseen liiketoimintatavoitteensa. Se on suunniteltu käynnistämään uudelleen ja skaalaamaan SageMaker Processing -klusteri perustuen suorituskykymittareihin, jotka havaittiin käyttämällä Lambda-toimintoja, jotka valvovat töitä. Jotta et menetä työtä skaalaustapahtuman sattuessa tai toipuisi odottamatta pysähtyneestä työstä, otettiin käyttöön tarkistuspistepohjainen palvelu, joka käyttää Amazon DynamoDB ja tallentaa osittain käsitellyt tiedot Amazonin yksinkertainen tallennuspalvelu (Amazon S3) kauhat vaiheet suoritettuina. Lopputuloksena on automaattisesti skaalautuva, kestävä ja dynaamisesti valvottu ratkaisu.
Seuraava kaavio näyttää korkean tason yleiskatsauksen järjestelmän toiminnasta.
Seuraavissa osioissa käsittelemme ratkaisun komponentteja tarkemmin.
Ratkaisun alustaminen
Järjestelmä olettaa, että erillinen prosessi käynnistää ratkaisun. Sitä vastoin tätä suunnittelua ei ole suunniteltu toimimaan yksin, koska se ei tuota artefakteja tai tulosteita, vaan toimii pikemminkin sivuvaunutoteutuksena johonkin SageMaker Processing -töitä käyttävistä järjestelmistä. Vericastin tapauksessa ratkaisu käynnistetään kutsulla Step Functions -vaiheesta, joka aloitetaan suuremman järjestelmän toisessa moduulissa.
Kun ratkaisu on aloitettu ja ensimmäinen ajo käynnistetään, perusstandardikokoonpano luetaan DynamoDB-taulukosta. Tätä kokoonpanoa käytetään parametrien asettamiseen SageMaker Processing -työlle, ja siinä on alustavat oletukset infrastruktuurin tarpeista. SageMaker Processing -työ on nyt aloitettu.
Metatietojen ja tulosteen seuranta
Kun työ alkaa, Lambda-funktio kirjoittaa työn käsittelyn metatiedot (nykyisen työn kokoonpano ja muut lokitiedot) DynamoDB-lokitaulukkoon. Nämä metatiedot ja lokitiedot säilyttävät työn historian, sen alkuperäisen ja jatkuvan määrityksen sekä muut tärkeät tiedot.
Tietyissä kohdissa, kun työn vaiheet ovat valmiit, tarkistuspistetiedot lisätään DynamoDB-lokitaulukkoon. Käsitellyt lähtötiedot siirretään Amazon S3:een nopeaa palautusta varten tarvittaessa.
Tämä lambda-toiminto määrittää myös Amazon EventBridge sääntö, joka valvoo käynnissä olevaa työtä sen tilan suhteen. Tarkemmin sanottuna tämä sääntö tarkkailee työtä sen tarkkailemiseksi, muuttuuko työn tila muotoon stopping
tai on a stopped
osavaltio. Tällä EventBridge-säännöllä on tärkeä rooli työn uudelleenkäynnistämisessä, jos tapahtuu vika tai suunniteltu automaattinen skaalaustapahtuma.
CloudWatch-mittareiden seuranta
Lambda-toiminto asettaa myös CloudWatch-hälytyksen, joka perustuu käsittelytyön metriseen matemaattiseen lausekkeeseen, joka valvoo kaikkien esiintymien mittareita suorittimen, muistin ja levyn käytön osalta. Tämäntyyppinen hälytys (metriikka) käyttää CloudWatchin hälytyskynnyksiä. Hälytys luo tapahtumia mittarin tai lausekkeen arvon perusteella suhteessa kynnysarvoihin useiden ajanjaksojen aikana.
Vericastin käyttötapauksessa kynnyslauseke on suunniteltu pitämään ohjain- ja suoritusinstanssit erillisinä, ja mittareita valvotaan erikseen jokaiselle. Erottamalla ne Vericast tietää, mikä hälytyksen aiheuttaa. Tämä on tärkeää, jotta voit päättää, miten skaalataan vastaavasti:
- Jos suorittajan mittarit ylittävät kynnyksen, on hyvä skaalata vaakasuunnassa
- Jos kuljettajan mittarit ylittävät kynnyksen, vaakasuuntainen skaalaus ei todennäköisesti auta, joten meidän on skaalattava pystysuunnassa
Hälytysmetriikan lauseke
Vericast voi käyttää seuraavia mittareita arvioidessaan skaalausta ja virheitä:
- CPUU-käyttö – Jokaisen yksittäisen CPU-ytimen käyttöasteen summa
- Muistin käyttö – Ilmentymän säilöjen käyttämä muistin prosenttiosuus
- DiskUtilization – Ilmentymän säilöjen käyttämän levytilan prosenttiosuus
- GPUUtilization – Instanssien säilöjen käyttämien GPU-yksiköiden prosenttiosuus
- GPU-muistin käyttö – Ilmentymän säilöjen käyttämä GPU-muistin prosenttiosuus
Tätä kirjoittaessa Vericast vain ottaa huomioon CPUUtilization
, MemoryUtilization
ja DiskUtilization
. Jatkossa he aikovat harkita GPUUtilization
ja GPUMemoryUtilization
samoin.
Seuraava koodi on esimerkki CloudWatch-hälytyksestä, joka perustuu Vericastin automaattisen skaalauksen metriseen matemaattiseen lausekkeeseen:
Tämä ilmaus osoittaa, että CloudWatch-hälytys harkitsee DriverMemoryUtilization (memoryDriver)
, CPUUtilization (cpuDriver)
, DiskUtilization (diskDriver)
, ExecutorMemoryUtilization (memoryExec)
, CPUUtilization (cpuExec)
ja DiskUtilization (diskExec)
seurantamittareina. Luku 80 edellisessä lausekkeessa tarkoittaa kynnysarvoa.
Täällä IF((cpuDriver) > 80, 1, 0
tarkoittaa, että jos ajurin suorittimen käyttöaste ylittää 80%, kynnysarvoksi muu 1 määritetään 0. IF(AVG(METRICS("memoryExec")) > 80, 1, 0
tarkoittaa, että kaikki mittarit merkkijonolla memoryExec
siinä otetaan huomioon ja siitä lasketaan keskiarvo. Jos keskimääräinen muistin käyttöaste ylittää 80:n, kynnysarvoksi muu 1 määritetään 0.
Looginen operaattori OR
käytetään lausekkeessa yhdistämään kaikki lausekkeen käyttötarkoitukset – jos jokin käyttötavoista saavuttaa kynnysarvonsa, laukaise hälytys.
Lisätietoja CloudWatch-metriikkahälytysten käyttämisestä metristen matemaattisten lausekkeiden perusteella on kohdassa CloudWatch-hälytyksen luominen metrisen matemaattisen lausekkeen perusteella.
CloudWatch-hälytysrajoitukset
CloudWatch rajoittaa mittareiden määrän hälytystä kohti 10:een. Tämä voi aiheuttaa rajoituksia, jos sinun on harkittava tätä enemmän mittareita.
Tämän rajoituksen voittamiseksi Vericast on asettanut hälytyksiä klusterin kokonaiskoon perusteella. Yksi hälytys luodaan kolmea esiintymää kohti (kolmessa tapauksessa on yksi hälytys, koska se antaisi yhteensä yhdeksän mittaria). Olettaen, että ajurin ilmentymää tarkastellaan erikseen, ajurin ilmentymälle luodaan toinen erillinen hälytys. Siksi luotujen hälytysten kokonaismäärä on suunnilleen yhtä suuri kuin kolmasosa suoritussolmujen lukumäärästä ja yksi ylimääräinen ajurin ilmentymä. Kussakin tapauksessa mittareiden määrä hälytystä kohti on alle 10 metrin rajoituksen.
Mitä tapahtuu hälytystilassa
Jos ennalta määrätty kynnys saavutetaan, hälytys menee an alarm
valtio, joka käyttää Amazonin yksinkertainen ilmoituspalvelu (Amazon SNS) lähettääksesi ilmoituksia. Tässä tapauksessa se lähettää kaikille tilaajille sähköposti-ilmoituksen, jossa on tiedot hälytyksestä.
Amazon SNS:ää käytetään myös käynnistämään Lambda-toiminto, joka pysäyttää parhaillaan käynnissä olevan SageMaker Processing -työn, koska tiedämme, että työ todennäköisesti epäonnistuu. Tämä toiminto tallentaa myös lokit tapahtumaan liittyvään lokitaulukkoon.
Työn alkaessa määritetty EventBridge-sääntö huomaa, että työ on mennyt a stopping
ilmoittaa muutaman sekunnin kuluttua. Tämä sääntö suorittaa sitten ensimmäisen Lambda-funktion uudelleen työn käynnistämiseksi uudelleen.
Dynaaminen skaalausprosessi
Ensimmäinen Lambda-toiminto kahden tai useamman kerran suorittamisen jälkeen tietää, että edellinen työ oli jo alkanut ja nyt on pysähtynyt. Funktio käy läpi samanlaisen prosessin saada peruskokoonpano alkuperäisestä työstä loki DynamoDB -taulukossa ja hakee myös päivitetyt asetukset sisäisestä taulukosta. Tämä päivitetty kokoonpano on resurssien delta-kokoonpano, joka määritetään skaalaustyypin perusteella. Skaalaustyyppi määritetään hälytyksen metatiedoista edellä kuvatulla tavalla.
Alkuperäistä kokoonpanoa ja resurssien deltaa käytetään, koska uusi kokoonpano ja uusi SageMaker Processing -työ aloitetaan lisääntyneillä resursseilla.
Tätä prosessia jatketaan, kunnes työ valmistuu onnistuneesti, ja se voi johtaa useisiin uudelleenkäynnistyksiin tarvittaessa lisäämällä resursseja joka kerta.
Vericastin tulos
Tämä mukautettu automaattinen skaalausratkaisu on auttanut tekemään Vericastin koneoppimisalustasta vankemman ja vikasietoisemman. Alusta pystyy nyt käsittelemään sujuvasti eri tietomäärien työkuormia minimaalisella ihmisen väliintulolla.
Ennen tämän ratkaisun käyttöönottoa kaikkien valmisteilla olevien Spark-pohjaisten moduulien resurssitarpeiden arvioiminen oli yksi suurimmista uuden asiakkaan käyttöönottoprosessin pullonkauloista. Työnkulut epäonnistuisivat, jos asiakkaan datamäärä kasvaisi, tai kustannukset olisivat perusteettomia, jos datamäärä vähenisi tuotannossa.
Tämän uuden moduulin ansiosta resurssirajoituksista johtuvat työnkulkuhäiriöt ovat vähentyneet lähes 80 %. Muutamat jäljellä olevat viat johtuvat enimmäkseen AWS-tilin rajoituksista ja automaattisen skaalauksen ulkopuolella. Vericastin suurin voitto tällä ratkaisulla on uusien asiakkaiden ja työnkulkujen helppous ottaa käyttöön. Vericast odottaa nopeuttavansa prosessia vähintään 60–70 %, ja lopullista lukua varten on vielä kerättävä dataa.
Vaikka Vericast pitää tätä menestyksenä, siitä aiheutuu kustannuksia. Tämän moduulin luonteen ja koko dynaamisen skaalauskonseptin perusteella työnkulut kestävät yleensä noin 30 % kauemmin (keskimääräinen tapaus) kuin työnkulku, jossa on räätälöity klusteri jokaiselle työnkulun moduulille. Vericast jatkaa optimointia tällä alueella ja pyrkii parantamaan ratkaisua sisällyttämällä heuristiikkaan perustuva resurssien alustus jokaiseen asiakasmoduuliin.
Sharmo Sarkar, Vericastin koneoppimisalustasta vastaava johtaja, sanoo: "Kun jatkamme AWS:n ja SageMakerin käytön laajentamista, halusin käyttää hetken korostaakseni AWS-asiakaspalvelutiimimme, omistautuneiden AWS Solutions -arkkitehtien, uskomatonta työtä. ja AWS-asiantuntijapalvelut, joiden kanssa teemme yhteistyötä. Heidän syvän AWS:n ja SageMakerin tuntemuksensa ansiosta pystyimme suunnittelemaan ratkaisun, joka täytti kaikki tarpeemme ja tarjosi meille tarvitsemamme joustavuuden ja skaalautuvuuden. Olemme erittäin kiitollisia, että meillä on niin lahjakas ja osaava tukitiimi puolellamme.”
Yhteenveto
Tässä viestissä kerroimme, kuinka SageMaker ja SageMaker Processing ovat mahdollistaneet Vericastin rakentamisen hallitun, tehokkaan ja kustannustehokkaan tietojenkäsittelykehyksen suurille tietomäärille. Yhdistämällä SageMaker Processingin tehon ja joustavuuden muihin AWS-palveluihin, he voivat helposti seurata yleistä ominaisuussuunnitteluprosessia. Ne voivat automaattisesti havaita mahdolliset ongelmat, jotka johtuvat laskennan, muistin ja muiden tekijöiden puutteesta, ja toteuttavat automaattisesti pysty- ja vaakaskaalauksen tarpeen mukaan.
SageMaker ja sen työkalut voivat myös auttaa joukkuettasi saavuttamaan ML-tavoitteensa. Lisätietoja SageMaker Processingista ja siitä, kuinka se voi auttaa tietojenkäsittelyn työkuormissa, on osoitteessa Käsittele tiedot. Jos olet vasta aloittamassa ML:n käyttöä ja etsit esimerkkejä ja ohjeita, Amazon SageMaker JumpStart voi saada sinut alkuun. JumpStart on ML-keskitin, josta pääset käsiksi sisäänrakennetuille algoritmeille, joissa on esikoulutettuja perusmalleja, jotka auttavat sinua suorittamaan tehtäviä, kuten artikkelien yhteenvedon ja kuvien luomisen, sekä valmiita ratkaisuja yleisten käyttötapausten ratkaisemiseen.
Lopuksi, jos tämä viesti auttaa sinua tai innostaa sinua ratkaisemaan ongelman, haluaisimme kuulla siitä! Ole hyvä ja jaa kommenttisi ja palautteesi.
Tietoja Tekijät
Anthony McClure on Senior Partner Solutions -arkkitehti AWS SaaS Factory -tiimin kanssa. Anthonylla on myös vahva kiinnostus koneoppimisesta ja tekoälystä, joka työskentelee AWS ML/AI Technical Field Communityn kanssa auttaakseen asiakkaita tuomaan koneoppimisratkaisunsa todellisuuteen.
Jyoti Sharma on tietotekniikan insinööri Vericastin koneoppimisalustatiimissä. Hän on intohimoinen kaikista datatieteen näkökohdista ja keskittyy erittäin skaalautuvan ja hajautetun koneoppimisalustan suunnitteluun ja toteuttamiseen.
Sharmo Sarkar on Vericastin vanhempi johtaja. Hän johtaa Vericastin Cloud Machine Learning Platform- ja Marketing Platform ML R&D -tiimejä. Hänellä on laaja kokemus Big Data Analyticsista, hajautetusta tietojenkäsittelystä ja luonnollisen kielen käsittelystä. Työn ulkopuolella hän nauttii moottoripyöräilystä, patikoinnista ja pyöräilystä vuoristopoluilla.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoAiStream. Web3 Data Intelligence. Tietoa laajennettu. Pääsy tästä.
- Tulevaisuuden lyöminen Adryenn Ashley. Pääsy tästä.
- Osta ja myy osakkeita PRE-IPO-yhtiöissä PREIPO®:lla. Pääsy tästä.
- Lähde: https://aws.amazon.com/blogs/machine-learning/how-vericast-optimized-feature-engineering-using-amazon-sagemaker-processing/
- :on
- :On
- :ei
- :missä
- $ YLÖS
- 1
- 10
- 100
- 15%
- 7
- a
- Meistä
- pääsy
- sen mukaisesti
- Tili
- Saavuttaa
- Aktivointi
- säädökset
- lisätä
- lisä-
- lisää
- lisä-
- asianmukaisesti
- Jälkeen
- vastaan
- aids
- tavoitteet
- hälytys
- algoritmi
- algoritmit
- Kaikki
- yksin
- pitkin
- jo
- Myös
- Amazon
- Amazon Sage Maker
- määrä
- an
- Analytics
- ja
- Toinen
- Anthony
- Kaikki
- api
- sopiva
- arkkitehtuuri
- OVAT
- ALUE
- noin
- artikkeli
- keinotekoinen
- tekoäly
- AS
- ulkomuoto
- näkökohdat
- osoitettu
- auttaa
- At
- auto
- automatisoida
- automaattisesti
- keskimäärin
- AWS
- AWS-asiantuntijapalvelut
- pohja
- perustua
- BE
- koska
- tulevat
- ollut
- ovat
- Hyödyt
- PARAS
- Jälkeen
- Iso
- Big Data
- Suurimmat
- edistää
- sekä
- Tuominen
- rakentaa
- Rakentaminen
- rakennettu
- sisäänrakennettu
- liiketoiminta
- mutta
- by
- laskettu
- soittaa
- Kampanja
- CAN
- Voi saada
- Kaappaaminen
- tapaus
- tapauksissa
- Aiheuttaa
- aiheuttaen
- tietty
- haastava
- Muutokset
- luokka
- luokat
- luokittelu
- asiakas
- asiakkaan lennolle pääsy
- asiakkaat
- pilvi
- Cluster
- koodi
- Sarake
- yhdistelmä
- yhdistely
- tulee
- kommentit
- Yhteinen
- yhteisö
- yritys
- täydellinen
- Täydentää
- monimutkaisuus
- monimutkainen
- osat
- Vaarantunut
- Laskea
- tietojenkäsittely
- käsite
- käsitteet
- Konfigurointi
- Harkita
- harkittu
- ottaen huomioon
- pitää
- rajoitteet
- sisältää
- Kontit
- jatkaa
- jatkuu
- Hinta
- kustannustehokas
- voisi
- kuponki
- luoda
- luotu
- luominen
- kriteerit
- Ylittää
- Nykyinen
- Tällä hetkellä
- asiakassuhde
- asiakas
- Asiakkaat
- tiedot
- Data Analytics
- Tietojen valmistelu
- tietojenkäsittely
- tietojenkäsittely
- tietojen tutkija
- data-driven
- aineistot
- päättää
- päätökset
- omistautunut
- syvä
- Delta
- Väestötiedot
- riippuvainen
- käyttöönotto
- on kuvattu
- Malli
- suunniteltu
- suunnittelu
- yksityiskohta
- yksityiskohdat
- määritetty
- Kehitys
- eri
- erilaiset
- vaikeus
- ohjata
- Alennus
- pohtia
- jaettu
- hajautettu laskenta
- ajanut
- kuljettaja
- kaksi
- dynaaminen
- dynaamisesti
- kukin
- Aikaisemmin
- helpottaa
- helposti
- myöskään
- käytössä
- mahdollistaa
- insinööri
- Tekniikka
- Engineers
- varmistaa
- Koko
- ympäristö
- ympäristöissä
- yhtäläinen
- Vastaava
- arvioida
- arviointiin
- arviointi
- tapahtuma
- Tapahtumat
- esimerkki
- Esimerkit
- Paitsi
- olemassa
- Laajentaa
- odotettu
- odottaa
- experience
- Tutkiminen
- ilmauksia
- laaja
- Kattava kokemus
- tekijät
- tehdas
- FAIL
- Epäonnistuminen
- Ominaisuus
- Ominaisuudet
- Fed
- palaute
- harvat
- ala
- lopullinen
- viimeistelty
- Etunimi
- sovittaa
- Joustavuus
- joustava
- keskityttiin
- jälkeen
- seuraa
- varten
- lomakkeet
- perusta
- Puitteet
- alkaen
- täysin
- toiminto
- tehtävät
- Lisäksi
- tulevaisuutta
- keräys
- general
- syntyy
- synnyttää
- sukupolvi
- saada
- saada
- tietty
- Go
- tavoite
- Tavoitteet
- Goes
- hyvä
- GPU
- kiitollinen
- ohjaus
- HAD
- kahva
- tapahtuu
- Olla
- ottaa
- he
- kuulla
- raskas
- raskas nosto
- auttaa
- auttaa
- korkean tason
- korkealaatuisia
- Korostaa
- erittäin
- historia
- Vaakasuora
- vaakasuunnassa
- Miten
- Miten
- Kuitenkin
- HTML
- http
- HTTPS
- Napa
- ihmisen
- Aitajuoksu
- i
- tunnistettu
- if
- havainnollistaa
- kuva
- toteuttaa
- täytäntöönpano
- täytäntöönpanosta
- tärkeä
- parantaa
- in
- Muilla
- sisältää
- Mukaan lukien
- sisältävät
- Kasvaa
- kasvoi
- uskomaton
- henkilökohtainen
- Erikseen
- tiedot
- Infrastruktuuri
- ensimmäinen
- Osaa aloittaa
- esimerkki
- instrumentaalinen
- Älykkyys
- aikovat
- korko
- liitäntä
- sisäinen
- interventio
- tulee
- osallistuva
- kysymys
- kysymykset
- IT
- SEN
- Job
- Työpaikat
- jpg
- vain
- laji
- Tietää
- Lack
- Kieli
- suuri
- suureksi osaksi
- suurempi
- myöhemmin
- Liidit
- OPPIA
- oppiminen
- vähiten
- Kirjasto
- nosto
- rajoitus
- rajoitukset
- rajat
- Lista
- vähän
- log
- hakkuu
- looginen
- kauemmin
- näköinen
- menettää
- rakkaus
- kone
- koneoppiminen
- ylläpitää
- ylläpitäminen
- ylläpitää
- tehdä
- TEE
- Tekeminen
- onnistui
- johtaja
- manipuloitu
- tapa
- monet
- Marketing
- matematiikka
- Saattaa..
- Tavata
- Muisti
- viesti
- Metadata
- metrinen
- Metrics
- ehkä
- mielessä
- minimi
- ML
- malli
- mallit
- Moduulit
- Moduulit
- hetki
- monitori
- seurataan
- seuranta
- näytöt
- lisää
- eniten
- enimmäkseen
- Vuori
- moninkertainen
- täytyy
- Luonnollinen
- Luonnollinen kielen käsittely
- luonto
- Tarve
- tarvitaan
- tarvitsevat
- tarpeet
- Uusi
- solmut
- etenkin
- Ilmoitus..
- ilmoituksen
- ilmoitukset
- nyt
- numero
- tavoitteet
- tarkkailla
- of
- usein
- on
- Tarpeen vaatiessa
- Laivalla
- perehdytyksessä
- ONE
- jatkuva
- vain
- operaattori
- optimaalinen
- Optimoida
- optimoitu
- or
- alkuperäinen
- Muut
- meidän
- ulos
- Tulos
- ulostulo
- ulkopuolella
- yli
- yleinen
- Voittaa
- yleiskatsaus
- parametrit
- osa
- erityinen
- kumppani
- Ohimenevä
- intohimoinen
- Kuvio
- osuus
- Suorittaa
- suorituskyky
- ehkä
- aikoja
- näkökulma
- kuva
- putki
- Paikka
- suunnitteilla
- foorumi
- Platforms
- Platon
- Platonin tietotieto
- PlatonData
- Pelaa
- soittaa
- Ole hyvä
- plus
- Kohta
- pistettä
- kehno
- mahdollinen
- Kirje
- mahdollinen
- teho
- ennustamiseen
- edellinen
- todennäköisesti
- Ongelma
- ongelmia
- prosessi
- Käsitelty
- käsittely
- tuottaa
- Tuotteet
- tuotanto
- ammatillinen
- toimittaa
- mikäli
- tarjoaa
- laittaa
- laatu
- nopea
- nopeammin
- T & K-
- pikemminkin
- raaka
- tavoittaa
- Lue
- valmis
- Todellisuus
- reason
- asiakirjat
- toipua
- elpyminen
- Vähentynyt
- viittaa
- liittyvä
- merkityksellinen
- jäädä
- jäljellä oleva
- raportti
- tarvitaan
- vaatimukset
- resurssi
- Esittelymateriaalit
- Vastata
- johtua
- Saatu ja
- luja
- Rooli
- karkeasti
- Sääntö
- ajaa
- juoksu
- SaaS
- sagemaker
- sama
- sanoo
- skaalautuvuus
- skaalautuva
- Asteikko
- skaalaus
- Skaalausratkaisu
- skenaariot
- tiede
- Tiedemies
- tutkijat
- sekuntia
- osiot
- valittu
- valinta
- lähettää
- lähettää
- vanhempi
- Herkkyys
- erillinen
- erottamalla
- palvelu
- Palvelut
- setti
- Setit
- useat
- Jaa:
- yhteinen
- Sharma
- hän
- esitetty
- Näytä
- puoli
- merkittävä
- samankaltainen
- Yksinkertainen
- Koko
- So
- ratkaisu
- Ratkaisumme
- SOLVE
- Tila
- erityinen
- erityisesti
- nopeus
- Kierre
- vaiheissa
- standardi
- seisoo
- Alkaa
- alkoi
- alkaa
- Osavaltio
- Tila
- Vaihe
- Askeleet
- Yhä
- pysähtynyt
- pysäyttäminen
- Lopettaa
- Levytila
- varastot
- jono
- vahva
- jäsennelty
- tilaajat
- menestys
- Onnistuneesti
- niin
- tuki
- järjestelmä
- järjestelmät
- taulukko
- Räätälöity
- ottaa
- vie
- lahjakas
- Tehtävä
- tehtävät
- joukkue-
- tiimit
- Tekninen
- ehdot
- kuin
- että
- -
- Tulevaisuus
- heidän
- Niitä
- sitten
- Siellä.
- siksi
- Nämä
- ne
- kolmas
- tätä
- ne
- kolmella
- kynnys
- Kautta
- aika
- kertaa
- että
- yhdessä
- työkalut
- Yhteensä
- Juna
- koulutus
- kauppa
- maksutapahtuman tiedot
- Muuttaa
- Muutos
- muunnokset
- laukaista
- laukeaa
- kaksi
- tyyppi
- tyypillinen
- varten
- ymmärtäminen
- yksiköt
- asti
- päivitetty
- us
- käyttökelpoinen
- Käyttö
- käyttää
- käyttölaukku
- käytetty
- käyttämällä
- validointi
- arvo
- eri
- pystysuora
- tilavuus
- volyymit
- vs
- halusi
- oli
- katsomassa
- Tapa..
- we
- HYVIN
- kun
- joka
- KUKA
- koko
- kokonaan
- tulee
- voittaa
- with
- sisällä
- Referenssit
- työnkulkuja
- työskentely
- toimii
- huonompi
- olisi
- kirjoittaminen
- vielä
- tuotto
- Voit
- Sinun
- zephyrnet