Sisäänrakennettu PaddleOCR ja Amazon SageMaker Projects MLOps:ille optisen merkintunnistuksen suorittamiseksi henkilöasiakirjoissa PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Sisäänrakennettu PaddleOCR ja Amazon SageMaker Projects MLO:ille optisen merkintunnistuksen suorittamiseksi henkilöasiakirjoissa

Optinen merkintunnistus (OCR) on tehtävä painetun tai käsinkirjoitetun tekstin muuntamiseksi konekoodatuksi tekstiksi. Tekstintunnistusta on käytetty laajasti erilaisissa skenaarioissa, kuten asiakirjojen elektronisoinnissa ja henkilöllisyyden todentamisessa. Koska OCR voi merkittävästi vähentää manuaalista työtä tärkeimpien tietojen rekisteröinnissä ja toimia syöttövaiheena suurten asiakirjojen ymmärtämiseen, tarkka OCR-järjestelmä on ratkaisevassa asemassa digitaalisen muutoksen aikakaudella.

Avoimen lähdekoodin yhteisö ja tutkijat keskittyvät siihen, kuinka parantaa OCR-tarkkuutta, helppokäyttöisyyttä, integrointia valmiiksi koulutettuihin malleihin, laajennusta ja joustavuutta. Monien ehdotettujen puitteiden joukossa PaddleOCR on saanut viime aikoina yhä enemmän huomiota. Ehdotettu viitekehys keskittyy suuren tarkkuuden saavuttamiseen samalla kun laskennallinen tehokkuus tasapainotetaan. Lisäksi kiinan ja englannin esiopetetut mallit tekevät siitä suositun kiinan kielipohjaisilla markkinoilla. Katso PaddleOCR GitHub repo lisätietoja.

Olemme AWS:ssä myös ehdottaneet integroituja tekoälypalveluita, jotka ovat käyttövalmiita ilman koneoppimisen (ML) asiantuntemusta. Voit poimia asiakirjoista tekstiä ja jäsenneltyä dataa, kuten taulukoita ja lomakkeita, käyttämällä Amazonin teksti. Se käyttää ML-tekniikoita minkä tahansa tyyppisten asiakirjojen lukemiseen ja käsittelemiseen, ja se poimii tarkasti tekstin, käsinkirjoituksen, taulukot ja muut tiedot ilman manuaalista vaivaa.

Tietotieteilijöille, jotka haluavat joustavasti käyttää avoimen lähdekoodin kehystä oman OCR-mallin kehittämiseen, tarjoamme myös täysin hallitun ML-palvelun. Amazon Sage Maker. SageMakerin avulla voit ottaa käyttöön MLOpsin parhaita käytäntöjä koko ML-elinkaarin ajan, ja se tarjoaa malleja ja työkalusarjoja, jotka vähentävät ML-projektien tuotantoon liittyvää erilaista raskasta nostoa.

Tässä viestissä keskitymme räätälöityjen mallien kehittämiseen SageMakerin PaddleOCR-kehyksen sisällä. Käymme läpi ML-kehityksen elinkaaren havainnollistaaksemme, kuinka SageMaker voi auttaa sinua rakentamaan ja kouluttamaan mallia ja lopulta ottamaan mallin käyttöön verkkopalveluna. Vaikka kuvaamme tätä ratkaisua PaddleOCR:llä, yleiset ohjeet pätevät mielivaltaisille SageMakerissa käytettäville kehyksille. Tämän viestin mukana toimitamme myös mallikoodin GitHub-arkisto.

PaddleOCR-kehys

PaddleOCR on laajalti käytetty OCR-kehys, joka sisältää RTF-tunnistuksen, tekstintunnistuksen ja päästä päähän -algoritmeja. Se valitsee Differentiable Binarisation (DB) ja Convolutional Recurrent Neural Network (CRNN) perustunnistus- ja tunnistusmalleiksi ja ehdottaa sarjaa malleja, nimeltään PP-OCR, teollisuussovelluksiin useiden optimointistrategioiden jälkeen.

PP-OCR-malli on suunnattu yleisiin skenaarioihin ja muodostaa mallikirjaston eri kielistä. Se koostuu kolmesta osasta: tekstin tunnistus, laatikon tunnistus ja oikaisu sekä tekstin tunnistus, jotka esitetään seuraavassa PaddleOCR:n kuvassa virallinen GitHub-arkisto. Voit myös viitata tutkimuspaperiin PP-OCR: Käytännöllinen erittäin kevyt OCR-järjestelmä lisätietoja.

Tarkemmin sanottuna PaddleOCR koostuu kolmesta peräkkäisestä tehtävästä:

  • Tekstin tunnistus – Tekstintunnistuksen tarkoituksena on paikantaa tekstialue kuvasta. Tällaiset tehtävät voivat perustua yksinkertaiseen segmentointiverkkoon.
  • Laatikon tunnistus ja korjaus – Jokainen tekstiruutu on muutettava vaakasuuntaiseksi suorakaiteen muotoiseksi laatikoksi myöhempää tekstin tunnistamista varten. Tätä varten PaddleOCR ehdottaa tekstin suunnan luokittelijan (kuvan luokittelutehtävän) opettamista tekstin suunnan määrittämiseksi.
  • Tekstin tunnistus – Kun tekstiruutu on havaittu, tekstintunnistusmalli tekee päättelyn jokaisesta tekstilaatikosta ja tulostaa tulokset tekstilaatikon sijainnin mukaan. PaddleOCR käyttää laajalti käytettyä menetelmää CRNN.

PaddleOCR tarjoaa korkealaatuisia esikoulutettuja malleja, jotka ovat verrattavissa kaupallisiin tehosteisiin. Voit joko käyttää esikoulutettua mallia tunnistusmallina, suunnan luokittelijana tai tunnistusmallina, tai voit hienosäätää ja kouluttaa jokaisen yksittäisen mallin käyttötarkoitustasi varten. Perinteisen kiinan ja englannin tunnistamisen tehokkuuden ja tehokkuuden lisäämiseksi kuvaamme tekstintunnistusmallin hienosäätöä. Valitsemamme esikoulutettu malli on ch_ppocr_mobile_v2.0_rec_train, joka on kevyt malli, joka tukee kiinaa, englantia ja numeroiden tunnistusta. Seuraavassa on esimerkki päättelytuloksesta Hongkongin henkilökorttia käyttäen.

Sisäänrakennettu PaddleOCR ja Amazon SageMaker Projects MLOps:ille optisen merkintunnistuksen suorittamiseksi henkilöasiakirjoissa PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Seuraavissa osioissa käymme läpi, kuinka esikoulutettu malli voidaan hienosäätää SageMakerilla.

MLOps parhaita käytäntöjä SageMakerilla

SageMaker on täysin hallittu ML-palvelu. SageMakerin avulla datatieteilijät ja -kehittäjät voivat nopeasti ja helposti rakentaa ja kouluttaa ML-malleja ja ottaa ne sitten suoraan käyttöön tuotantovalmiissa hallitussa ympäristössä.

Monet datatieteilijät käyttävät SageMakeria ML:n elinkaaren nopeuttamiseen. Tässä osiossa havainnollistetaan, kuinka SageMaker voi auttaa sinua kokeilemisesta ML:n tuotantoon. Seuraamalla ML-projektin vakiovaiheita kokeellisesta lauseesta (koodin kehittäminen ja kokeilut) operatiiviseen lauseeseen (mallin koontityönkulun ja käyttöönottoputkien automatisointi), SageMaker voi tuoda tehokkuutta seuraavissa vaiheissa:

  1. Tutki dataa ja rakenna ML-koodi sen avulla Amazon SageMaker Studio muistikirjat.
  2. Harjoittele ja viritä mallia SageMaker-koulutustyöllä.
  3. Ota malli käyttöön SageMaker-päätepisteellä mallin käyttöä varten.
  4. Orkesteroi työnkulku käyttämällä Amazon SageMaker -putkistot.

Seuraava kaavio havainnollistaa tätä arkkitehtuuria ja työnkulkua.

Sisäänrakennettu PaddleOCR ja Amazon SageMaker Projects MLOps:ille optisen merkintunnistuksen suorittamiseksi henkilöasiakirjoissa PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

On tärkeää huomata, että voit käyttää SageMakeria modulaarisesti. Voit esimerkiksi rakentaa koodisi paikallisella integroidulla kehitysympäristöllä (IDE) ja kouluttaa ja ottaa mallin käyttöön SageMakerissa, tai voit kehittää ja kouluttaa malliasi omissa klusterin laskentalähteissäsi ja käyttää SageMaker-putkia työnkulun organisointiin ja ottaa käyttöön SageMaker-päätepisteessä. Tämä tarkoittaa, että SageMaker tarjoaa avoimen alustan mukautumaan omiin tarpeisiisi.

Katso koodi sivuiltamme GitHub-arkisto ja README ymmärtääksesi koodin rakenteen.

Järjestä SageMaker-projekti

Voit käyttää Amazon SageMaker -projektit aloittaaksesi matkasi. SageMaker-projektin avulla voit hallita Git-arkistojesi versioita, jotta voit tehdä yhteistyötä tiimien välillä tehokkaammin, varmistaa koodin johdonmukaisuuden ja mahdollistaa jatkuvan integroinnin ja jatkuvan toimituksen (CI/CD). Vaikka muistikirjat ovat hyödyllisiä mallien rakentamisessa ja kokeilussa, kun datatieteilijöiden ja ML-insinöörien tiimi työskentelee ML-ongelman parissa, tarvitset skaalautuvamman tavan ylläpitää koodin johdonmukaisuutta ja tiukempaa versionhallintaa.

SageMaker-projektit luovat esikonfiguroidun MLOps-mallin, joka sisältää olennaiset osat PaddleOCR-integraation yksinkertaistamiseksi:

  • CI/CD-työkaluihin integroitu koodivarasto mukautettujen säilön kuvien rakentamiseen käsittelyä, koulutusta ja päätelmiä varten. Tämän avulla voimme määrittää mukautetun Docker-kuvamme ja työntää sen Amazonin elastisten säiliörekisteri (Amazon ECR) on käyttövalmis.
  • SageMaker-putki, joka määrittää vaiheet tietojen valmistelua, koulutusta, mallin arviointia ja mallin rekisteröintiä varten. Tämä valmistaa meidät olemaan MLOps-valmiita, kun ML-projekti menee tuotantoon.
  • Muita hyödyllisiä resursseja, kuten Git-varasto koodiversioiden hallintaa varten, malliryhmä, joka sisältää malliversioita, koodinmuutostriggeri mallin koontiprosessille ja tapahtumapohjainen liipaisin mallin käyttöönottoputkelle.

Voit käyttää SageMaker-siemenkoodia tavallisten SageMaker-projektien luomiseen tai tietyn mallin, jonka organisaatiosi loi tiimin jäsenille. Tässä viestissä käytämme standardia MLOps-malli kuvanrakennusta, mallinrakennusta ja mallin käyttöönottoa varten. Lisätietoja projektin luomisesta Studiossa on kohdassa Luo MLOps-projekti käyttämällä Amazon SageMaker Studiota.

Tutki dataa ja rakenna ML-koodia SageMaker Studio -muistikirjoilla

SageMaker Studio -muistikirjat ovat yhteiskäyttöisiä muistikirjoja, jotka voit käynnistää nopeasti, koska sinun ei tarvitse määrittää laskentaesiintymiä ja tiedostojen tallennustilaa etukäteen. Monet datatieteilijät käyttävät mieluummin tätä verkkopohjaista IDE-sovellusta ML-koodin kehittämiseen, nopeaan kirjasto-API-virheenkorjaukseen ja asioiden suorittamiseen pienellä datanäytteellä harjoituskomentosarjan vahvistamiseksi.

Studio-muistikirjoissa voit käyttää valmiiksi rakennettua ympäristöä yleisille kehyksille, kuten TensorFlow, PyTorch, Pandas ja Scikit-Learn. Voit asentaa riippuvuudet valmiiksi rakennettuun ytimeen tai rakentaa oman pysyvän ytimen näköistiedoston. Lisätietoja on kohdassa Asenna ulkoiset kirjastot ja ytimet Amazon SageMaker Studioon. Studio-muistikirjat tarjoavat myös Python-ympäristön, joka käynnistää SageMaker-koulutustöitä, käyttöönottoa tai muita AWS-palveluita. Seuraavissa osissa havainnollistetaan, kuinka Studio-kannettavia käytetään ympäristönä koulutus- ja käyttöönottotöiden käynnistämiseen.

SageMaker tarjoaa tehokkaan IDE:n; se on avoin ML-alusta, jossa datatieteilijät voivat käyttää haluamaansa kehitysympäristöä joustavasti. Tietotieteilijät, jotka suosivat paikallista IDE:tä, kuten PyCharmia tai Visual Studio Codea, voivat käyttää paikallista Python-ympäristöä ML-koodin kehittämiseen ja SageMakerin avulla harjoitteluun hallitussa skaalautuvassa ympäristössä. Katso lisätietoja Suorita TensorFlow -työsi Amazon SageMakerissa PyCharm IDE: n kanssa. Kun sinulla on vankka malli, voit ottaa käyttöön MLOpsin parhaat käytännöt SageMakerin avulla.

Tällä hetkellä SageMaker tarjoaa myös SageMaker-muistikirjan esiintymät vanhana ratkaisunamme Jupyter Notebook -ympäristöön. Sinulla on joustavuus suorittaa Docker build -komento ja käytä SageMaker-paikallista tilaa harjoitellaksesi kannettavan tietokoneen ilmentymässä. Tarjoamme myös esimerkkikoodin PaddleOCR:lle koodivarastoissamme: ./train_and_deploy/notebook.ipynb.

Rakenna mukautettu kuva SageMaker-projektimallilla

SageMaker käyttää laajasti Docker-säilöjä rakentamiseen ja ajonaikaisiin tehtäviin. Voit käyttää omaa konttiasi SageMakerilla helposti. Katso tarkemmat tekniset tiedot osoitteessa Käytä omia harjoitusalgoritmejasi.

Tietojen tutkijana kontin rakentaminen ei kuitenkaan välttämättä ole yksinkertaista. SageMaker-projektit tarjoavat yksinkertaisen tavan hallita mukautettuja riippuvuuksia kuvanrakennuksen CI/CD-putkilinjan kautta. Kun käytät SageMaker-projektia, voit tehdä päivityksiä harjoituskuvaan mukautetulla säilön Dockerfile-tiedostolla. Katso vaiheittaiset ohjeet kohdasta Luo Amazon SageMaker -projekteja kuvarakentamisen CI/CD -putkilinjoilla. Mallissa olevan rakenteen avulla voit muokata tässä arkistossa toimitettua koodia PaddleOCR-harjoitussäiliön rakentamiseksi.

Tässä viestissä esittelemme mukautetun kuvan rakentamisen yksinkertaisuutta käsittelyä, koulutusta ja päätelmiä varten. GitHub-repo sisältää kolme kansiota:

Nämä hankkeet noudattavat samanlaista rakennetta. Otetaan esimerkkinä harjoitussäiliökuva; the image-build-train/ arkisto sisältää seuraavat tiedostot:

  • Codebuild-buildspec.yml-tiedosto, jota käytetään määritysten tekemiseen AWS CodeBuild jotta kuva voidaan rakentaa ja siirtää Amazon ECR:ään.
  • Docker-koontiversiossa käytetty Docker-tiedosto, joka sisältää kaikki riippuvuudet ja harjoituskoodin.
  • Koulutusskriptin train.py aloituspiste, jossa on kaikki hyperparametrit (kuten oppimisnopeus ja eräkoko), jotka voidaan määrittää argumentiksi. Nämä argumentit määritetään, kun aloitat koulutustyön.
  • Riippuvuudet.

Kun työnnät koodin vastaavaan arkistoon, se laukeaa AWS-koodiputki rakentaaksesi koulutuskontin sinulle. Mukautettu säilön kuva on tallennettu Amazon ECR -tietovarastoon, kuten edellisessä kuvassa näkyy. Samanlaista menettelyä käytetään päättelykuvan luomiseen.

Harjoittele mallia SageMaker koulutus-SDK:lla

Kun algoritmikoodisi on validoitu ja pakattu säilöön, voit käyttää SageMaker-harjoitustyötä hallitun ympäristön luomiseen mallin kouluttamiseksi. Tämä ympäristö on lyhytaikainen, mikä tarkoittaa, että sinulla voi olla erilliset, turvalliset laskentaresurssit (kuten GPU) tai usean näytönohjaimen hajautettu ympäristö koodisi suorittamiseen. Kun koulutus on valmis, SageMaker tallentaa tuloksena olevat mallin artefaktit an Amazonin yksinkertainen tallennuspalvelu (Amazon S3) määrittämäsi sijainti. Kaikki lokitiedot ja metatiedot säilyvät AWS-hallintakonsoli, Studio ja amazonin pilvikello.

Koulutustyö sisältää useita tärkeitä tietoja:

  • Sen S3-alueen URL-osoite, johon tallensit harjoitustiedot
  • Sen S3-ryhmän URL-osoite, johon haluat tallentaa työn tulosteen
  • Hallitut laskentaresurssit, joita haluat SageMakerin käyttävän mallikoulutukseen
  • Amazon ECR -polku, johon harjoitussäiliö on tallennettu

Lisätietoja koulutustehtävistä, katso Junamallit. Koulutustyön esimerkkikoodi on saatavilla osoitteessa experiments-train-notebook.ipynb.

SageMaker tekee hyperparametrit a CreateTrainingJob pyyntö saatavilla Docker-säiliössä /opt/ml/input/config/hyperparameters.json tiedosto.

Käytämme mukautettua koulutussäiliötä sisääntulopisteenä ja määritämme GPU-ympäristön infrastruktuurille. Kaikki asiaankuuluvat hyperparametrit ovat yksityiskohtaisesti parametreja, joiden avulla voimme seurata jokaista yksittäistä työkokoonpanoa ja verrata niitä kokeilun seurantaan.

Koska datatiedeprosessi on hyvin tutkimuskeskeinen, on yleistä, että useita kokeita on käynnissä rinnakkain. Tämä edellyttää lähestymistapaa, joka pitää kirjaa kaikista erilaisista kokeiluista, erilaisista algoritmeista ja mahdollisesti erilaisista datajoukoista ja hyperparametreistä. Amazon SageMaker Experimentsin avulla voit järjestää, seurata, vertailla ja arvioida ML-kokeilujasi. Osoitamme tämän myös mm experiments-train-notebook.ipynb. Katso lisätietoja osoitteesta Hallitse koneoppimista Amazon SageMaker Experimentsin avulla.

Ota malli käyttöön mallin näyttämistä varten

Mitä tulee käyttöönottoon, erityisesti reaaliaikaiseen mallinpalveluun, monien datatieteilijöiden voi olla vaikeaa tehdä ilman käyttöryhmien apua. SageMakerin avulla on helppo ottaa käyttöön koulutettu mallisi tuotantoon SageMaker Python SDK. Voit ottaa mallin käyttöön SageMaker-isännöintipalveluissa ja saada päätepisteen käytettäväksi reaaliaikaisten päätelmien tekemiseen.

Monissa organisaatioissa datatutkijat eivät ehkä ole vastuussa päätepisteinfrastruktuurin ylläpidosta. Kuitenkin mallin testaaminen päätepisteenä ja oikean ennustuskäyttäytymisen takaaminen on todellakin datatieteilijöiden vastuulla. Siksi SageMaker yksinkertaisti käyttöönoton tehtäviä lisäämällä joukon työkaluja ja SDK:ta tätä varten.

Viestin käyttötapauksessa haluamme reaaliaikaisia, vuorovaikutteisia, matalan viiveen ominaisuuksia. Reaaliaikainen päätelmä sopii tähän päättelytyökuormaan. On kuitenkin monia vaihtoehtoja, jotka mukautuvat kuhunkin erityiseen tarpeeseen. Lisätietoja on kohdassa Ota mallit käyttöön johtopäätösten tekemiseen.

Mukautetun kuvan käyttöönottamiseksi datatieteilijät voivat käyttää SageMaker SDK:ta, joka on kuvattu osoitteessa

experiments-deploy-notebook.ipynb.

In create_model pyynnöstä säilön määritelmä sisältää ModelDataUrl parametri, joka identifioi Amazon S3 -paikan, johon malliartefaktit on tallennettu. SageMaker käyttää näitä tietoja määrittääkseen, mistä mallin artefaktit kopioidaan. Se kopioi artefaktit tiedostoon /opt/ml/model hakemisto päättelykoodisi käytettäväksi. The serve ja predictor.py on palvelun aloituspiste mallin artefaktin kanssa, joka ladataan, kun aloitat käyttöönoton. Katso lisätietoja Käytä omaa johtopäätöskoodiasi isännöintipalveluissa.

Suunnittele työnkulkusi SageMaker Pipelinesin avulla

Viimeinen vaihe on kääriä koodi päästä päähän ML-työnkuluiksi ja soveltaa MLOpsin parhaita käytäntöjä. SageMakerissa mallinrakennustyökuormaa, ohjattua asyklistä graafia (DAG), hallitsee SageMaker Pipelines. Pipelines on täysin hallittu palvelu, joka tukee orkestrointia ja datalinjan seurantaa. Lisäksi, koska Pipelines on integroitu SageMaker Python SDK:n kanssa, voit luoda liukuhihnat ohjelmallisesti käyttämällä korkean tason Python-käyttöliittymää, jota käytimme aiemmin harjoitusvaiheessa.

Tarjoamme esimerkin putkikoodista havainnollistamaan toteutusta osoitteessa pipeline.py.

Liukulinja sisältää esikäsittelyvaiheen tietojoukon luomista varten, koulutusvaiheen, ehtovaiheen ja mallin rekisteröintivaiheen. Jokaisen prosessin lopussa datatutkijat saattavat haluta rekisteröidä mallinsa versionhallintaa varten ja ottaa käyttöön parhaiten toimivan mallin. SageMaker-mallirekisteri tarjoaa keskeisen paikan malliversioiden, luettelomallien hallintaan ja automaattisen mallin käyttöönoton käynnistämiseen tietyn mallin hyväksymistilassa. Katso lisätietoja osoitteesta Rekisteröi ja ota käyttöön malleja mallirekisterin avulla.

ML-järjestelmässä automaattinen työnkulun organisointi auttaa estämään mallin suorituskyvyn heikkenemistä, toisin sanoen mallin ajautumista. Tietojen poikkeamien varhainen ja ennakoiva havaitseminen mahdollistaa korjaavien toimenpiteiden, kuten mallien uudelleenkoulutuksen. Voit laukaista SageMaker-liukuhihnan kouluttamaan mallin uuden version, kun poikkeamat on havaittu. Putkilinjan laukaisu voidaan määrittää myös Amazon SageMaker -mallimonitori, joka seuraa jatkuvasti tuotannossa olevien mallien laatua. Tiedonkeruukyvyn ansiosta Model Monitor tukee tietojen ja mallien laadun seurantaa, harhaa ja ominaisuuksien attribuutiomuutoksia. Katso lisätietoja Tarkkaile malleja tietojen ja mallien laadun, harhan ja selitettävyyden suhteen.

Yhteenveto

Tässä viestissä havainnollistimme PaddleOCR-kehyksen suorittamisen SageMakerissa OCR-tehtäviä varten. Auttaaksemme datatieteilijöitä helposti SageMakerissa, kävimme läpi ML-kehityksen elinkaaren algoritmien rakentamisesta koulutukseen ja mallin isännöintiin verkkopalveluna reaaliaikaisten päätelmien tekemiseen. Voit käyttää antamaamme mallikoodia mielivaltaisen kehyksen siirtämiseen SageMaker-alustalle. Kokeile sitä ML-projektissasi ja kerro meille menestystarinoistasi.


Tietoja Tekijät

Sisäänrakennettu PaddleOCR ja Amazon SageMaker Projects MLOps:ille optisen merkintunnistuksen suorittamiseksi henkilöasiakirjoissa PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Junyi(Jackie) LIU on AWS:n vanhempi soveltuva tutkija. Hänellä on monen vuoden työkokemus koneoppimisen parista. Hänellä on runsaasti käytännön kokemusta ratkaisujen kehittämisestä ja toteutuksesta koneoppimismallien rakentamisessa toimitusketjun ennustusalgoritmeissa, mainonnan suositusjärjestelmissä, OCR- ja NLP-alueella.

Sisäänrakennettu PaddleOCR ja Amazon SageMaker Projects MLOps:ille optisen merkintunnistuksen suorittamiseksi henkilöasiakirjoissa PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Yanwei Cui, PhD, on koneoppimisen asiantuntijaratkaisujen arkkitehti AWS: ssä. Hän aloitti koneoppimistutkimuksen IRISA: ssa (Tietojenkäsittelytieteen ja satunnaisjärjestelmien tutkimuslaitos), ja hänellä on useiden vuosien kokemus tekoälyllä toimivien teollisen sovellusten rakentamisesta tietokoneiden näkemiseen, luonnollisen kielen käsittelyyn ja käyttäjien käyttäytymisen ennustamiseen. AWS: ssä hän jakaa osaamisaluetta ja auttaa asiakkaita avaamaan liiketoimintamahdollisuuksia ja saavuttamaan toteutettavia tuloksia laajamittaisella koneoppimisella. Työn ulkopuolella hän nauttii lukemisesta ja matkustamisesta.

Sisäänrakennettu PaddleOCR ja Amazon SageMaker Projects MLOps:ille optisen merkintunnistuksen suorittamiseksi henkilöasiakirjoissa PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Yi-An CHEN on ohjelmistokehittäjä Amazon Lab 126:ssa. Hänellä on yli 10 vuoden kokemus koneoppimiseen perustuvien tuotteiden kehittämisestä useilla eri aloilla, mukaan lukien personointi, luonnollisen kielen käsittely ja tietokonenäkö. Työn ulkopuolella hän pitää pitkästä juoksusta ja pyöräilystä.

Aikaleima:

Lisää aiheesta AWS-koneoppiminen