Amazon SageMaker JumpStart tarjoaa nyt Amazon Comprehend -kannettavia mukautettuja luokituksia ja mukautettuja kokonaisuuksia varten PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Amazon SageMaker JumpStart tarjoaa nyt Amazon Comprehend -kannettavia mukautettuja luokituksia ja mukautettuja kokonaisuuksia varten

Amazonin käsitys on luonnollisen kielen käsittelypalvelu (NLP), joka käyttää koneoppimista (ML) löytääkseen oivalluksia tekstistä. Amazon Comprehend tarjoaa mukautettuja ominaisuuksia, mukautetun kokonaisuuden tunnistus, mukautettu luokitusja esikoulutetut sovellusliittymät kuten avainlauseiden poiminta, tunneanalyysi, kokonaisuuden tunnistus ja paljon muuta, jotta voit helposti integroida NLP:n sovelluksiisi.

Lisäsimme äskettäin Amazon Comprehendiin liittyviä muistikirjoja Amazon SageMaker JumpStart muistikirjoja, joiden avulla pääset nopeasti alkuun Amazon Comprehend mukautetun luokittelijan ja mukautetun entiteettitunnistimen käytön. Voit käyttää mukautettua luokittelua asiakirjojen järjestämiseen määrittämiisi luokkiin (luokkiin). Mukautetun entiteetin tunnistus laajentaa Amazon Comprehendin valmiiksi koulutetun entiteettien havaitsemissovellusliittymän kykyä auttaa sinua tunnistamaan entiteettityypit, jotka ovat yksilöllisiä verkkotunnuksellesi tai yrityksellesi ja jotka eivät ole esiasetettuja yleisiä. entiteettityypit.

Tässä viestissä näytämme sinulle, kuinka JumpStartin avulla voit rakentaa mukautettuja luokittelu- ja mukautettuja entiteettien tunnistusmalleja yrityksesi NLP-tarpeisiin.

SageMaker JumpStart

- Amazon SageMaker Studio aloitussivulla on mahdollisuus käyttää JumpStartia. JumpStart tarjoaa nopean tavan päästä alkuun tarjoamalla valmiiksi koulutettuja malleja erilaisiin ongelmatyyppeihin. Voit kouluttaa ja virittää näitä malleja. JumpStart tarjoaa myös muita resursseja, kuten muistikirjoja, blogeja ja videoita.

JumpStart-muistikirjat ovat pohjimmiltaan esimerkkikoodia, jota voit käyttää aloituskohtana päästäksesi alkuun nopeasti. Tällä hetkellä tarjoamme sinulle yli 40 muistikirjaa, joita voit käyttää sellaisenaan tai muokata tarpeen mukaan. Löydät muistikirjasi käyttämällä hakua tai välilehtinäkymää. Kun olet löytänyt muistikirjan, jota haluat käyttää, voit tuoda muistikirjan, mukauttaa sen tarpeidesi mukaan ja valita infrastruktuurin ja ympäristön, jossa tietokonetta käytetään.

Aloita JumpStart-muistikirjojen käyttö

Aloita JumpStart siirtymällä kohtaan Amazon Sage Maker konsoli ja avaa Studio. Viitata Aloita SageMaker Studion käyttö saadaksesi ohjeet Studion käytön aloittamiseen. Suorita sitten seuraavat vaiheet:

  1. Siirry Studiossa JumpStartin aloitussivulle ja valitse Siirry SageMaker JumpStartiin.

Sinulle tarjotaan useita tapoja etsiä. Voit joko käyttää yläosassa olevia välilehtiä löytääksesi haluamasi tai käyttää hakukenttää seuraavassa kuvakaappauksessa.

  1. Löytääksemme muistikirjoja siirrymme osoitteeseen Kannettavat Tab.

Siirry Muistikirjat-välilehteen

Kirjoitushetkellä JumpStart tarjoaa 47 muistikirjaa. Voit käyttää suodattimia löytääksesi Amazon Comprehendiin liittyviä muistikirjoja.

  1. On Sisältötyyppi avattava valikko, valitse muistikirja.

Kuten seuraavassa kuvakaappauksessa näet, meillä on tällä hetkellä kaksi Amazon Comprehend -muistikirjaa.

Etsi Comprehend-muistikirjoja

Seuraavissa osioissa tutkimme molempia muistikirjoja.

Amazon Comprehend mukautettu luokitin

Tässä muistikirjassa näytämme, kuinka käyttää mukautetun luokittelijan API luodaksesi asiakirjan luokitusmallin.

Mukautettu luokitin on täysin hallittu Amazon Comprehend -ominaisuus, jonka avulla voit rakentaa yrityksellesi ainutlaatuisia mukautettuja tekstiluokitusmalleja, vaikka sinulla olisi vähän tai ei ollenkaan ML-asiantuntemusta. Mukautettu luokitin perustuu Amazon Comprehendin olemassa oleviin ominaisuuksiin, jotka on jo koulutettu kymmeniin miljooniin asiakirjoihin. Se tiivistää suuren osan NLP-luokitusmallin rakentamiseen vaadittavasta monimutkaisuudesta. Mukautettu luokitin lataa ja tarkastaa harjoitustiedot automaattisesti, valitsee oikeat ML-algoritmit, kouluttaa mallisi, löytää optimaaliset hyperparametrit, testaa mallin ja tarjoaa mallin suorituskykymittareita. Amazon Comprehend mukautettu luokitin tarjoaa myös helppokäyttöisen konsolin koko ML-työnkulkuun, mukaan lukien tekstin merkitsemiseen käyttämällä Amazon SageMaker Ground Totuus, mallin koulutus ja käyttöönotto sekä testitulosten visualisointi. Amazon Comprehend mukautetun luokittelijan avulla voit rakentaa seuraavat mallit:

  • Moniluokkainen luokitusmalli – Moniluokkaluokituksessa jokaiselle asiakirjalle voi olla määritetty yksi ja vain yksi luokka. Yksittäiset luokat ovat toisensa poissulkevia. Esimerkiksi elokuva voidaan luokitella dokumentiksi tai tieteiskirjalliseksi, mutta ei molempia samanaikaisesti.
  • Usean etiketin luokittelumalli – Monimerkkiluokittelussa yksittäiset luokat edustavat eri luokkia, mutta nämä luokat liittyvät jotenkin toisiinsa eivätkä sulje toisiaan pois. Tämän seurauksena jokaiselle asiakirjalle on määritetty vähintään yksi luokka, mutta niitä voi olla enemmän. Esimerkiksi elokuva voi olla yksinkertaisesti toimintaelokuva tai se voi olla toimintaelokuva, tieteiskirjallisuuselokuva ja komedia, kaikki samaan aikaan.

Tämä muistikirja ei vaadi ML-asiantuntemusta mallin kouluttamiseen esimerkkitietojoukon tai oman yrityskohtaisen tietojoukon kanssa. Voit käyttää tässä muistikirjassa käsiteltyjä API-toimintoja omissa sovelluksissasi.

Amazon mukautettu entiteetin tunnistus

Tässä muistikirjassa näytämme, kuinka käyttää mukautetun entiteetin tunnistussovellusliittymä luodaksesi kokonaisuuden tunnistusmallin.

Mukautettu entiteettien tunnistus laajentaa Amazon Comprehendin ominaisuuksia auttamalla sinua tunnistamaan tietyt entiteettityypit, jotka eivät kuulu esiasetettuihin yleisiin entiteettityyppeihin. Tämä tarkoittaa, että voit analysoida asiakirjoja ja poimia kokonaisuuksia, kuten tuotekoodeja tai yrityskohtaisia ​​kokonaisuuksia, jotka sopivat tarpeisiisi.

Tarkan mukautetun kokonaisuudentunnistimen rakentaminen itse voi olla monimutkainen prosessi, joka edellyttää suurten manuaalisesti merkittyjen koulutusasiakirjojen valmistelua ja oikeiden algoritmien ja parametrien valitsemista mallikoulutukseen. Amazon Comprehend auttaa vähentämään monimutkaisuutta tarjoamalla automaattisia huomautuksia ja mallinkehitystä mukautetun kokonaisuuden tunnistusmallin luomiseksi.

Esimerkkimuistikirja ottaa harjoitustietojoukon CSV-muodossa ja suorittaa päättelyn tekstinsyöttöä vastaan. Amazon Comprehend tukee myös edistynyttä käyttötapausta, joka käyttää Ground Truth -merkinnöillä varustettua dataa koulutukseen ja antaa sinun tehdä suoraan päätelmiä PDF- ja Word-asiakirjoista. Lisätietoja on kohdassa Luo mukautettu entiteetin tunnistus PDF-dokumenteille Amazon Comprehendin avulla.

Amazon Comprehend on alentanut merkintöjen rajoja ja mahdollistanut vakaampien tulosten saamisen erityisesti muutaman otoksen osanäytteissä. Lisätietoja tästä parannuksesta on kohdassa Amazon Comprehend ilmoittaa alemmat huomautusrajat mukautetun entiteetin tunnistamiselle.

Tämä muistikirja ei vaadi ML-asiantuntemusta mallin kouluttamiseen esimerkkitietojoukon tai oman yrityskohtaisen tietojoukon kanssa. Voit käyttää tässä muistikirjassa käsiteltyjä API-toimintoja omissa sovelluksissasi.

Käytä, mukauta ja ota käyttöön Amazon Comprehend JumpStart -muistikirjoja

Kun olet valinnut Amazon Comprehend -muistikirjan, jota haluat käyttää, valitse Tuo muistikirja. Kun teet sen, näet muistikirjan ytimen käynnistyvän.

Tuo muistikirja

Muistikirjan tuominen käynnistää muistikirjan ilmentymän, ytimen ja kuvan valinnan, jota käytetään muistikirjan suorittamiseen. Kun oletusinfrastruktuuri on määritetty, voit muuttaa valintoja tarpeidesi mukaan.

Muistikirja SageMaker Studiossa

Käy nyt läpi muistikirjan ääriviivat ja lue huolellisesti osiot, jotka koskevat edellytysten määritystä, tietojen määritystä, mallin harjoittelua, päätelmien suorittamista ja mallin pysäyttämistä. Voit vapaasti muokata luotua koodia tarpeidesi mukaan.

Voit mukauttaa seuraavia osioita tarpeidesi mukaan:

  • Oikeudet – Suosittelemme tuotantosovelluksen käyttöoikeuskäytäntöjen rajoittamista vain niihin, joita tarvitaan sovelluksen suorittamiseen. Lupia voidaan rajoittaa käyttötapauksen, kuten koulutuksen tai päättelyn, ja tiettyjen resurssien nimien, kuten koko Amazonin yksinkertainen tallennuspalvelu (Amazon S3) -ämpärinimi tai S3-ämpärinimikuvio. Sinun tulisi myös rajoittaa mukautetun luokittimen tai SageMaker-toimintojen käyttö vain niihin, joita sovelluksesi tarvitsee.
  • Tiedot ja sijainti – Esimerkkimuistikirja tarjoaa näytetietoja ja S3-sijainnit. Vaatimustesi perusteella voit käyttää omia tietojasi koulutukseen, validointiin ja testaukseen sekä käyttää eri S3-paikkoja tarpeen mukaan. Vastaavasti mallia luotaessa voit halutessasi säilyttää mallin eri paikoissa. Varmista vain, että olet antanut oikeat oikeudet käyttää S3-säilöjä.
  • Esikäsittelyvaiheet – Jos käytät erilaisia ​​tietoja koulutukseen ja testaukseen, saatat haluta säätää esikäsittelyvaiheita tarpeidesi mukaan.
  • Testaustiedot – Voit tuoda omat päätelmätietosi testaukseen.
  • Puhdistaa – Poista muistikirjan käynnistämät resurssit toistuvien maksujen välttämiseksi.

Yhteenveto

Tässä viestissä näytimme sinulle, kuinka JumpStartin avulla voit oppia ja nopeuttaa Amazon Comprehend API:iden käyttöä tekemällä Amazon Comprehendiin liittyvien muistikirjojen etsimisestä ja käyttämisestä kätevää Studiosta samalla kun sinulla on mahdollisuus muokata koodia tarpeen mukaan. Muistikirjat käyttävät mallitietojoukkoja AWS-tuoteilmoitusten ja esimerkkiuutisten kanssa. Voit käyttää tätä muistikirjaa oppiaksesi käyttämään Amazon Comprehend API -sovellusliittymiä Python-muistikirjassa, tai voit käyttää sitä lähtökohtana ja laajentaa koodia edelleen ainutlaatuisia vaatimuksiasi ja tuotantokäyttöäsi varten.

Voit aloittaa JumpStartin käytön ja hyödyntää yli 40 muistikirjaa eri aiheista kaikilla alueilla, joilla Studio on saatavilla ilman lisäkustannuksia.


Tietoja Tekijät

Kirjailija: Lana ZhangLana Zhang on vanhempi ratkaisuarkkitehti AWS WWSO AI Services -tiimissä, jolla on asiantuntemusta tekoälystä ja ML:stä sisällön moderointiin ja tunnistamiseen. Hän on intohimoinen AWS AI -palveluiden mainostamisesta ja asiakkaiden auttamisesta muuttamaan liiketoimintaratkaisujaan.

Kirjoittaja - Meenakshisundaram ThandavarayanMeenakshisundaram Thandavarayan on vanhempi AI/ML-asiantuntija, jolla on AWS. Hän auttaa huipputeknologian strategisia tilejä heidän tekoäly- ja ML-matkallaan. Hän on erittäin intohimoinen tietopohjaiseen tekoälyyn

Kirjoittaja - Rachna ChadhaRachna Chadha on AWS:n strategisten tilien pääratkaisuarkkitehti AI/ML. Rachna on optimisti, joka uskoo, että tekoälyn eettinen ja vastuullinen käyttö voi parantaa yhteiskuntaa tulevaisuudessa ja tuoda taloudellista ja sosiaalista vaurautta. Vapaa-ajallaan Rachna viettää mielellään aikaa perheensä kanssa, vaeltaa ja kuuntelee musiikkia.

Aikaleima:

Lisää aiheesta AWS-koneoppiminen