Organisaatiot eri aloilla, kuten terveydenhuolto, rahoitus ja luotonanto, lakiasiat, vähittäiskauppa ja valmistus, joutuvat usein käsittelemään monia asiakirjoja päivittäisissä liiketoimintaprosesseissaan. Nämä asiakirjat sisältävät tärkeitä tietoja, jotka ovat avainasemassa oikea-aikaisten päätösten tekemisessä, jotta asiakastyytyväisyys pysyisi korkeimmalla tasolla, asiakkaiden omaksuminen olisi nopeampaa ja asiakkaiden vaihtuvuus vähenee. Useimmissa tapauksissa asiakirjat käsitellään manuaalisesti tiedon ja oivallusten poimimiseksi, mikä on aikaa vievää, virhealtista, kallista ja vaikeasti skaalautuvaa. Nykyään on saatavilla rajoitetusti automaatiota näiden asiakirjojen tietojen käsittelyyn ja poimimiseen. Älykäs dokumenttien käsittely (IDP) AWS-keinoälypalveluilla auttaa automatisoimaan tiedon poimimista erityyppisistä ja -muotoisista asiakirjoista nopeasti ja suurella tarkkuudella ilman koneoppimistaitoja (ML). Nopeampi ja erittäin tarkka tiedonkeruu auttaa tekemään laadukkaita liiketoimintapäätöksiä ajoissa ja vähentämään samalla kokonaiskustannuksia.
Vaikka IDP-työnkulun vaiheet voivat vaihdella ja käyttötapaukset ja liiketoiminnan vaatimukset voivat vaikuttaa niihin, seuraava kuva näyttää vaiheet, jotka ovat tyypillisesti osa IDP-työnkulkua. Asiakirjojen, kuten verolomakkeiden, vaateiden, lääketieteellisten huomautusten, uusien asiakaslomakkeiden, laskujen, laillisten sopimusten ja muiden käsittely, ovat vain muutamia IDP:n käyttötapauksia.
Tässä kaksiosaisessa sarjassa keskustelemme siitä, kuinka voit automatisoida ja älykkäästi käsitellä asiakirjoja mittakaavassa AWS AI -palveluiden avulla. Tässä viestissä keskustelemme IDP-työnkulun kolmesta ensimmäisestä vaiheesta. Sisään osa 2, keskustelemme jäljellä olevista työnkulun vaiheista.
Ratkaisun yleiskatsaus
Seuraava arkkitehtuurikaavio näyttää IDP-työnkulun vaiheet. Se alkaa tiedonkeruuvaiheesta eri tiedostomuotojen (PDF, JPEG, PNG, TIFF) ja asiakirjojen asettelujen turvalliseen tallentamiseen ja yhdistämiseen. Seuraava vaihe on luokittelu, jossa asiakirjat luokitellaan (kuten sopimukset, reklamaatiolomakkeet, laskut tai kuitit), minkä jälkeen suoritetaan asiakirjojen poimiminen. Poimintavaiheessa voit poimia asiakirjoistasi merkityksellisiä yritystietoja. Näitä poimittuja tietoja käytetään usein oivallusten keräämiseen data-analyysin avulla tai ne lähetetään loppupään järjestelmiin, kuten tietokantoihin tai tapahtumajärjestelmiin. Seuraava vaihe on rikastus, jossa asiakirjoja voidaan rikastaa poistamalla suojattuja terveystietoja (PHI) tai henkilökohtaisia tunnistetietoja (PII), mukautettuja liiketoimintatermejä poimimalla ja niin edelleen. Lopuksi, tarkistus- ja validointivaiheessa voit sisällyttää henkilötyövoimaa asiakirjojen tarkistamiseen varmistaaksesi, että tulos on oikea.
Tätä viestiä varten otamme huomioon joukon esimerkkiasiakirjoja, kuten tiliotteita, laskuja ja varastokuitit. Asiakirjanäytteet ja esimerkkikoodi löytyvät sivuiltamme GitHub-arkisto. Seuraavissa osioissa käymme läpi nämä koodiesimerkit sekä todellisen käytännön sovelluksen. Näytämme kuinka voit hyödyntää ML-ominaisuuksia Amazonin teksti, Amazonin käsitysja Amazonin laajennettu AI (Amazon A2I) käsittelemään asiakirjoja ja validoimaan niistä poimitut tiedot.
Amazon Textract on ML-palvelu, joka poimii automaattisesti tekstin, käsinkirjoituksen ja tiedot skannatuista asiakirjoista. Se ylittää yksinkertaisen optisen merkintunnistuksen (OCR) tietojen tunnistamiseksi, ymmärtämiseksi ja poimimiseksi lomakkeista ja taulukoista. Amazon Textract käyttää ML:ää kaikentyyppisten asiakirjojen lukemiseen ja käsittelemiseen ja poimii tekstin, käsinkirjoituksen, taulukot ja muut tiedot tarkasti ilman manuaalista vaivaa.
Amazon Comprehend on luonnollisen kielen käsittelypalvelu (NLP), joka käyttää ML:ää saadakseen näkemyksiä asiakirjojen sisällöstä. Amazon Comprehend voi tunnistaa asiakirjoista tärkeitä elementtejä, mukaan lukien viittaukset kieleen, ihmisiin ja paikkoihin, ja luokitella ne olennaisiin aiheisiin tai ryhmiin. Se voi suorittaa tunneanalyysin määrittääkseen asiakirjan tunteen reaaliajassa käyttämällä yksittäisen asiakirjan tai erän havaitsemista. Se voi esimerkiksi analysoida blogitekstin kommentteja selvittääkseen, pitävätkö lukijasi viestistä vai eivät. Amazon Comprehend havaitsee myös henkilökohtaisia tunnistetietoja, kuten osoitteet, pankkitilinumerot ja puhelinnumerot tekstiasiakirjoissa reaaliajassa ja asynkronisissa erätöissä. Se voi myös poistaa henkilökohtaisia tunnistetietoja asynkronisissa erätöissä.
Amazon A2I on ML-palvelu, jonka avulla on helppo rakentaa ihmisen tarkasteluun tarvittavia työnkulkuja. Amazon A2I tuo ihmisten tarkastelun kaikille kehittäjille ja poistaa yksilöimättömän raskasnostotyön, joka liittyy ihmisten arviointijärjestelmien rakentamiseen tai suurten arvioijien hallintaan riippumatta siitä, toimiiko se AWS:llä vai ei. Amazon A2I integroi molemmat Amazonin teksti ja Amazonin käsitys antaa sinulle mahdollisuuden ottaa käyttöön ihmisen tarkastelun vaiheet älykkään asiakirjojen käsittelyn työnkulkuun.
Tiedonkeruuvaihe
Voit tallentaa asiakirjoja erittäin skaalautuvaan ja kestävään säilytystilaan, kuten Amazonin yksinkertainen tallennuspalvelu (Amazon S3). Amazon S3 on objektien tallennuspalvelu, joka tarjoaa alan johtavan skaalautuvuuden, tiedon saatavuuden, turvallisuuden ja suorituskyvyn. Amazon S3 on suunniteltu kestämään 11 9 vuotta, ja se tallentaa tietoja miljoonille asiakkaille ympäri maailmaa. Asiakirjat voivat olla eri muodoissa ja asetteluissa, ja ne voivat tulla eri kanavista, kuten verkkoportaaleista tai sähköpostin liitteistä.
Luokitteluvaihe
Edellisessä vaiheessa keräsimme erityyppisiä ja -muotoisia asiakirjoja. Tässä vaiheessa meidän on luokiteltava asiakirjat, ennen kuin voimme tehdä lisäpoiminnan. Tätä varten käytämme Amazon Comprehendia mukautettu luokitus. Asiakirjojen luokittelu on kaksivaiheinen prosessi. Ensin koulutat mukautetun Amazon Comprehend -luokituksen tunnistamaan sinua kiinnostavat luokat. Seuraavaksi otat mallin käyttöön a mukautettu luokitin reaaliaikainen päätepiste ja lähetä merkitsemättömät asiakirjat reaaliaikaiseen päätepisteeseen luokiteltavaksi.
Seuraava kuva esittää tyypillistä dokumenttien luokittelun työnkulkua.
Voit kouluttaa luokittelijan tunnistamalla sinua kiinnostavat luokat ja toimittamalla kunkin luokan asiakirjoja koulutusmateriaalina. Antamiesi vaihtoehtojen perusteella Amazon Comprehend luo mukautetun ML-mallin, jota se kouluttaa antamiesi asiakirjojen perusteella. Tämä mukautettu malli (luokitin) tutkii jokaisen lähettämäsi asiakirjan. Se palauttaa joko sisällön parhaiten edustavan tietyn luokan (jos käytät moniluokkatilaa) tai siihen sovellettavien luokkien joukon (jos käytät usean tunnisteen tilaa).
Valmistele harjoitustiedot
Ensimmäinen askel on poimia tekstiä asiakirjoista, joita Amazon Comprehend mukautettua luokittelijaa varten tarvitaan. Käytämme Amazon Textractia kaikkien Amazon S3:n asiakirjojen raakatekstitietojen poimimiseen detect_document_text()
API. Merkitsemme tiedot myös asiakirjatyypin mukaan, jota käytetään mukautetun Amazon Comprehend -luokittajan kouluttamiseen.
Seuraavaa koodia on leikattu yksinkertaistamisen vuoksi. Katso täydellinen koodi GitHubista näytekoodi varten textract_extract_text()
. Toiminto call_textract()
on wr4apper-funktio, joka kutsuu Analysoi asiakirja API sisäisesti, ja menetelmälle välitetyt parametrit tiivistävät joitakin määrityksiä, joita API tarvitsee poimintatehtävän suorittamiseen.
Kouluta mukautettu luokitin
Tässä vaiheessa käytämme Amazon Comprehend mukautettua luokittelua kouluttaaksemme malliamme asiakirjojen luokitteluun. Käytämme CreateDocumentClassifier API luokittelijan luomiseen, joka kouluttaa mukautetun mallin käyttämällä merkittyjä tietojamme. Katso seuraava koodi:
Ota käyttöön reaaliaikainen päätepiste
Jotta voit käyttää mukautettua Amazon Comprehend -luokitusta, luomme reaaliaikaisen päätepisteen käyttämällä CreateEndpoint
API:t:
Luokittele asiakirjat reaaliaikaisen päätepisteen avulla
Kun Amazon Comprehend -päätepiste on luotu, voimme käyttää reaaliaikaista päätepistettä asiakirjojen luokittelemiseen. Käytämme comprehend.classify_document()
toiminto, jossa poimittu asiakirjateksti ja päätepiste on syöttöparametreina:
Suosittelemme käymään läpi yksityiskohtaisen asiakirjaluokituksen mallikoodin GitHub.
Uuttovaihe
Amazon Textractin avulla voit poimia tekstiä ja strukturoituja tietoja Amazon Textractin avulla DetectDocumentText ja Analysoi asiakirja API:t. Nämä sovellusliittymät vastaavat JSON-tiedoilla, jotka sisältävät SANOJA, RIVIÄ, LOMAKEJA, TAULUKKOJA, geometria- tai rajoitusruututietoja, suhteita ja niin edelleen. Molemmat DetectDocumentText
ja AnalyzeDocument
ovat synkronisia operaatioita. Jos haluat analysoida asiakirjoja asynkronisesti, käytä AloitaDocumentTextDetection.
Strukturoitu tiedon poiminta
Voit poimia asiakirjoista jäsenneltyä tietoa, kuten taulukoita, säilyttäen samalla tietorakenteen ja havaittujen kohteiden väliset suhteet. Voit käyttää Analysoi asiakirja API kanssa FeatureType
as TABLE
tunnistaa kaikki asiakirjan taulukot. Seuraava kuva havainnollistaa tätä prosessia.
Katso seuraava koodi:
Me pyöritämme analyze_document()
menetelmän kanssa FeatureType
as TABLES
työntekijähistoria-asiakirjassa ja hanki taulukon poiminta seuraavissa tuloksissa.
Puolistrukturoitu tiedon poiminta
Voit poimia asiakirjoista puolistrukturoituja tietoja, kuten lomakkeita tai avainarvopareja, säilyttäen samalla tietorakenteen ja havaittujen kohteiden väliset suhteet. Voit käyttää Analysoi asiakirja API kanssa FeatureType
as FORMS
tunnistaa kaikki asiakirjan lomakkeet. Seuraava kaavio havainnollistaa tätä prosessia.
Katso seuraava koodi:
Täällä ohjaamme analyze_document()
menetelmän kanssa FeatureType
as FORMS
työntekijän hakemusasiakirjaan ja hanki tuloksista taulukkootteen.
Strukturoimaton tiedon poiminta
Amazon Textract on optimaalinen tiheän tekstin poimimiseen alan johtavalla OCR-tarkkuudella. Voit käyttää DetectDocumentText API tunnistaa tekstirivit ja sanat, jotka muodostavat tekstirivin, kuten seuraavassa kuvassa.
Katso seuraava koodi:
Nyt ohjaamme detect_document_text()
menetelmällä näytekuvassa ja saada raakatekstin poimiminen tuloksista.
Laskut ja kuitit
Amazon Textract tarjoaa erikoistuen laskujen ja kuittien käsittelyyn mittakaavassa. The AnalyzeExpense API voi poimia eksplisiittisesti merkittyjä tietoja, oletettuja tietoja ja rivikohtia eritellystä tavara- tai palveluluettelosta melkein mistä tahansa laskusta tai kuitista ilman malleja tai määrityksiä. Seuraava kuva havainnollistaa tätä prosessia.
Katso seuraava koodi:
Amazon Textract voi löytää toimittajan nimen kuitista, vaikka se olisi merkitty vain sivun logoon ilman nimenomaista "toimittaja" -nimiötä. Se voi myös etsiä ja poimia kuluerät, määrät ja hinnat, joita ei ole merkitty rivikohtien sarakeotsikoilla.
Henkilöllisyystodistukset
Amazonin teksti AnalysoiID API voi auttaa sinua poimimaan automaattisesti tietoja henkilöllisyysasiakirjoista, kuten ajokorteista ja passeista, ilman malleja tai määrityksiä. Voimme poimia tiettyjä tietoja, kuten vanhenemisajan ja syntymäajan, sekä älykkäästi tunnistaa ja poimia oletettuja tietoja, kuten nimen ja osoitteen. Seuraava kaavio havainnollistaa tätä prosessia.
Katso seuraava koodi:
Voimme käyttää tabulate
saadaksesi kauniin tulosteen:
Suosittelemme käymään läpi yksityiskohtaisen asiakirjan poiminta näytekoodi GitHubissa. Lisätietoja tämän viestin täydellisistä koodinäytteistä on kohdassa GitHub repo.
Yhteenveto
Tässä kaksiosaisen sarjan ensimmäisessä postauksessa keskustelimme IDP:n ja ratkaisuarkkitehtuurin eri vaiheista. Keskustelimme myös asiakirjojen luokituksesta Amazon Comprehend mukautetun luokittelijan avulla. Seuraavaksi tutkimme tapoja, joilla voit käyttää Amazon Textractia tiedon poimimiseen jäsentämättömistä, puolirakenteisista, strukturoiduista ja erikoistuneista asiakirjatyypeistä.
In osa 2 Jatkamme tämän sarjan keskustelua Amazon Textractin ote- ja kyselyominaisuuksilla. Tarkastelemme, kuinka voit käyttää Amazon Comprehendin ennalta määritettyjä kokonaisuuksia ja mukautettuja kokonaisuuksia keskeisten liiketoimintatermien poimimiseen asiakirjoista, joissa on tiheää tekstiä, ja kuinka integroida Amazon A2I:n ihmissilmukan tarkistus IDP-prosesseihisi.
Suosittelemme tutustumaan tietoturvaosioihin Amazonin teksti, Amazonin käsitysja Amazon A2I dokumentaatiota ja noudattamalla annettuja ohjeita. Käy myös hetki tarkistaaksesi ja ymmärtääksesi tuotteen hinnoittelu Amazonin teksti, Amazonin käsitysja Amazon A2I.
Tietoja kirjoittajista
Suprakash Dutta on ratkaisuarkkitehti Amazon Web Servicesissä. Hän keskittyy digitaalisen transformaation strategiaan, sovellusten modernisointiin ja migraatioon, data-analytiikkaan ja koneoppimiseen.
Sonali Sahu on johtava älykkään asiakirjankäsittelyn AI/ML Solutions Architect -tiimi Amazon Web Services -palvelussa. Hän on intohimoinen teknofiili ja nauttii työskentelystä asiakkaiden kanssa monimutkaisten ongelmien ratkaisemiseksi innovaatioiden avulla. Hänen painopistealueensa ovat tekoäly ja koneoppiminen älykkään asiakirjojen käsittelyyn.
Anjan Biswas on Senior AI Services Solutions -arkkitehti, joka keskittyy AI/ML:ään ja data-analytiikkaan. Anjan on osa maailmanlaajuista tekoälypalvelutiimiä ja työskentelee asiakkaiden kanssa auttaakseen heitä ymmärtämään ja kehittämään ratkaisuja tekoälyn ja ML:n liiketoimintaongelmiin. Anjanilla on yli 14 vuoden kokemus työskentelystä maailmanlaajuisten toimitusketju-, valmistus- ja vähittäismyyntiorganisaatioiden kanssa, ja hän auttaa aktiivisesti asiakkaita pääsemään alkuun ja skaalaamaan AWS AI -palveluita.
Chinmayee Rane on AI/ML Specialist Solutions -arkkitehti Amazon Web Servicesissä. Hän on intohimoinen soveltavaan matematiikkaan ja koneoppimiseen. Hän keskittyy älykkäiden asiakirjojen käsittelyratkaisujen suunnitteluun AWS-asiakkaille. Työn ulkopuolella hän harrastaa salsaa ja bachata-tanssia.
- Lisäasetukset (300)
- AI
- ai taide
- ai taiteen generaattori
- ai robotti
- Amazonin laajennettu AI
- Amazonin käsitys
- Amazon ymmärtää lääketieteen
- Amazonin koneoppiminen
- Amazonin teksti
- tekoäly
- tekoälyn sertifiointi
- tekoäly pankkitoiminnassa
- tekoäly robotti
- tekoälyrobotit
- tekoälyohjelmisto
- AWS-koneoppiminen
- blockchain
- blockchain-konferenssi ai
- coingenius
- keskustelullinen tekoäly
- kryptokonferenssi ai
- dall's
- syvä oppiminen
- google ai
- koneoppiminen
- Platon
- plato ai
- Platonin tietotieto
- Platon peli
- PlatonData
- platopeliä
- mittakaava ai
- syntaksi
- zephyrnet