Amazonin teksti on koneoppimispalvelu (ML), joka poimii automaattisesti tekstin, käsinkirjoituksen ja datan skannatuista asiakirjoista. Kyselyt on ominaisuus, jonka avulla voit poimia tiettyjä tietoja vaihtelevista, monimutkaisista asiakirjoista luonnollisella kielellä. Mukautetut kyselyt tarjoaa tavan mukauttaa Kyselyt-ominaisuutta yrityskohtaisia, epätyypillisiä asiakirjoja varten, kuten autolainaussopimuksia, shekkejä ja palkkalaskelmia, itsepalveluperiaatteella. Räätälöimällä ominaisuuden tunnistamaan näille asiakirjatyypeille ominaiset ainutlaatuiset termit, rakenteet ja keskeiset tiedot, voit vastata jatkokäsittelytarpeisiisi tarkemmalla ja minimaalisella ihmisen väliintulolla. Custom Queries on helppo integroida olemassa olevaan Textract-putkeen, ja voit edelleen hyötyä Amazon Textractin täysin hallituista älykkäistä asiakirjojen käsittelyominaisuuksista ilman, että sinun tarvitsee investoida ML-osaamiseen tai infrastruktuurin hallintaan.
Tässä viestissä näytämme, kuinka mukautetut kyselyt voivat poimia tarkasti tietoja tarkistuksista, jotka ovat monimutkaisia, epätyypillisiä asiakirjoja. Lisäksi keskustelemme mukautettujen kyselyiden eduista ja jaamme parhaita käytäntöjä tämän ominaisuuden tehokkaaseen käyttöön.
Ratkaisun yleiskatsaus
Kun aloitat uudesta käyttötapauksesta, voit arvioida, kuinka Textract Queries toimii asiakirjoissasi siirtymällä kohtaan Textract-konsoli ja käyttämällä Analysoi asiakirjademoa tai Bulk Document Uploaderia. Viitata Parhaat käytännöt kyselyihin laatia käyttötapauksiisi sovellettavia kyselyitä. Jos havaitset kyselyvastauksissa virheitä yritysasiakirjojen luonteesta johtuen, voit parantaa tarkkuutta käyttämällä mukautettuja kyselyitä. Muutaman tunnin sisällä voit merkitä näyteasiakirjoihin käyttämällä AWS-hallintakonsoli ja kouluttaa sovitin. Sovittimet ovat komponentteja, jotka liitetään Amazon Textractin valmiiksi koulutettuun syväoppimismalliin ja mukauttavat sen tulostetta merkinnöillä varustettujen asiakirjojen perusteella. Voit käyttää sovitinta johtopäätösten tekemiseen välittämällä sovittimen tunnisteen lisäparametrina Analysoi asiakirjakyselyitä API-pyyntö.
Tutkitaan kuinka Mukautetut kyselyt voi parantaa poiminnan tarkkuutta haastavissa reaalimaailman skenaarioissa, kuten tietojen poiminnassa tarkistuksista. Ensisijainen haaste sekkien käsittelyssä johtuu niiden suuresta vaihteluasteesta riippuen tyypistä (esim. henkilö- tai kassasekit), rahoituslaitoksesta ja maasta (esim. MICR-rivimuoto). . Näitä muunnelmia voivat olla maksunsaajan nimen sijoittaminen, summa numeroina ja sanoina, päivämäärä ja allekirjoitus. Näiden muunnelmien tunnistaminen ja niihin sopeutuminen voi olla monimutkainen tehtävä tiedon poiminnan aikana. Tietojen poiminnan parantamiseksi organisaatiot käyttävät usein manuaalisia varmennus- ja validointiprosesseja, mikä lisää tiedonpoimintaprosessin kustannuksia ja aikaa.
Mukautetut kyselyt ratkaisevat nämä haasteet antamalla sinun mukauttaa valmiiksi koulutetut kyselyt eri sekkien muunnelmille. Valmiiksi koulutetun ominaisuuden mukauttaminen auttaa saavuttamaan korkean tiedon poimintatarkkuuden tietyissä käsittelemissäsi asetteluissa.
Meidän käyttötapauksessamme rahoituslaitos haluaa poimia sekistä seuraavat kentät: maksunsaajan nimi, maksajan nimi, tilinumero, reititysnumero, maksusumma (numeroina), maksun summa (sanoin), sekin numero, päivämäärä ja muistio.
Tarkastellaan prosessia, jolla luodaan sovitin (komponentti, joka mukauttaa lähtöä) tarkistusten käsittelyä varten. Sovittimet voidaan luoda konsolin kautta tai ohjelmallisesti API:n kautta. Tämä viesti kertoo konsolikokemuksesta; Jos kuitenkin haluat luoda sovittimen ohjelmallisesti, katso koodiesimerkkejä kohdasta custom-queries-checks-blog.ipynb Jupyter-muistikirja (vaihtoehto 2).
Sovittimen luontiprosessi sisältää viisi korkean tason vaihetta: sovittimen luominen, esimerkkiasiakirjojen lataaminen, asiakirjojen merkitseminen, sovittimen kouluttaminen ja suorituskykymittareiden arviointi.
Luo sovitin
Luo uusi sovitin Amazon Textract -konsolissa antamalla nimi, kuvaus ja valinnaiset tunnisteet, jotka voivat auttaa sinua tunnistamaan sovittimen. Sinulla on mahdollisuus ottaa käyttöön automaattiset päivitykset, jolloin Amazon Textract voi päivittää sovittimesi, kun taustalla oleva kyselyominaisuus päivitetään uusilla ominaisuuksilla.
Kun sovitin on luotu, näet sovittimen tietosivun, jossa on luettelo vaiheista Kuinka se toimii osio. Tämä osio aktivoi seuraavat vaiheet, kun suoritat ne peräkkäin.
Lataa näyteasiakirjoja
Sovittimen luomisen alkuvaiheeseen kuuluu asianmukaisten näyteasiakirjojen huolellinen valinta huomautuksia, koulutusta ja testausta varten. Meillä on mahdollisuus jakaa asiakirjat automaattisesti testi- ja koulutustietosarjoiksi; tätä prosessia varten jaamme kuitenkin tietojoukon manuaalisesti.
On tärkeää huomata, että voit rakentaa sovittimen vain viidestä testi- ja viidestä harjoitusnäytteestä, mutta on tärkeää varmistaa, että tämä näytejoukko on monipuolinen ja edustaa tuotantoympäristössä kohdattavaa työmäärää.
Tätä opetusohjelmaa varten olemme kuratoineet näytetarkistustietojoukkoja, joita voit tehdä download. Tietojoukkomme sisältää muunnelmia, kuten henkilökohtaisia shekkejä, kassasekkejä, ärsykesekkejä ja palkkatietoihin upotettuja shekkejä. Mukana oli myös käsinkirjoitetut ja painetut shekit; sekä muunnelmia kentissä, kuten muistio rivissä.
Merkitse esimerkkiasiakirjoihin
Seuraavassa vaiheessa teet merkinnät esimerkkiasiakirjoihin yhdistämällä kyselyt niitä vastaaviin vastauksiin konsolin kautta. Voit aloittaa merkinnän automaattisen tai manuaalisen merkinnän avulla. Automaattinen merkintä käyttää Amazon Textract Queries -kyselyitä datajoukon esimerkintään. Suosittelemme automaattista merkitsemistä merkintäprosessin nopeuttamiseksi.
Käytämme seuraavia kyselyitä tässä tarkistusten käsittelyssä. Jos käyttötapauksesi koskee muita asiakirjatyyppejä, katso Parhaat käytännöt kyselyihin laatia käyttötapauksiisi sovellettavia kyselyitä.
- Kuka on maksun saaja?
- Mikä sekki# on?
- Mikä on maksunsaajan osoite?
- Mikä päivä nyt on?
- Mikä on tilinumero?
- Mikä on shekin summa sanoin?
- Mikä on tilin/maksajan/laatikon nimi?
- Mikä on dollarin määrä?
- Mikä on pankin nimi/velan nimi?
- Mikä on pankin reititysnumero?
- Mikä on MICR-linja?
- Mikä on muistio?
Kun automaattinen merkintäprosessi on valmis, voit tarkastella ja muokata kunkin asiakirjan vastauksia. Valita Aloita tarkistaminen tarkistaaksesi kunkin kuvan merkinnät.
Jos vastaus kyselyyn puuttuu tai on väärä, voit lisätä tai muokata vastausta joko piirtämällä rajauslaatikon tai kirjoittamalla vastauksen manuaalisesti.
Nopeuttaaksemme läpikäyntiäsi olemme merkinneet tarkistusnäytteet valmiiksi, jotta voit kopioida ne AWS-tilillesi. Suorita custom-queries-checks-blog.ipynb Jupyter muistikirja sisällä Amazon Textract -koodinäytteet kirjasto päivittääksesi merkinnäsi automaattisesti.
Harjoittele sovitin
Kun olet tarkistanut kaikki malliasiakirjat varmistaaksesi merkintöjen tarkkuuden, voit aloittaa sovittimen koulutusprosessin. Tässä vaiheessa sinun on määritettävä tallennuspaikka, johon sovitin tulee tallentaa. Harjoitteluprosessin kesto vaihtelee koulutukseen käytetyn tietojoukon koon mukaan. Koulutussovellusliittymää voidaan kutsua myös ohjelmallisesti, jos päätät käyttää haluamaasi merkintätyökalua ja välität tarvittavat syöttötiedostot API:lle. Viitata Mukautetut kyselyt lisätietoja.
Arvioi tehokkuusmittareita
Kun sovitin on suorittanut koulutuksen, voit arvioida sen suorituskykyä tarkastelemalla arviointimittareita, kuten F1 pisteet, tarkkuutta ja muistamista. Voit analysoida näitä mittareita joko yhdessä tai asiakirjakohtaisesti. Käyttämällä näytetarkistustietojoukkoamme näet tarkkuusmittarin (F1-pisteet) paranevan 68 %:sta 92 %:iin koulutetun sovittimen avulla.
Lisäksi voit testata sovittimen lähtöä uusilla asiakirjoilla valitsemalla Kokeile Adapteria.
Arvioinnin jälkeen voit parantaa sovittimen suorituskykyä joko sisällyttämällä muita näyteasiakirjoja harjoitustietojoukkoon tai merkitsemällä asiakirjoja uudelleen, joiden pisteet ovat kynnystäsi alhaisemmat. Jos haluat merkitä asiakirjoihin uudelleen, valitse Tarkista asiakirjat valitse sovittimen tietosivulla asiakirja ja valitse Tarkista merkinnät.
Testaa sovitin ohjelmallisesti
Kun koulutus on suoritettu onnistuneesti, voit nyt käyttää sovitinta omassasi Analysoi asiakirja API-kutsut. API-pyyntö on samanlainen kuin Amazon Textract Queries API -pyyntö, johon on lisätty AdaptersConfig
esine.
Voit suorittaa seuraavan esimerkkikoodin tai suorittaa sen suoraan custom-queries-checks-blog.ipynb Jupyter muistikirja. Esimerkkimuistikirjassa on myös koodi, jolla voit vertailla tuloksia Amazon Textract Queriesin ja Amazon Textract Custom Queriesin välillä.
Luo AdaptersConfig objekti sovittimen tunnuksella ja sovittimen versiolla, ja sisällytä valinnaisesti sivut, joille haluat sovittimen käytettävän:
Luo QueriesConfig
objekti kyselyillä, joilla koulutit sovittimen, ja kutsu Amazon Textract API. Huomaa, että voit myös sisällyttää lisäkyselyitä, joihin sovitinta ei ole koulutettu. Amazon Textract käyttää näihin kysymyksiin automaattisesti Kyselyt-ominaisuutta, ei mukautettuja kyselyitä, mikä tarjoaa sinulle joustavuutta käyttää mukautettuja kyselyitä vain tarvittaessa.
Lopuksi taulukoimme tulokset paremman luettavuuden takaamiseksi:
Puhdistaa
Voit puhdistaa resurssit suorittamalla seuraavat vaiheet:
- Valitse Amazon Textract -konsolissa Mukautetut kyselyt navigointipaneelissa.
- Valitse sovitin, jonka haluat poistaa.
- Valita Poista.
Sovittimen hallinta
Voit parantaa sovittimia säännöllisesti luomalla uusia versioita aiemmin luodusta sovittimesta. Luodaksesi uuden version sovittimesta lisäät uusia malliasiakirjoja olemassa olevaan sovittimeen, merkitset asiakirjat ja suoritat koulutusta. Voit ylläpitää samanaikaisesti useita sovittimen versioita käytettäväksi kehitysputkissasi. Jos haluat päivittää sovittimet saumattomasti, älä tee muutoksia tai poista niitä Amazonin yksinkertainen tallennuspalvelu (Amazon S3) ämpäri, johon tallennetaan sovittimen luomiseen tarvittavat tiedostot.
Parhaat käytännöt
Kun käytät mukautettuja kyselyitä asiakirjoissasi, katso Parhaat käytännöt Amazon Textract Custom Queries -kyselyille lisänäkökohtia ja parhaita käytäntöjä varten.
Mukautettujen kyselyiden edut
Muokatut kyselyt tarjoavat seuraavat edut:
- Parannettu asiakirjan ymmärtäminen – Koska Custom Queries pystyy poimimaan ja normalisoimaan tietoja erittäin tarkasti, se vähentää riippuvuutta manuaalisista tarkastuksista ja tarkastuksista ja mahdollistaa luotettavamman automaation rakentamisen älykkäille asiakirjojen käsittelyn työnkuluille.
- Nopeampi aika arvostaa – Kun kohtaat uusia asiakirjatyyppejä, joissa tarvitset suurempaa tarkkuutta, voit luoda mukautettuja kyselyitä sovittimen itsepalveluperiaatteella muutamassa tunnissa. Sinun ei tarvitse odottaa valmiiksi koulutettua mallipäivitystä, kun kohtaat työnkulussasi uusia asiakirjatyyppejä tai muunnelmia olemassa olevista. Hallitset täysin putkistoasi, eikä sinun tarvitse olla riippuvainen Amazon Textractista tukeakseen uusia asiakirjatyyppejäsi.
- Tietosuoja – Custom Queries ei säilytä tai käytä sovittimien luomiseen käytettyjä tietoja parantaakseen yleisiä esikoulutettuja mallejamme, jotka ovat kaikkien asiakkaiden käytettävissä. Sovitin on rajoitettu asiakkaan tiliin tai muihin asiakkaan nimenomaisesti määrittämiin tileihin, mikä varmistaa, että vain tällaiset tilit pääsevät käsiksi asiakkaan tietojen avulla tehtyihin parannuksiin.
- Mukavuus – Mukautetut kyselyt tarjoavat täysin hallitun päättelykokemuksen, joka on samanlainen kuin kyselyt. Adapterikoulutus on ilmainen ja maksat vain päättelystä. Custom Queries säästää yleiskustannuksia ja kustannuksia koulutuksesta ja mukautettujen mallien käytöstä.
Yhteenveto
Tässä viestissä keskustelimme mukautettujen kyselyiden eduista, osoitimme, kuinka mukautetut kyselyt voivat poimia tietoja tarkasti tarkastuksista, ja jaoimme parhaita käytäntöjä tämän ominaisuuden tehokkaaseen hyödyntämiseen. Vain muutamassa tunnissa voit luoda sovittimen konsolin avulla ja käyttää sitä AnalyzeDocument API:ssa tiedonpoimintatarpeisiisi. Lisätietoja on kohdassa Mukautetut kyselyt.
Tietoja kirjoittajista
Shibin Michaelraj on vanhempi tuotepäällikkö Amazon Textract -tiimissä. Hän on keskittynyt AI/ML-pohjaisten tuotteiden rakentamiseen AWS-asiakkaille. Hän on innoissaan auttaessaan asiakkaita ratkaisemaan monimutkaisia liiketoimintahaasteitaan hyödyntämällä tekoäly- ja ML-tekniikoita. Vapaa-ajallaan hän nauttii juoksemisesta, podcastien virityksestä ja amatööritennistaitojen hiomisesta.
Keith Mascarenhas on vanhempi ratkaisuarkkitehti Amazon Textract -palvelutiimin kanssa. Hän on intohimoinen yritysongelmien laajamittaiseen ratkaisemiseen koneoppimisen avulla, ja tällä hetkellä hän auttaa maailmanlaajuisesti asiakkaitamme automatisoimaan asiakirjojensa käsittelyn nopeuttaakseen markkinoilletuloa pienemmillä käyttökustannuksilla.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
- PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
- PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
- PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
- Lähde: https://aws.amazon.com/blogs/machine-learning/customize-amazon-textract-with-business-specific-documents-using-custom-queries/
- :on
- :On
- :ei
- :missä
- $ YLÖS
- 1
- 10
- 100
- 17
- 36
- 7
- a
- kyky
- Meistä
- kiihdyttää
- pääsy
- Tili
- Tilit
- tarkkuus
- tarkasti
- Saavuttaa
- mukauttaminen
- lisätä
- Lisäksi
- lisä-
- osoite
- osoitteet
- vastaan
- AI
- Kaikki
- mahdollistaa
- pitkin
- Myös
- amatööri
- Amazon
- Amazonin teksti
- Amazon Web Services
- määrä
- an
- analysoida
- ja
- vastauksia
- api
- sovelletaan
- sovellettu
- sopiva
- OVAT
- AS
- arvioida
- At
- tarkastukset
- auto
- automatisoida
- automaattisesti
- automaattisesti
- Automaatio
- saatavissa
- AWS
- Pankki
- perustua
- perusta
- BE
- ollut
- alkaa
- hyödyttää
- Hyödyt
- PARAS
- parhaat käytännöt
- Paremmin
- välillä
- Laatikko
- rakentaa
- Rakentaminen
- liiketoiminta
- mutta
- by
- soittaa
- Puhelut
- CAN
- kyvyt
- varovainen
- tapaus
- haaste
- haasteet
- haastava
- Muutokset
- tarkastaa
- Tarkastukset
- valinta
- Valita
- valita
- puhdas
- koodi
- kollektiivisesti
- verrata
- täydellinen
- Valmistunut
- monimutkainen
- komponentti
- osat
- näkökohdat
- Console
- rakentaa
- jatkaa
- sopimukset
- ohjaus
- vastaava
- Hinta
- kustannukset
- maa
- luoda
- luotu
- Luominen
- kuratoitu
- Tällä hetkellä
- asiakassuhde
- asiakas
- Asiakkaat
- räätälöinnin
- räätälöidä
- tiedot
- aineistot
- Päivämäärä
- syvä
- syvä oppiminen
- Aste
- esittely
- Riippuen
- kuvaus
- nimetty
- yksityiskohdat
- Kehitys
- eri
- suoraan
- pohtia
- keskusteltiin
- useat
- do
- asiakirja
- asiakirjat
- ei
- dollari
- Dont
- luonnos
- piirustus
- kaksi
- kesto
- aikana
- e
- kukin
- helppo
- tehokkaasti
- myöskään
- upotettu
- Työllisiä
- mahdollistaa
- mahdollistaa
- mahdollistaa
- parantaa
- varmistaa
- varmistamalla
- kirjoittamalla
- ympäristö
- virheet
- olennainen
- arvioida
- arviointi
- tutkia
- tutkii
- innoissaan
- olemassa
- kulut
- experience
- asiantuntemus
- nimenomaisesti
- tutkia
- uute
- uuttaminen
- otteet
- f1
- nopeampi
- Ominaisuus
- Ominaisuudet
- harvat
- Fields
- Asiakirjat
- taloudellinen
- rahoituslaitos
- viisi
- Joustavuus
- keskityttiin
- jälkeen
- varten
- muoto
- Ilmainen
- alkaen
- täysin
- general
- tuottaa
- syntyy
- tuottaa
- sukupolvi
- GitHub
- suurempi
- Olla
- ottaa
- he
- auttaa
- auttaa
- auttaa
- Korkea
- korkean tason
- korkeampi
- hänen
- TUNTIA
- Miten
- Kuitenkin
- HTML
- http
- HTTPS
- ihmisen
- ID
- tunniste
- tunnistaa
- if
- kuva
- tuoda
- tärkeä
- parantaa
- parannuksia
- in
- sisältää
- mukana
- sisältää
- sisältävät
- Lisäykset
- tiedot
- Infrastruktuuri
- ensimmäinen
- aloittaa
- panos
- asentaa
- Laitos
- yhdistää
- Älykäs
- Älykäs asiakirjojen käsittely
- interventio
- tulee
- Investoida
- kutsuttuihin
- IT
- SEN
- jpg
- vain
- avain
- Merkki
- merkinnät
- Kieli
- oppiminen
- luotonanto
- vipuvaikutuksen
- Kirjasto
- pitää
- rajallinen
- linja
- Lista
- sijainti
- alentaa
- kone
- koneoppiminen
- tehty
- ylläpitää
- tehdä
- onnistui
- johto
- johtaja
- tapa
- manuaalinen
- käsin
- markkinat
- Tavata
- Muistio
- metrinen
- Metrics
- minimi
- puuttuva
- ML
- malli
- mallit
- lisää
- moninkertainen
- nimi
- Luonnollinen
- luonto
- navigointi
- suunnistus
- Tarve
- tarvitaan
- tarpeet
- Uusi
- seuraava
- muistikirja
- nyt
- numero
- numerot
- objekti
- of
- Tarjoukset
- usein
- on
- yhdet
- vain
- toiminta
- toiminta-
- Vaihtoehto
- or
- organisaatioiden
- Muut
- meidän
- ulostulo
- yli
- oma
- sivulla
- sivut
- lasi
- parametri
- kulkea
- Ohimenevä
- intohimoinen
- Maksaa
- maksu
- Suorittaa
- suorituskyky
- suorittaa
- henkilöstö
- vaihe
- kappaletta
- putki
- sijoitus
- Platon
- Platonin tietotieto
- PlatonData
- pistoke
- podcastit
- Kirje
- käytännöt
- Tarkkuus
- aiemmin
- ensisijainen
- ongelmia
- prosessi
- Prosessit
- käsittely
- Tuotteet
- tuotepäällikkö
- tuotanto
- Tuotteemme
- mikäli
- tarjoaa
- tarjoamalla
- kyselyt
- kysymykset
- todellinen maailma
- tunnistaa
- tunnustaa
- suositella
- Vähentynyt
- vähentää
- katso
- jalostus
- säännöllisesti
- merkityksellinen
- luotettava
- riippuvuus
- edustaja
- pyyntö
- Esittelymateriaalit
- vastaus
- vasteet
- tulokset
- säilyttää
- arviot
- tarkistetaan
- Arvostelut
- reititys
- ajaa
- juoksu
- tallennettu
- Asteikko
- skenaario
- pisteet
- saumattomasti
- Osa
- nähdä
- valinta
- Itsepalvelu
- palvelu
- Palvelut
- setti
- Jaa:
- yhteinen
- shouldnt
- näyttää
- osoittivat
- allekirjoitus
- samankaltainen
- Yksinkertainen
- samanaikaisesti
- Koko
- taitoja
- Ratkaisumme
- SOLVE
- Solving
- erityinen
- jakaa
- Aloita
- lausuntoja
- Vaihe
- Askeleet
- ärsyke
- ärsykkeentarkastukset
- Levytila
- rakenteet
- Onnistuneesti
- niin
- tuki
- Tehtävä
- joukkue-
- Technologies
- ehdot
- testi
- Testaus
- teksti
- kuin
- että
- -
- heidän
- Niitä
- siten
- Nämä
- tätä
- kynnys
- Kautta
- aika
- että
- työkalu
- Juna
- koulutettu
- koulutus
- TRP
- viritys
- oppitunti
- tyyppi
- tyypit
- taustalla oleva
- unique
- Päivitykset
- päivitetty
- Päivitykset
- käyttää
- käyttölaukku
- käyttötarkoituksiin
- käyttämällä
- hyödynnetty
- Hyödyntämällä
- validointi
- lajike
- Vaihteleva
- Vahvistus
- versio
- versiot
- kautta
- odottaa
- läpikäynti
- haluta
- haluaa
- Tapa..
- we
- verkko
- verkkopalvelut
- Mitä
- Mikä on
- kun
- joka
- KUKA
- wikipedia
- tulee
- with
- sisällä
- ilman
- sanoja
- työnkulku
- työnkulkuja
- maailmanlaajuisesti
- Väärä
- Voit
- Sinun
- zephyrnet
- Postinumero