AWS-älykkään asiakirjojen käsittelyn tehostaminen generatiivisella tekoälyllä | Amazon Web Services

AWS-älykkään asiakirjojen käsittelyn tehostaminen generatiivisella tekoälyllä | Amazon Web Services

Tietojen luokittelu, poimiminen ja analysointi voi olla haastavaa organisaatioille, jotka käsittelevät suuria dokumentteja. Perinteiset asiakirjankäsittelyratkaisut ovat manuaalisia, kalliita, virhealttiita ja vaikeita skaalata. Älykäs AWS-dokumenttien käsittely (IDP) AI-palveluilla, kuten Amazonin teksti, antaa sinun hyödyntää alan johtavaa koneoppimistekniikkaa (ML) käsitelläksesi nopeasti ja tarkasti minkä tahansa skannatun asiakirjan tai kuvan tietoja. Generatiivinen tekoäly (generative AI) täydentää Amazon Textractia ja automatisoi entisestään asiakirjojen käsittelyn työnkulkuja. Ominaisuudet, kuten avainkenttien normalisointi ja syötetietojen yhteenveto, tukevat nopeampia dokumenttiprosessien työnkulkujen hallintaa ja vähentävät samalla virheiden mahdollisuutta.

Generatiivista tekoälyä ohjaavat suuret ML-mallit, joita kutsutaan perusmalleiksi (FM). FM:t muuttavat tapaa, jolla voit ratkaista perinteisesti monimutkaisia ​​asiakirjojen käsittelykuormia. Nykyisten ominaisuuksien lisäksi yritysten on tehtävä yhteenveto tietyistä tietoluokista, mukaan lukien veloitus- ja luottotiedot asiakirjoista, kuten talousraporteista ja tiliotteista. FM:t helpottavat tällaisten oivallusten luomista poimitusta tiedosta. Inhimilliseen tarkasteluun käytetyn ajan optimoimiseksi ja työntekijöiden tuottavuuden parantamiseksi virheet, kuten puuttuvat numerot puhelinnumeroista, puuttuvat asiakirjat tai osoitteet ilman katunumeroita, voidaan merkitä automaattisesti. Nykyisessä skenaariossa sinun on käytettävä resursseja tällaisten tehtävien suorittamiseen käyttämällä ihmisen tarkastelua ja monimutkaisia ​​komentosarjoja. Tämä lähestymistapa on työläs ja kallis. FM:t voivat auttaa suorittamaan nämä tehtävät nopeammin, vähemmillä resursseilla ja muuttamaan vaihtelevat syöttömuodot vakiomalleiksi, joita voidaan käsitellä edelleen. AWS:llä tarjoamme palveluita mm Amazonin kallioperä, helpoin tapa rakentaa ja skaalata generatiivisia tekoälysovelluksia FM-laitteilla. Amazon Bedrock on täysin hallittu palvelu, joka tuo johtavien tekoäly startup-yritysten ja Amazonin FM-laitteet saataville API:n kautta, jotta voit löytää tarpeisiisi parhaiten sopivan mallin. Tarjoamme myös Amazon SageMaker JumpStart, jonka avulla ML-harjoittajat voivat valita laajasta avoimen lähdekoodin FM-valikoimasta. ML-harjoittajat voivat käyttää FM-laitteita omistettuihin Amazon Sage Maker instansseja verkosta eristetystä ympäristöstä ja mukauta malleja SageMakerin avulla mallin koulutusta ja käyttöönottoa varten.

Ricoh tarjoaa työpaikkaratkaisuja ja digitaalisia muunnospalveluita, jotka on suunniteltu auttamaan asiakkaita hallitsemaan ja optimoimaan tiedonkulkua yrityksissään. Ashok Shenoy, VP Portfolio Solution Development, sanoo: "Lisäämme luovaa tekoälyä IDP-ratkaisuihimme auttaaksemme asiakkaitamme saamaan työnsä valmiiksi nopeammin ja tarkemmin hyödyntämällä uusia ominaisuuksia, kuten Q&A, yhteenveto ja standardoituja tuloksia. AWS antaa meille mahdollisuuden hyödyntää generatiivista tekoälyä ja pitää jokaisen asiakkaamme tiedot erillään ja turvassa."

Tässä viestissä kerromme, kuinka voit parantaa IDP-ratkaisuasi AWS:ssä generatiivisella tekoälyllä.

IDP-putkilinjan parantaminen

Tässä osiossa tarkastellaan, kuinka perinteistä IDP-putkilinjaa voidaan täydentää FM:illä ja käydään läpi esimerkkikäyttötapauksen käyttämällä Amazon Textractia FM-laitteiden kanssa.

AWS IDP koostuu kolmesta vaiheesta: luokittelu, uuttaminen ja rikastus. Lisätietoja kustakin vaiheesta on kohdassa Älykäs asiakirjojen käsittely AWS AI -palveluilla: Osa 1 ja Osa 2. Luokitteluvaiheessa FM:t voivat nyt luokitella asiakirjoja ilman lisäkoulutusta. Tämä tarkoittaa, että asiakirjat voidaan luokitella, vaikka malli ei olisi aiemmin nähnyt vastaavia esimerkkejä. Poimintavaiheessa olevat FM:t normalisoivat päivämääräkentät ja vahvistavat osoitteet ja puhelinnumerot varmistaen samalla yhdenmukaisen muotoilun. Rikastusvaiheessa olevat FM:t mahdollistavat päättelyn, loogisen päättelyn ja yhteenvedon. Kun käytät FM-laitteita jokaisessa IDP-vaiheessa, työnkulkusi on virtaviivaisempi ja suorituskyky paranee. Seuraava kaavio havainnollistaa IDP-putkilinjaa generatiivisella tekoälyllä.

Älykäs asiakirjankäsittelyputki generatiivisella tekoälyllä

IDP-putkilinjan purkuvaihe

Kun FM:t eivät voi suoraan käsitellä alkuperäisissä muodoissaan olevia asiakirjoja (kuten PDF, img, jpeg ja tiff) syötteenä, tarvitaan mekanismi asiakirjojen muuntamiseksi tekstiksi. Voit poimia tekstin asiakirjasta ennen sen lähettämistä FM-laitteille käyttämällä Amazon Textractia. Amazon Textractin avulla voit poimia rivejä ja sanoja ja välittää ne alavirran FM-laitteille. Seuraavassa arkkitehtuurissa käytetään Amazon Textractia tarkkaan tekstin poimimiseen minkä tahansa tyyppisistä asiakirjoista ennen sen lähettämistä FM-laitteille jatkokäsittelyä varten.

Textract kerää asiakirjan tiedot perusmalleihin

Tyypillisesti asiakirjat koostuvat jäsennellystä ja puolistrukturoidusta tiedosta. Amazon Textractilla voidaan poimia raakatekstiä ja dataa taulukoista ja lomakkeista. Taulukoissa ja lomakkeissa olevien tietojen välinen suhde on tärkeä rooli liiketoimintaprosessien automatisoinnissa. FM:t eivät välttämättä käsittele tietyntyyppisiä tietoja. Tämän seurauksena voimme joko tallentaa nämä tiedot loppupään myymälään tai lähettää ne FM:ille. Seuraava kuva on esimerkki siitä, kuinka Amazon Textract voi poimia dokumentista jäsenneltyä ja puolistrukturoitua tietoa tekstirivien lisäksi, jotka FM:iden on käsiteltävä.

AWS-älykkään asiakirjojen käsittelyn tehostaminen generatiivisella tekoälyllä | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

AWS-palvelimettomien palvelujen käyttäminen yhteenvedon tekemiseen FM:ien kanssa

Aiemmin kuvaamamme IDP-putki voidaan automatisoida saumattomasti AWS-palvelimettomilla palveluilla. Erittäin jäsentelemättömät asiakirjat ovat yleisiä suurissa yrityksissä. Nämä asiakirjat voivat ulottua Securities and Exchange Commissionin (SEC) asiakirjoista pankkialalla kattaviin asiakirjoihin sairausvakuutusalalla. AWS:n generatiivisen tekoälyn kehittyessä näiden alojen ihmiset etsivät tapoja saada yhteenveto näistä asiakirjoista automatisoidulla ja kustannustehokkaalla tavalla. Palvelimettomat palvelut tarjoavat mekanismin, jonka avulla voidaan rakentaa ratkaisu IDP:lle nopeasti. Palvelut, kuten AWS Lambda, AWS-vaihetoiminnotja Amazon EventBridge voi auttaa rakentamaan asiakirjankäsittelyputken FM:ien integroinnin avulla, kuten seuraavassa kaaviossa näkyy.

Asiakirjojen kokonaiskäsittely Amazon Textractin ja Generatiivisen AI:n avulla

- näyteohjelma käytetään edellisessä arkkitehtuurissa tapahtumien ohjaamana. tapahtumaa varten määritellään tilanmuutokseksi, joka on tapahtunut äskettäin. Esimerkiksi kun objekti ladataan tiedostoon Amazonin yksinkertainen tallennuspalvelu (Amazon S3) -ämpäri, Amazon S3 lähettää Object Created -tapahtuman. Tämä Amazon S3:n tapahtumailmoitus voi laukaista Lambda-toiminnon tai Step Functions -työnkulun. Tämän tyyppistä arkkitehtuuria kutsutaan nimellä tapahtumalähtöistä arkkitehtuuria. Tässä viestissä esimerkkisovelluksemme käyttää tapahtumapohjaista arkkitehtuuria lääkinnällisen kotiutusasiakirjan käsittelyyn ja asiakirjan yksityiskohtien yhteenvetoon. Virtaus toimii seuraavasti:

  1. Kun asiakirja ladataan S3-säilöyn, Amazon S3 käynnistää Object Created -tapahtuman.
  2. EventBridgen oletustapahtumaväylä välittää tapahtuman Step Functionsille EventBridge-säännön perusteella.
  3. Tilakoneen työnkulku käsittelee asiakirjan alkaen Amazon Textractista.
  4. Lambda-funktio muuntaa analysoidut tiedot seuraavaa vaihetta varten.
  5. Valtion kone vedotaan a SageMaker-päätepiste, joka isännöi FM:ää käyttämällä suoraa AWS SDK -integraatiota.
  6. Yhteenveto S3-kohderyhmä vastaanottaa yhteenvetovastauksen, joka on kerätty FM:ltä.

Käytimme mallisovellusta a flan-t5 Halaava kasvomalli tehdäksesi yhteenvedon seuraavasta potilaan kotiutusyhteenvedosta Step Functions -työnkulkua käyttämällä.

potilaan kotiutuksen yhteenveto

Step Functions -työnkulku käyttää AWS SDK -integrointi soittaa Amazon Textractiin Analysoi asiakirja ja SageMaker-ajoaika InvokeEndpoint API:t, kuten seuraavassa kuvassa näkyy.

työnkulku

Tämä työnkulku johtaa yhteenveto-JSON-objektiin, joka tallennetaan kohdealueeseen. JSON-objekti näyttää seuraavalta:

{ "summary": [ "John Doe is a 35-year old male who has been experiencing stomach problems for two months. He has been taking antibiotics for the last two weeks, but has not been able to eat much. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has also noticed a change in his stool color, which is now darker. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of fatigue, and has been unable to work for the last two weeks. He has also been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help." ], "forms": [ { "key": "Ph: ", "value": "(888)-(999)-(0000) " }, { "key": "Fax: ", "value": "(888)-(999)-(1111) " }, { "key": "Patient Name: ", "value": "John Doe " }, { "key": "Patient ID: ", "value": "NARH-36640 " }, { "key": "Gender: ", "value": "Male " }, { "key": "Attending Physician: ", "value": "Mateo Jackson, PhD " }, { "key": "Admit Date: ", "value": "07-Sep-2020 " }, { "key": "Discharge Date: ", "value": "08-Sep-2020 " }, { "key": "Discharge Disposition: ", "value": "Home with Support Services " }, { "key": "Pre-existing / Developed Conditions Impacting Hospital Stay: ", "value": "35 yo M c/o stomach problems since 2 months. Patient reports epigastric abdominal pain non- radiating. Pain is described as gnawing and burning, intermittent lasting 1-2 hours, and gotten progressively worse. Antacids used to alleviate pain but not anymore; nothing exacerbates pain. Pain unrelated to daytime or to meals. Patient denies constipation or diarrhea. Patient denies blood in stool but have noticed them darker. Patient also reports nausea. Denies recent illness or fever. He also reports fatigue for 2 weeks and bloating after eating. ROS: Negative except for above findings Meds: Motrin once/week. Tums previously. PMHx: Back pain and muscle spasms. No Hx of surgery. NKDA. FHx: Uncle has a bleeding ulcer. Social Hx: Smokes since 15 yo, 1/2-1 PPD. No recent EtOH use. Denies illicit drug use. Works on high elevation construction. Fast food diet. Exercises 3-4 times/week but stopped 2 weeks ago. " }, { "key": "Summary: ", "value": "some activity restrictions suggested, full course of antibiotics, check back with physican in case of relapse, strict diet " } ] }

Näiden yhteenvetojen luominen IDP:llä ja palvelimettomalla toteutuksella laajassa mittakaavassa auttaa organisaatioita saamaan mielekkäitä, ytimekkäitä ja esitettäviä tietoja kustannustehokkaalla tavalla. Step Functions ei rajoita asiakirjojen käsittelytapaa yhteen asiakirjaan kerrallaan. Sen jaettu kartta ominaisuus voi tehdä yhteenvedon suuresta määrästä asiakirjoja aikataulussa.

- näyteohjelma käyttää a flan-t5 Halaava kasvomalli; Voit kuitenkin käyttää valitsemaasi FM-päätepistettä. Mallin kouluttaminen ja käyttäminen ei kuulu mallisovelluksen piiriin. Ota mallisovellus käyttöön noudattamalla GitHub-tietovaraston ohjeita. Edellinen arkkitehtuuri on opastus siitä, kuinka voit järjestää IDP-työnkulun Step Functions -toimintojen avulla. Viittaavat IDP Generatiivinen AI -työpaja saadaksesi yksityiskohtaiset ohjeet sovelluksen rakentamiseen AWS AI -palveluilla ja FM:illä.

Määritä ratkaisu

Seuraa ohjeita LUEMINUT tiedosto ratkaisun arkkitehtuurin määrittämiseksi (paitsi SageMaker-päätepisteet). Kun sinulla on oma SageMaker-päätepiste käytettävissä, voit välittää päätepisteen nimen parametrina malliin.

Puhdistaa

Voit säästää kustannuksia poistamalla resurssit, jotka otit käyttöön osana opetusohjelmaa:

  1. Noudata sivun puhdistus-osion ohjeita LUEMINUT tiedosto.
  2. Poista kaikki sisältö S3-säilöstäsi ja poista sitten sisältö Amazon S3 -konsolin kautta.
  3. Poista kaikki SageMaker-päätepisteet, jotka olet luonut SageMaker-konsolin kautta.

Yhteenveto

Generatiivinen tekoäly muuttaa tapaa, jolla voit käsitellä asiakirjoja IDP:n avulla oivallusten saamiseksi. AWS AI -palvelut, kuten Amazon Textract, sekä AWS FM:t voivat auttaa käsittelemään tarkasti kaikentyyppisiä asiakirjoja. Lisätietoja generatiivisen tekoälyn kanssa työskentelystä AWS:ssä on kohdassa Ilmoitamme uusista työkaluista rakentamiseen generatiivisella tekoälyllä AWS:ssä.


Tietoja Tekijät

AWS-älykkään asiakirjojen käsittelyn tehostaminen generatiivisella tekoälyllä | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Sonali Sahu on johtava älykäs asiakirjojen käsittely AWS:n AI/ML-palvelutiimin kanssa. Hän on kirjailija, ajatusjohtaja ja intohimoinen tekniikan asiantuntija. Hänen painopistealueensa ovat tekoäly ja ML, ja hän puhuu usein tekoäly- ja ML-konferensseissa ja tapaamisissa ympäri maailmaa. Hänellä on sekä laaja että syvällinen kokemus teknologiasta ja teknologiateollisuudesta, ja hänellä on alan asiantuntemusta terveydenhuollon, rahoitussektorin ja vakuutuksen aloilta.

AWS-älykkään asiakirjojen käsittelyn tehostaminen generatiivisella tekoälyllä | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Ashish Lal on Senior Product Marketing Manager, joka johtaa AWS:n tekoälypalvelujen tuotemarkkinointia. Hänellä on 9 vuoden kokemus markkinoinnista ja hän on johtanut älykkään asiakirjankäsittelyn tuotemarkkinointia. Hän suoritti kauppahallinnon maisterin tutkinnon Washingtonin yliopistossa.

AWS-älykkään asiakirjojen käsittelyn tehostaminen generatiivisella tekoälyllä | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Mrunal Daftari on Enterprise Senior Solutions -arkkitehti Amazon Web Servicesissä. Hänen kotipaikkansa on Boston, MA. Hän on pilviharrastaja ja erittäin intohimoinen löytämään asiakkaille ratkaisuja, jotka ovat yksinkertaisia ​​ja heidän liiketoimintansa tuloksia. Hän rakastaa työskentelyä pilviteknologioiden parissa, tarjoamalla yksinkertaisia, skaalautuvia ratkaisuja, jotka johtavat positiivisiin liiketoimintatuloksiin, pilvipalvelustrategiaan sekä suunnittelemaan innovatiivisia ratkaisuja ja edistämään toiminnan erinomaisuutta.

AWS-älykkään asiakirjojen käsittelyn tehostaminen generatiivisella tekoälyllä | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Dhiraj Mahapatro on AWS:n johtava palvelimettomien ratkaisujen arkkitehti. Hän on erikoistunut auttamaan yritysten rahoituspalveluita ottamaan käyttöön palvelimettomia ja tapahtumapohjaisia ​​arkkitehtuureja sovellusten modernisoimiseksi ja innovaatiovauhdin nopeuttamiseksi. Viime aikoina hän on työskennellyt konttityökuormien ja generatiivisen tekoälyn käytännön käytön tuomiseksi lähemmäksi palvelintonta ja EDA:ta rahoituspalvelualan asiakkaille.

AWS-älykkään asiakirjojen käsittelyn tehostaminen generatiivisella tekoälyllä | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Jacob Hauskens on johtava tekoälyasiantuntija, jolla on yli 15 vuoden kokemus strategisesta liiketoiminnan kehittämisestä ja kumppanuuksista. Viimeiset 7 vuotta hän on johtanut uusien tekoälypohjaisten B2B-palveluiden myyntistrategioiden luomista ja toteuttamista. Viime aikoina hän on auttanut ISV:itä kasvattamaan tulojaan lisäämällä luovaa tekoälyä älykkäisiin asiakirjojen käsittelyn työnkulkuihin.

Aikaleima:

Lisää aiheesta AWS-koneoppiminen