Text Amazon este un serviciu de învățare automată (ML) care extrage automat text, scris de mână și date din orice document sau imagine. Amazon Textract oferă acum flexibilitatea de a specifica datele pe care trebuie să le extrageți din documente folosind noua caracteristică Interogări din API-ul Analyze Document. Nu trebuie să cunoașteți structura datelor din document (tabel, formular, câmp implicit, date imbricate) sau să vă faceți griji cu privire la variațiile între versiunile și formatele documentului.
În această postare, discutăm următoarele subiecte:
- Povești de succes de la clienții AWS și beneficiile noii caracteristici Interogări
- Cum API-ul Analyze Document Queries ajută la extragerea informațiilor din documente
- O prezentare a consolei Amazon Texttract
- Exemple de cod pentru a utiliza API-ul Analyze Document Queries
- Cum să procesați răspunsul cu biblioteca de analiză Amazon Texttract
Beneficiile noii caracteristici Interogări
Soluțiile OCR tradiționale se luptă să extragă datele cu acuratețe din majoritatea documentelor semi-structurate și nestructurate din cauza variațiilor semnificative ale modului în care datele sunt prezentate în mai multe versiuni și formate ale acestor documente. Trebuie să implementați un cod personalizat de postprocesare sau să examinați manual informațiile extrase din aceste documente. Cu funcția Interogări, puteți specifica informațiile de care aveți nevoie sub formă de întrebări în limbaj natural (de exemplu, „Care este numele clientului”) și puteți primi informațiile exacte („John Doe”) ca parte a răspunsului API. Caracteristica folosește o combinație de modele vizuale, spațiale și lingvistice pentru a extrage informațiile pe care le căutați cu o acuratețe ridicată. Caracteristica Interogări este pre-antrenată pe o mare varietate de documente semi-structurate și nestructurate. Unele exemple includ bonuri de plată, extrase de cont bancar, W-2, formulare de cerere de împrumut, note de credit ipotecar și carduri de vaccin și de asigurare.
Amazon Texttract ne permite să automatizăm nevoile de procesare a documentelor ale clienților noștri. Cu funcția Interogări, vom putea extrage date dintr-o varietate de documente cu o flexibilitate și o precizie și mai mari,Matei 22:21 a declarat Robert Jansen, Chief Executive Officer la TekStream Solutions. "Considerăm acest lucru ca un mare câștig de productivitate pentru clienții noștri de afaceri, care vor putea folosi capacitatea Interogări ca parte a soluției noastre IDP pentru a obține rapid informații cheie din documentele lor.Matei 22:21
Amazon Texttract ne permite să extragem text, precum și elemente structurate, cum ar fi formulare și tabele, din imagini cu o precizie ridicată. Amazon Textract Queries ne-a ajutat să îmbunătățim drastic calitatea extragerii informațiilor din mai multe documente esențiale pentru afaceri, cum ar fi fișele cu date de siguranță sau specificațiile materialelorMatei 22:21 a spus Thorsten Warnecke, director | Sef PC Analytics, Camelot Management Consultants. "Sistemul de interogări în limbaj natural oferă o mare flexibilitate și precizie, ceea ce ne-a redus încărcarea post-procesare și ne-a permis să adăugăm mai rapid documente noi la instrumentele noastre de extragere a datelor.Matei 22:21
Cum API-ul Analyze Document Queries ajută la extragerea informațiilor din documente
Companiile și-au sporit gradul de adoptare a platformelor digitale, în special în contextul pandemiei de COVID-19. Majoritatea organizațiilor oferă acum o modalitate digitală de a-și achiziționa serviciile și produsele utilizând smartphone-uri și alte dispozitive mobile, ceea ce oferă flexibilitate utilizatorilor, dar crește și amploarea la care documentele digitale trebuie revizuite, procesate și analizate. În unele sarcini în care, de exemplu, documentele ipotecare, cardurile de vaccinare, talonele de plată, cardurile de asigurare și alte documente trebuie analizate digital, complexitatea extragerii datelor poate deveni exponențial agravată, deoarece aceste documente nu au un format standard sau au variații semnificative în formatul datelor. în diferite versiuni ale documentului.
Chiar și soluțiile OCR puternice se luptă să extragă datele cu acuratețe din aceste documente și poate fi necesar să implementați postprocesare personalizată pentru aceste documente. Aceasta include maparea posibilelor variații ale cheilor de formular cu numele de câmpuri native ale clientului sau includerea învățării automate personalizate pentru a identifica informații specifice într-un document nestructurat.
Noul API Analyze Document Queries din Amazon Texttract poate prelua întrebări scrise în limbaj natural, cum ar fi „Care este rata dobânzii?” și efectuați analize puternice AI și ML pe document pentru a afla informațiile dorite și a le extrage din document fără nicio postprocesare. Caracteristica Interogări nu necesită pregătire personalizată a modelelor sau configurarea de șabloane sau configurații. Puteți începe rapid prin încărcarea documentelor și specificarea întrebărilor pe acele documente prin consola Amazon Texttract, Interfața liniei de comandă AWS (AWS CLI) sau AWS SDK.
În secțiunile ulterioare ale acestei postări, parcurgem exemple detaliate despre cum să utilizați această nouă funcționalitate în cazurile de utilizare obișnuite ale sarcinii de lucru și cum să utilizați API-ul Analyze Document Queries pentru a adăuga agilitate procesului de digitalizare a sarcinii de lucru.
Utilizați funcția Interogări de pe consola Amazon Texttract
Înainte de a începe cu API-ul și mostrele de cod, să revizuim consola Amazon Texttract. Următoarea imagine prezintă un exemplu de card de vaccinare pe Interogări pentru API-ul Analyze Document de pe consola Amazon Texttract. După ce încărcați documentul în consola Amazon Texttract, alegeți Interogări în Configurați documentul secțiune. Apoi puteți adăuga interogări sub formă de întrebări în limbaj natural. După ce ați adăugat toate interogările, alegeți Aplicați configurația. Răspunsurile la întrebări se află pe Interogări tab.
Exemple de cod
În această secțiune, explicăm cum să invocați API-ul Analyze Document cu parametrul Interogări pentru a obține răspunsuri la întrebările în limbaj natural despre document. Documentul de intrare este fie într-un format de matrice de octeți, fie situat într-un Serviciul Amazon de stocare simplă (Amazon S3) găleată. Transmiteți octeți de imagine unei operații API Amazon Texttract utilizând proprietatea Bytes. De exemplu, puteți utiliza Bytes
proprietate pentru a transmite un document încărcat dintr-un sistem de fișiere local. Octeți de imagine trecuți prin utilizarea Bytes
proprietatea trebuie să fie codificată base64. Este posibil ca codul dvs. să nu fie necesar să codifice octeții de fișier de document dacă utilizați un SDK AWS pentru a apela operațiunile API Amazon Texttract. Ca alternativă, puteți trece imaginile stocate într-o găleată S3 unei operații API Amazon Texttract utilizând S3Object
proprietate. Documentele stocate într-o găleată S3 nu trebuie să fie codificate în base64.
Puteți utiliza funcția Interogări pentru a obține răspunsuri din diferite tipuri de documente, cum ar fi bonuri de plată, carduri de vaccinare, documente ipotecare, extrase bancare, formulare W-2, formulare 1099 și altele. În secțiunile următoare, trecem peste unele dintre aceste documente și arătăm cum funcționează funcția Interogări.
Talonul de plată
În acest exemplu, parcurgem pașii pentru a analiza un talon de plată folosind funcția Interogări, așa cum se arată în imaginea de exemplu următoare.
Folosim următorul exemplu de cod Python:
Următorul cod este un exemplu de comandă AWS CLI:
Să analizăm răspunsul pe care îl primim pentru cele două interogări pe care le-am transmis API-ului Analyze Document în exemplul precedent. Următorul răspuns a fost tăiat pentru a afișa numai părțile relevante:
Răspunsul are un BlockType
of QUERY
care arată întrebarea care a fost pusă și a Relationships
secțiunea care are ID-ul blocului care are răspunsul. Răspunsul este în BlockType
of QUERY_RESULT
. Aliasul care este transmis ca intrare în API-ul Analyze Document este returnat ca parte a răspunsului și poate fi folosit pentru a eticheta răspunsul.
Noi folosim Analizator de răspunsuri Amazon Text pentru a extrage doar întrebările, pseudonimul și răspunsurile corespunzătoare la acele întrebări:
Codul precedent returnează următoarele rezultate:
Mai multe întrebări și codul complet pot fi găsite în caietul de pe site-ul GitHub repo.
Nota de ipoteca
API-ul Analyze Document Queries funcționează bine și cu notele ipotecare precum următoarele.
Procesul de apelare a API-ului și a rezultatelor procesului este același cu exemplul anterior. Puteți găsi exemplul de cod complet pe GitHub repo.
Următorul cod arată exemplele de răspunsuri obținute folosind API:
Card de vaccinare
Funcția de interogări Amazon Texttract funcționează, de asemenea, foarte bine pentru a extrage informații de pe carduri de vaccinare sau carduri care seamănă cu aceasta, ca în exemplul următor.
Procesul de a apela API-ul și de a analiza rezultatele este același cu cel folosit pentru un talon de plată. După ce procesăm răspunsul, obținem următoarele informații:
Codul complet poate fi găsit în caietul de pe site-ul GitHub repo.
Card de asigurare
Funcția Interogări funcționează bine și cu carduri de asigurare precum următoarele.
Procesul de apelare a API-ului și a rezultatelor procesului este același ca cel prezentat mai devreme. Exemplul complet de cod este disponibil în blocnotesul de pe GitHub repo.
Următoarele sunt exemple de răspunsuri obținute folosind API:
Cele mai bune practici pentru elaborarea interogărilor
Când creați interogările, luați în considerare următoarele bune practici:
- În general, puneți o întrebare în limbaj natural care începe cu „Ce este”, „Unde este” sau „Cine este”. Excepția este atunci când încercați să extrageți perechi cheie-valoare standard, caz în care puteți transmite numele cheii ca interogare.
- Evitați întrebările prost formulate sau incorecte din punct de vedere gramatical, deoarece acestea pot duce la răspunsuri neașteptate. De exemplu, o interogare prost formată este „Când?” întrucât o întrebare bine formată este „Când a fost administrată prima doză de vaccin?”
- Acolo unde este posibil, utilizați cuvinte din document pentru a construi interogarea. Deși funcția Interogări încearcă să facă potrivirea acronimelor și a sinonimelor pentru anumiți termeni obișnuiți din industrie, cum ar fi „SSN”, „ID fiscal” și „Număr de securitate socială”, utilizarea limbajului direct din document îmbunătățește rezultatele. De exemplu, dacă documentul spune „progresul locului de muncă”, încercați să evitați să utilizați variații precum „progresul proiectului”, „progresul programului” sau „starea jobului”.
- Construiți o interogare care conține cuvinte atât din antetul rândului, cât și din antetul coloanei. De exemplu, în exemplul de card de vaccinare precedent, pentru a cunoaște data celei de-a doua vaccinări, puteți încadra interogarea ca „La ce dată a fost administrată a doua doză?”
- Răspunsurile lungi cresc latența răspunsului și pot duce la expirări. Încercați să puneți întrebări care răspund cu răspunsuri mai mici de 100 de cuvinte.
- Transmiterea numai a numelui cheie ca întrebare funcționează atunci când încercați să extrageți perechi standard cheie-valoare dintr-un formular. Vă recomandăm să încadrați întrebări complete pentru toate celelalte cazuri de utilizare a extracției.
- Fii cât mai specific posibil. De exemplu:
- Când documentul conține mai multe secțiuni (cum ar fi „Împrumutatul” și „Coîmprumutatul”) și ambele secțiuni au un câmp numit „SSN”, întrebați „Ce este SSN-ul pentru împrumutat?” și „Ce este SSN-ul pentru co-împrumutați?”
- Când documentul are mai multe câmpuri legate de dată, fiți specific în limbajul de interogare și întrebați „Care este data la care a fost semnat documentul?” sau „Care este data nașterii cererii?” Evitați să puneți întrebări ambigue precum „Care este data?”
- Dacă cunoașteți în prealabil aspectul documentului, oferiți indicii de locație pentru a îmbunătăți acuratețea rezultatelor. De exemplu, întrebați „Care este data de sus?” sau „Care este data din stânga?” sau „Care este data de jos?”
Pentru mai multe informații despre caracteristica Interogări, consultați Textul documentaţie.
Concluzie
În această postare, am oferit o prezentare generală a noii funcții de interogări a Amazon Texttract pentru a prelua rapid și ușor informații din documente precum talonele de plată, note de credit ipotecar, carduri de asigurare și carduri de vaccinare pe baza întrebărilor în limbaj natural. De asemenea, am descris cum puteți analiza răspunsul JSON.
Pentru mai multe informații, consultați Analizarea documentelor , sau verificați consola Amazon Texttract și încercați această funcție.
Despre Autori
Uday Narayanan este arhitect senior de soluții la AWS. Îi place să ajute clienții să găsească soluții inovatoare la provocările complexe de afaceri. Domeniile sale principale de interes sunt analiza datelor, sistemele de date mari și învățarea automată. În timpul liber, îi place să facă sport, să se uite la emisiuni TV și să călătorească.
Rafael Caixeta este arhitect senior de soluții la AWS cu sediul în California. Are peste 10 ani de experiență în dezvoltarea de arhitecturi pentru cloud. Domeniile sale principale sunt serverless, containere și machine learning. În timpul liber, îi place să citească cărți de ficțiune și să călătorească prin lume.
Navneeth Nair este Senior Product Manager, Tehnic cu echipa Amazon Texttract. El se concentrează pe construirea de servicii bazate pe machine learning pentru clienții AWS.
Martin Schade este Senior ML Product SA cu echipa Amazon Texttract. Are peste 20 de ani de experiență în tehnologii, soluții de inginerie și arhitectură legate de internet. S-a alăturat AWS în 2014, îndrumându-i mai întâi pe unii dintre cei mai mari clienți AWS cu privire la cea mai eficientă și scalabilă utilizare a serviciilor AWS, iar ulterior sa concentrat pe AI/ML, cu accent pe viziunea computerizată. În prezent, este obsedat de a extrage informații din documente.
- Coinsmart. Cel mai bun schimb de Bitcoin și Crypto din Europa.
- Platoblockchain. Web3 Metaverse Intelligence. Cunoștințe amplificate. ACCES LIBER.
- CryptoHawk. Radar Altcoin. Încercare gratuită.
- Sursa: https://aws.amazon.com/blogs/machine-learning/specify-and-extract-information-from-documents-using-the-new-queries-feature-in-amazon-text/
- "
- 000
- 10
- 100
- ani 20
- 2022
- Despre Noi
- dobândi
- peste
- administrată
- Adoptare
- AI
- TOATE
- Cu toate ca
- Amazon
- sumă
- analiză
- Google Analytics
- api
- aplicație
- Aprilie
- automatizarea
- disponibil
- AWS
- Bancă
- deveni
- Început
- Beneficiile
- CEL MAI BUN
- Cele mai bune practici
- Datele mari
- Bloca
- Manuale
- frontieră
- Clădire
- afaceri
- California
- apel
- Carduri
- cazuri
- provocări
- şef
- director executiv
- Alege
- Oraș
- Cloud
- cod
- Coloană
- combinaţie
- Comun
- complex
- încredere
- Consoleze
- Containere
- conține
- Nucleu
- ar putea
- Covid-19
- Pandemie COVID-19
- Curent
- În prezent
- personalizat
- client
- clienţii care
- de date
- Analiza datelor
- descris
- în curs de dezvoltare
- Dispozitive
- diferit
- digital
- digital
- direct
- discuta
- documente
- Nu
- cu ușurință
- Eficace
- eficient
- element
- Inginerie
- mai ales
- exemplu
- executiv
- experienţă
- exponențial
- extracte
- Caracteristică
- Ficţiune
- Domenii
- Figura
- First
- Flexibilitate
- Concentra
- concentrat
- următor
- formă
- format
- formulare
- găsit
- FRAME
- Complet
- funcționalitate
- General
- GitHub
- mare
- mai mare
- cap
- ajutor
- ajută
- Înalt
- Cum
- Cum Pentru a
- HTTPS
- identifica
- imagine
- punerea în aplicare a
- implicite
- îmbunătăţi
- include
- include
- Inclusiv
- Crește
- a crescut
- industrie
- informații
- inovatoare
- intrare
- asigurare
- interes
- IT
- alăturat
- Cheie
- chei
- limbă
- mare
- cea mai mare
- conduce
- învăţare
- Nivel
- ușoară
- Linie
- Listă
- încărca
- local
- locaţie
- maşină
- masina de învățare
- major
- administrare
- manager
- manual
- Producător
- cartografiere
- Martie
- potrivire
- material
- scadență
- medical
- membru
- ML
- Mobil
- dispozitive mobile
- model
- Modele
- mai mult
- cele mai multe
- multiplu
- nume
- Natural
- caiet
- notițe
- număr
- obținut
- oferi
- promoții
- Ofiţer
- operaţie
- Operațiuni
- comandă
- organizații
- Altele
- pandemie
- Plătește
- plată
- plăți
- PC
- Platforme
- posibil
- puternic
- Principal
- proces
- prelucrare
- Produs
- productivitate
- Produse
- proprietate
- calitate
- întrebare
- repede
- Citind
- a primi
- recomanda
- Relaţii
- necesita
- răspuns
- REZULTATE
- Returnează
- revizuiască
- ROBERT
- Siguranţă
- scalabil
- Scară
- sdk
- securitate
- serverless
- serviciu
- Servicii
- instalare
- semnificativ
- Silver
- simplu
- teren
- smartphone-uri
- soluţie
- soluţii
- unele
- specialist
- Sportul
- standard
- început
- începe
- Stat
- Declarații
- Stare
- depozitare
- Istorii
- structurat
- sistem
- sisteme
- echipă
- Tehnic
- Tehnologii
- lumea
- Prin
- timp
- Unelte
- top
- subiecte
- Pregătire
- Traveling
- tv
- us
- utilizare
- utilizatorii
- folosi
- Utilizand
- Vaccin
- varietate
- viziune
- Ce
- Ce este
- OMS
- câştiga
- în
- fără
- cuvinte
- fabrică
- lume
- X
- an
- ani