Automatisering av fakturabehandling med OCR og dyp læring

Publisert av Platon

Følgere: 0

Automatisering av fakturabehandling med OCR og Deep Learning

Lyst til å automatisere fakturabehandling? Sjekk ut Nanonets' forhåndstrente Faktura OCR or bygg din egen tilpasset faktura OCR. Du kan også planlegg en demonstrasjon for å lære mer om våre AP-brukssaker!

Introduksjon

I lang tid har vi vært avhengige av papirfakturaer for å behandle betalinger og føre regnskap. Avstemming av fakturaer innebærer vanligvis at noen manuelt bruker timer på å bla gjennom flere fakturaer og notere ting i en hovedbok.

Men kan denne prosessen gjøres bedre, mer effektivt, med mindre sløsing med papir, menneskelig arbeidskraft og tid?

Blant de mange ulempene ved å gå gjennom disse prosedyrene manuelt er høyere kostnader, større arbeidskraftbehov, mer tid brukt på repeterende oppgaver og et større karbonavtrykk.

Prosessen med digitalisering av en faktura kan deles inn i 4 trinn:

Konvertering av det fysiske dokumentet til en digital variant – dette kan gjøres gjennom
- fakturaskanning
- klikke på et bilde gjennom et kamera
Informasjonsutvinning – dette kan gjøres ved
- Mennesker – manuelt utført av anmeldere som vil analysere fakturaen for feil, lese teksten i den og legge den inn i en programvare for lagring og fremtidig gjenfinning.
- Maskiner -
  - Optisk tegngjenkjenning – gjenkjenne teksten og tallene i dokumentene.
  - Informasjonsutvinning – når prosessen med OCR er fullført, er det viktig å identifisere hvilken tekst som tilsvarer hvilket uttrukket felt. Hvis et felt er totalsum, delsum, fakturadato, leverandør osv.
Datadump - når informasjonen er trukket ut, må den lagres i et gjenfinnbart format som
- En database
- Et excel-ark
- Et ERP-system.

Dette innlegget kommer for det meste til å fokusere på OCR og informasjonsutvinning. Før vi dykker inn i hva som er galt med den nåværende tilstanden til OCR og informasjonsutvinning fakturabehandling, la oss først se på hvorfor vi bør bry oss om fakturadigitalisering i utgangspunktet.

Nanonetter støtter fakturafangst, fakturahåndtering & fakturaautomatisering på over 60 språk. Bygg din egen modell eller be om en demo i dag!

Hvorfor digitalisere fakturaer?

Digitalisering av informasjon har flere fordeler en virksomhet kan oppnå på flere grunnlag. Bedrifter kan spore prosessene sine bedre, kan gi bedre kundeservice, forbedre produktiviteten til sine ansatte og redusere kostnadene.

Her er noen grunner til at du bør vurdere å digitalisere fakturaer for din egen virksomhet.

For å automatisere prosesser
Med dyp læring og OCR kan du automatisk ta disse fakturabildene, trekke ut tabeller og tekst fra dem, trekke ut verdiene til forskjellige felt, foreta feilrettinger, sjekke om produktene samsvarer med din godkjende beholdning og til slutt behandle kravet hvis alt sjekker ut. Dette er et stort sprang fra det forsikringsbransjen tradisjonelt har gjort, men det kan likevel vise seg å være svært gunstig.
For å øke effektiviteten
Ved å digitalisere fakturaer kan flere prosesser gjøres mye raskere og smidigere. Ta for eksempel en butikkkjede som håndterer noen få faste leverandører for varer og behandler betalinger på slutten av hver måned. Denne butikken kan spare mye tid ved å automatisere prosessen med fakturahåndtering. Leverandører må bare laste opp regningene på en app eller en nettside, og de kan få umiddelbar tilbakemelding på om bildene har god oppløsning hvis bildet er av hele fakturaen hvis bildet er falskt eller ble digitalt manipulert, osv. sparer mye tid.
For å redusere kostnadene
De samme butikkenes franchise sparer mye penger ved å automatisere fakturadigitalisering ved hjelp av OCR og dyp læring. En faktura som må gå gjennom hendene på tre anmeldere slik at det ikke er noen feil, reduseres til én. Antallet fakturaer som behandles av en datamaskin er flere ganger raskere enn hva et menneske kunne gjøre. Tiden inkluderer å sjekke om fakturaen er svindel, om den har all informasjon, om all informasjon er korrekt, legge inn alle data manuelt i et regneark eller en database, kjøre beregninger og til slutt behandle betalingen.
For bedre oppbevaring
I tilfelle av tvister kan leverandøren nå appen og se gjennom alle fakturaene han/hun lastet opp og etterbehandlingsresultatene for hver faktura, og forklare varene, deres mengde, kostnadene for hver, avgifter og rabatter. Selskapet, som har automatisert prosessen med å legge inn disse dataene i en database, kan nå også hente denne informasjonen når som helst.
For å øke kundetilfredsheten
Fakturabehandling på lignende måte kan også hjelpe bedrifter med å forbedre kundeservicen. Mangler leveringen din fra en e-handelsplattform et produkt? Ta kontakt med dem, send dem fakturaen og forklar hva som mangler, så leser selskapet automatisk kvittering, finn det som forlot lagrene deres og send deg et svar som sier at det manglende produktet ditt nå er på vei!
For å redusere det økologiske fotavtrykket
Gjør noen enkle beregninger som de som er gjort her. vi innser at en mellomstor organisasjon som behandler 50000 30 fakturaer i måneden ender opp med å ofre mer enn 2.5 trær i året. Dette tallet vil mesteparten av tiden øke på grunn av duplisering av fakturaer. Det samme volumet papir vil også kreve XNUMX millioner liter vann for å produsere. I en slik tid kan det å ta de nødvendige skritt fra organisasjoner for å redusere deres økologiske fotavtrykk hjelpe miljøet langt.

Utvikling av faktureringsprosessen

Prosessen med å gjennomgå fakturaer har utviklet seg mye over tid. Veksten i teknologi har ført til at prosessen med fakturabehandling beveger seg gjennom tre hovedfaser.

Fase 1: Manuell gjennomgang

Vurder en brukssituasjon der en organisasjon går gjennom prosessen med å refundere sine vanlige leverandører for månedens utgifter.

Automatisering av fakturabehandling med OCR og Deep Learning

Følgende trinn følges for å behandle fakturaer –

Det forventes at folk sender flere fakturaer personlig til den aktuelle organisasjonens kontaktperson.
Denne personen vil på sin side videresende alle fakturaene til en kontrollør som vil gjennomgå hvert dokument fullstendig. Dette inkluderer å skrive ned eller skrive inn hver detalj i en programvare som navnet på personen som foretar kjøpet, navnet på butikken kjøpt fra, dato og klokkeslett for kjøp, kjøpte varer, deres kostnader, rabatter og avgifter.
Summen av hver faktura beregnet, igjen manuelt eller hvis dataregistreringsprogramvaren er spesielt utviklet for regnskapsformål, ved å bruke nevnte programvare.
En sluttregning/kvittering gjøres med de endelige tallene og utbetalingene behandles.

Fase 2: Fakturaskanning og manuell gjennomgang

Med bruken av OCR-teknikker ble mye tid spart automatisk trekke ut teksten fra et digitalt bilde av enhver faktura eller et dokument. Det er her de fleste organisasjoner som bruker OCR for enhver form for automatisering er for tiden.

Digitale kopier av fakturaer innhentes av skanne fakturaer eller ta bilder med et kamera.
De tekst trekkes ut fra disse fakturaene ved hjelp av OCR. Dette er i stand til å gi digital tekst som gjør datainntasting litt enklere. Men mye arbeid gjenstår fortsatt manuelt.
OCR-resultatene for hver faktura må analyseres på riktig måte for å finne de relevante dataene og forkaste de irrelevante dataene.
Når dette er gjort, må dataene legges inn i en programvare som gir anmelderen en mal for å gjøre oppgaven hans enklere. Denne malen er unik for hver brukstilfelle, organisasjon og for det meste for hver annen type faktura. Mens OCR-prosessen hjelper fakturabehandlingen, løser den ikke mange kjedelige delene på grunn av de ustrukturerte resultatene av OCR.
Dataene som legges inn går gjennom manuell gjennomgang for å rette feil. Denne prosessen tar litt tid siden den går gjennom flere anmeldere på grunn av dårlig ytelse til tilgjengelige OCR-verktøy.
Til slutt gjøres beregningene og betalingsopplysningene sendes til økonomiavdelingen.

Hvordan digitalisere fakturaer bedre?

Ved å bruke OCR og dyp læring har vi gjort det mulig for maskiner å yte like bra og i noen tilfeller enda bedre enn mennesker.

Digitalisering av fakturaer innebærer flere menneskelig modererte trinn:

Digitale bilder av fakturaer tatt og lastet opp av brukeren.
Bilde bekreftet for å være egnet for videre behandling – god oppløsning, alle data synlige i bildet, bekreftede datoer osv.
Bilder sjekket for svindel.
Tekst i disse bildene trukket ut og satt i riktig format.
Tekstdata lagt inn i tabeller, regneark, databaser, balanser, etc.

Fase 3: Deep Learning og OCR

Dyplæringstilnærminger har sett fremskritt i det spesielle problemet med å lese teksten og trekke ut strukturert og ustrukturert informasjon fra bilder. Ved å slå sammen eksisterende dyplæringsmetoder med optisk tegngjenkjenningsteknologi, har bedrifter og enkeltpersoner vært i stand til å automatisere prosessen med digitalisering av dokumenter og muliggjorde enklere manuelle dataregistreringsprosedyrer, bedre logging og lagring, lavere feil og bedre responstid.

Flere verktøy er tilgjengelige i markedet og åpen kildekode-fellesskapet for slike oppgaver, alle med sine fordeler og ulemper. Noen av dem er Google Vision API, Amazon Rekognition og Microsoft Cognitive Services. De mest brukte åpen kildekode-verktøyene er Oppmerksomhet-OCR og Tesseract.

Alle disse verktøyene kommer til kort på samme måte – dårlig nøyaktighet som krever manuell feilretting og behovet for regelbaserte motorer som følger tekstutvinning å faktisk kunne bruke dataene på en meningsfull måte. Vi vil snakke mer om disse problemene og mer i de kommende avsnittene.

Hva gjør problemet interessant?

De OCR-landskap består for det meste av regelbaserte motorer som i stor grad er avhengige av etterbehandling av OCR-resultater ved å matche mønstre eller definere spesifikke maler som OCR-resultatene er tvunget til å passe inn i. Denne tilnærmingen har hatt en viss suksess, men krever et lag med programvare bygget på toppen av OCR-motorer som er en ressurskrevende oppgave.

Et større problem med denne regelbaserte tilnærmingen er at dette ekstra laget med programvare må designes på nytt hver gang du har å gjøre med en ny fakturamal. Automatisering av malprosessen sammen med OCR kan skape en enorm innvirkning for alle som jobber med fakturaer.

Og det er bare problemet vi har Nanonetter besluttet å løse.

En mindre kjent tilnærming til dette problemet inkluderer bruk av maskinlæring for å lære strukturen til et dokument eller en faktura i seg selv, slik at vi kan jobbe med data, lokalisere feltene vi må trekke ut først som om vi skulle løse et objektgjenkjenningsproblem (og ikke OCR) og deretter få teksten ut av den. Dette kan gjøres ved å modellere de nevrale nettverkene dine på en måte for å lære hvordan du identifiserer og trekker ut tabeller, forstår kolonner og felt som finnes i den, hvilke kolonner og felt som vanligvis finnes i en faktura til tross for formatet.

Fordelen med en slik tilnærming er at det blir mulig å lage en maskinlæringsmodell som kan generaliseres til alle slags dokumenter eller fakturaer og kan brukes ut av esken uten noen tilpasninger. Å legge til en kontinuerlig læringssløyfe ved å samle inn nye data og omskolere modeller med jevne mellomrom kan føre til god ytelse på et stort utvalg av data.

Har du et OCR-problem i tankene? Vil du digitalisere fakturaer, PDF-filer eller nummerplater? Gå over til Nanonetter og bygg OCR-modeller gratis!

Hvorfor er nåværende dyplæringsverktøy ikke tilstrekkelig?

Selv med alle fordelene automatisert fakturabehandling har å tilby, bransjer har ikke sett utbredt bruk av OCR- og dyplæringsteknologier, og det er flere grunner til det.

La oss prøve å forstå med et eksempel - et helseforsikringsselskap som håndterer resepter og fakturaer. Automatisere skadebehandling i forsikringsselskapet ditt ved å la brukere laste opp bilder av fakturaer ved å ta bilder på telefonen eller datamaskinen eller skanne fakturaer vil øke brukervennligheten for kundene og tiltrekke dem mer. Disse opplastede bildene går vanligvis gjennom flere runder av den manuelle gjennomgangen der du bekrefter om fakturaene er legitime hvis tallene stemmer, det er produktene nevnt i kvitteringer er gyldige for et forsikringskrav osv. Men med fakturabehandlingsautomatisering kan disse oppgavene utføres på en brøkdel av tiden det tar å gjøre det manuelt, og med minst 50 % reduksjon i arbeidskraft.

Men det er veisperringer for å bygge en slik ende-til-ende-tilnærming som fungerer i henhold til en bransjebrukstilfelle, kan drive automatisering samtidig som man sørger for at feil ikke bruker mye av budsjettet, og som også fører til høyere rater for kundeintroduksjon.

Nøyaktighet av OCR-teknologi

For øyeblikket fungerer ikke de beste OCR-verktøyene som er tilgjengelige på markedet tilfredsstillende for å bruke disse API-ene i stor skala for enhver brukssituasjon. I følge dette Artikkel, Google Visjon, Best OCR API tilgjengelig akkurat nå er bare i stand til å gi 80 % nøyaktighet. Nøyaktigheten til andre produkter på markedet liker Amazon-anerkjennelse og Microsoft Cognitive Services er dystre. Microsoft presterte med en nøyaktighet på 65 %, mens AWS-gjenkjenning kun utførte med 21 % nøyaktighet.

Dette forverres av det faktum at disse API-ene ikke tillater tilpasset opplæring for spesifikke data selskapet ville brukt mest. Å investere i programvare som yter dårligere enn mennesker når det gjelder nøyaktighet, fortsatt trenger manuell inntasting, manuell feilretting og manuell gjennomgang virker som bortkastet tid og penger.

Deep Learning ekspertise

OCR-produkter som Google Vision har flere ulemper når de må håndtere tekst i forskjellige retninger, forskjellige språk, skyggefull eller støyende tekst. De lar deg ikke bruke dataene dine og bygge tilpassede modeller, noe som gjør produktets direkte integrering i en organisasjons arbeidsflyt vanskelig. Mange ganger, for å omgå et problem som dette, må organisasjoner ansette et datavitenskaps- eller maskinlæringsteam og bygge disse verktøyene for seg selv. Dette tar tid, penger og krefter.

Etter dette må dataforskerne tilpasse sin kunnskap og ekspertise med selskapets mål og finne ut nøyaktig hvilke beregninger som skal optimaliseres for å levere disse resultatene. Dette krever at dataforskeren forstår et forretningsforslag, gjør det til et matematisk problem, forstår selskapets SLAer, finner de riktige dataene, bygger maskinlæringsmodeller, justerer dem for å få den nødvendige nøyaktigheten samtidig som man sørger for at feilsakene også håndteres elegant. .

Få de riktige dataene

En veldig viktig del av å bygge den riktige maskinlæringsmodellen er å finne de riktige dataene, og det er bare ikke nok data for oss å jobbe med. Det er datasett tilgjengelig for OCR for oppgaver som nummerskiltgjenkjenning eller håndskriftgjenkjenning, men disse datasettene er neppe nok til å få den nøyaktigheten en behandling av forsikringskrav eller en tilbakebetaling av leverandøren krever.

Disse brukstilfellene krever at vi bygger modellene våre og trener dem på den typen data vi kommer til å håndtere mest, samtidig som vi sørger for at feil minimeres og datasettet er balansert. Håndtere, si resepter fra leger eller kvitteringer fra små leverandører krever at modellene våre fungerer godt på digitale så vel som håndskrevne tekstdokumenter.

Beregningsressurser

Oppgaven med å bygge en intern ML-løsning innebærer mer enn bare å ansette de beste maskinlæringsingeniørene for å designe algoritmene med best mulig nøyaktighet. Beregningskravene for å bygge modeller på bildedata er høye og inkluderer vanligvis GPUer enten på stedet eller på nettskyen. Å kjøre en K-80 GPU-forekomst på Google Cloud Platform koster rundt $230 i måneden. Disse kostnadene øker når du må lære opp modeller eller omskolere gamle modeller med nye data.

Hvis det å bygge en egen løsning er tilnærmingen du velger, må kostnadene ved å bygge den kompenseres av en økt mengde kunder som registrerer seg, en økt behandlingshastighet for fakturaer og en reduksjon i antall manuelle kontrollører som kreves.

Skreddersy løsninger til bedriftens behov

Å bygge et tilbakebetalingssystem for leverandører krever for eksempel at vi inkluderer flere trinn. Å finne en arbeidsflyt for dine organisasjonsbehov er ikke det samme som å bygge en maskinlæringsmodell som vil gi deg god nøyaktighet.

Det du trenger er modeller som kan:

Lever nøyaktighet på minst menneskelig nivå
Kan håndtere all slags data
Tilpass feilhåndtering
Øk bekvemmeligheten av menneskelig tilsyn
Sørg for åpenhet i databehandlingstrinnene
Se etter svindel
Tillat etterbehandling av OCR-resultater for å sette dem i en struktur
Tillat å kontrollere at alle obligatoriske felt er der og at verdiene er riktige
Tillat enkel lagring og databasering av disse dataene
Tillat automatisering av varslingsprosedyrer avhengig av resultatene

Dette er, som du kanskje har gjettet, en lang og vanskelig prosedyre, ofte med ikke så enkle løsninger.

Nanonetter støtter fakturafangst & fakturaautomatisering på over 60 språk. Bygg din egen modell eller be om en demo i dag!

Gå inn i Nanonets

Med Nanonetter du trenger ikke å bekymre deg for å finne talent for maskinlæring, bygge modeller, forstå skyinfrastruktur eller distribusjon. Alt du trenger er et forretningsproblem du trenger løsninger for.

Enkel å bruke nettbasert GUI

Nanonets tilbyr et brukervennlig nettbasert GUI som kommuniserer med API-en deres og lar deg lage modeller, trene dem på dataene dine, få viktige beregninger som presisjon og nøyaktighet og kjøre slutning på bildene dine, alt uten å skrive noen kode.

Cloud-hosted modeller

I tillegg til å tilby flere modeller som kan brukes direkte fra esken for å få løsninger, kan brukerne bygge sine modeller som er vert på skyen og kan fås med en API-forespørsel for inferensformål. Du trenger ikke å bekymre deg for å få en GCP-forekomst eller GPUer for trening.

Toppmoderne algoritmer

Modellene som er bygd, bruker toppmoderne algoritmer for å gi deg de beste resultatene. Disse modellene utvikler seg stadig for å bli bedre med mer og bedre data og bedre teknologi, bedre arkitekturdesign og mer robuste hyperparameterinnstillinger.

Feltuttak

Den største utfordringen med å bygge et fakturadigitaliseringsprodukt er å gi struktur til den uttrukne teksten. Dette blir enklere av OCR API som automatisk trekker ut alle nødvendige felt med verdiene og plasserer dem i en tabell eller i et JSON-format slik at du enkelt kan få tilgang til og bygge videre på det.

Automatiseringsdrevet

Vi i Nanonets mener at automatisering av prosesser som fakturadigitalisering kan skape en enorm innvirkning på organisasjonen din når det gjelder økonomiske fordeler, kundetilfredshet og ansattes tilfredshet. Nanonets strever for å gjøre maskinlæring allestedsnærværende, og for det formål er vårt mål å gjøre ethvert forretningsproblem du har løst på en måte som krever minimal menneskelig tilsyn og budsjetter i fremtiden.

OCR med Nanonets

De Nanonets-plattformen lar deg enkelt bygge OCR-modeller. Du kan laste opp dataene dine, kommentere dem, stille modellen til å trene og vente på å få spådommer gjennom et nettleserbasert brukergrensesnitt uten å skrive en eneste linje med kode, bekymre deg for GPU-er eller finne de rette arkitekturen for dine dype læringsmodeller.

Oppdatering: Modellene våre er enda mer nøyaktige. Vi har lagt til nye felt som PO-nummer, e-post-IDer og tabellutvinning for ytterligere å forbedre din fakturaautomatisering arbeidsflyt.

Begynn å digitalisere fakturaer med nanonetter – 1 Klikk på Digitalisering:

Sett opp en demo

Sett opp en demo for å lære om hvordan Nanonets kan hjelpe deg med å løse dette problemet

‌‌

Videre Reading

Oppdatering:‌
‌ Lagt til mer lesestoff om ulike tilnærminger for automatisering av fakturabehandling ved hjelp av OCR og Deep Learning.

Tidstempel: April 21, 2022

Tidstempel: August 8, 2022