OCR til at udtrække data fra leveringsdokumenter PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

OCR til at udtrække data fra leveringsdokumenter



OCR til at udtrække data fra leveringsdokumenter

Leder du efter en virksomhedsautomationsløsning? Stop med at lede!

.cta-first-blue{ overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-radius: 0px; font-weight: fed; skriftstørrelse: 16px; linjehøjde: 24px; polstring: 12px 24px; baggrund: #546fff; farve: hvid; højde: 56px; tekst-align: venstre; display: inline-flex; flex-retning: række; -moz-box-align: center; align-items: center; bogstavmellemrum: 0px; kassestørrelse: border-box; border-width:2px !vigtigt; grænse: solid #546fff !vigtigt; } .cta-first-blue:hover{ color:#546fff; baggrund: hvid; overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !vigtigt; grænse: solid #546fff !vigtigt; } .cta-second-black{ overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-radius: 0px; font-weight: fed; skriftstørrelse: 16px; linjehøjde: 24px; polstring: 12px 24px; baggrund: hvid; farve: #333; højde: 56px; tekst-align: venstre; display: inline-flex; flex-retning: række; -moz-box-align: center; align-items: center; bogstavmellemrum: 0px; kassestørrelse: border-box; border-width:2px !vigtigt; grænse: solid #333 !vigtigt; } .cta-second-black:hover{ color:white; baggrund:#333; overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !vigtigt; grænse: solid #333 !vigtigt; } .column1{ min-width: 240px; max-width: fit-content; polstring-højre: 4%; } .column2{ min-width: 200px; max-width: fit-content; } .cta-main{ display: flex; }


Et leveringsdokument er et formelt dokument, der ledsager leveringen af ​​varer og er en registrering af typen og mængden af ​​den vare, der leveres. En kopi af sedlen returneres normalt til sælger som bevis for levering. Med den stigende digitalisering af markedspladsen har automatiseret datahåndtering af leveringsdokumenter fået betydning. Lad os se, hvordan OCR-værktøjer kan hjælpe med at udtrække data fra leveringsdokumenter.

var contentsTitle = "Indholdsfortegnelse"; // Indstil din titel her, for at undgå at lave en overskrift til den senere var ToC = “

"+contentsTitle+"

"; ToC += “

"; var tocDiv = document.getElementById('dynamictocnative'); tocDiv.outerHTML = ToC;


Vigtigheden af ​​leveringsdokumentet

Leveringssedlen eller følgesedlen ligner fakturaen, idet den indeholder oplysninger om køber, detaljer om sælger og den type vare, der sendes. Det adskiller sig fra fakturaen ved ikke at have nogen prisoplysninger (normalt). Også kaldet en 'fragtseddel' eller en 'varemodtaget note', udstedes den af ​​sælgeren, afsenderen, transportøren eller speditøren og er rettet mod kunden og eventuelle mellemmænd, der er ansvarlige for at få produktet til kunden.

Selvom der ikke er nogen standard eller strenge regler for, hvad en leveringsseddel skal indeholde, indeholder en leveringsseddel typisk følgende information:

  • Navn og adresse på sælger/leverandør
  • Navn og adresse på køber/kunde
  • Dato for ordre,
  • Dato for afsendelse,
  • Forventet leveringsdato
  • Ordrenummer/navn
  • Lister over varer inkluderet i leverancen
  • Mulige yderligere leverancer, f.eks. levering 1 af 3

En leveringsseddel kan indeholde detaljer såsom registreringsnummer og bankoplysninger for sælgeren til forsikringsformål eller for nye kunder.

En værdisat leveringsseddel (eller følgeseddel vurderet) kan indeholde prisen på produktet, men sådanne noter skal være ledsaget af fakturaen.

Forskellen mellem en værdisat leveringsdokument og en faktura er, at førstnævnte ikke er skattemæssigt gyldig og blot er bevis for levering. Fakturaen på den anden side bruges i beskatning og indeholder skattedata for køber og sælger, prisen på produkterne og eventuel gældende moms og andre afgifter.

Et leveringsdokument giver sælgeren et bedre greb om afsendte produkter og et overblik over deres produktivitet. Det hjælper kunder (købere) med at tjekke, om de har modtaget de produkter, der er betalt for. Ofte skal køber underskrive sedlen for at fortælle køber, at leveringen har været i orden.

OCR til at udtrække data fra leveringsdokumenter

Ønsker du at skrabe data fra PDF dokumenter, konvertere PDF til XML or automatisere bordudtræk? Tjek Nanonets' PDF-skraber or PDF-parser at konvertere PDF-filer til database indgange!

.cta-first-blue{ overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-radius: 0px; font-weight: fed; skriftstørrelse: 16px; linjehøjde: 24px; polstring: 12px 24px; baggrund: #546fff; farve: hvid; højde: 56px; tekst-align: venstre; display: inline-flex; flex-retning: række; -moz-box-align: center; align-items: center; bogstavmellemrum: 0px; kassestørrelse: border-box; border-width:2px !vigtigt; grænse: solid #546fff !vigtigt; } .cta-first-blue:hover{ color:#546fff; baggrund: hvid; overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !vigtigt; grænse: solid #546fff !vigtigt; } .cta-second-black{ overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-radius: 0px; font-weight: fed; skriftstørrelse: 16px; linjehøjde: 24px; polstring: 12px 24px; baggrund: hvid; farve: #333; højde: 56px; tekst-align: venstre; display: inline-flex; flex-retning: række; -moz-box-align: center; align-items: center; bogstavmellemrum: 0px; kassestørrelse: border-box; border-width:2px !vigtigt; grænse: solid #333 !vigtigt; } .cta-second-black:hover{ color:white; baggrund:#333; overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !vigtigt; grænse: solid #333 !vigtigt; } .column1{ min-width: 240px; max-width: fit-content; polstring-højre: 4%; } .column2{ min-width: 200px; max-width: fit-content; } .cta-main{ display: flex; }


Udfordringerne ved manuel udtræk af leveringsdokumentdata

Leveringsdokumentet modtages normalt sammen med forsendelsen/produktet i receptionen hos en virksomhed eller lageret, afhængigt af den fulgte forretningspraksis. I begge tilfælde skal den medarbejder, der modtager forsendelsen – front office-personalet eller en lagermedarbejder, alt efter tilfældet – sammenligne oplysningerne i leveringsdokumentet med oplysningerne i indkøbsordre, faktura og/eller forsendelsespakke . Derefter underskriver hun dokumentet, hvis det er sådan, og arkiverer en kopi af det til virksomhedens optegnelser.

Denne medarbejder har højst sandsynligt alt for mange opgaver i sin portefølje, og administration af leveringsdokumenter er måske bare det sidste dråbe, der bryder hendes moral.

Kontrol af de varer, der er anført i pakken med de leverede varer, er en engangsproces og skal udføres i realtid. Arkivering og arkivering af leveringsdokumentet er en operation efter levering og kan blive trættende, kedelige og tidskrævende. Arkivering og arkivering kompliceres yderligere af de forskellige formater og layouts af leveringsdokumenterne. Følgesedler kan være i form af papirkopier, der leveres i hånden eller via fax, vedhæftede filer i e-mails eller som elektronisk dataudveksling (EDI). I de fleste virksomheder skal dataene i leveringsdokumenterne indtastes i en database med henblik på lagerstyring, arkivering og revisionsaktiviteter.

Det kan være tidskrævende og trættende manuelt at udtrække data fra leveringsdokumenter i disse flere formater. Dette fører ofte til fejl og deraf følgende forsinkelser i behandlingen af ​​dokumenter. De almindelige udfordringer ved manuel udtrækning af data fra leveringsdokumenter inkluderer,

  • Tidsforbrug, især i takt med at virksomheden vokser og antallet af indkøb stiger.
  • For meget e-mail og papir kræver fysisk filopbevaring og organisering.
  • Går glip af uoverensstemmelser mellem data i indkøbsordre, faktura og leveringsdokumenter.
  • Fejlarkiverede og glemte genstande; dette gælder især, når sælgere e-mailer følgesedler, så snart varerne er afsendt. På det tidspunkt, hvor varerne modtages, kan posten, der indeholder leveringsdokumentet, blive begravet dybt i modtagerens postkasse, hvilket fører til forvirring.

Manuel dataudtrækning fra leveringsdokumenter og deres indtastning i en database, der ikke efterfølges af verifikationstrin, kan have fejlrater så høje som 4 %. 1-10-100 dataindtastningsreglen er velkendt i dataindtastningskredse - verifikationen af ​​data-nøjagtighed ved indtastningspunktet koster $1, oprydning af fejl koster $10 i batchform, og ukorrigerede fejl koster virksomheden $100 eller mere.

Leveringsdoketter OCR

Dataekstraktionssoftware kan bruges til selektivt at udtrække data fra leveringsdokumenter. Optisk tegngenkendelse eller OCR, software, der udtrækker data fra scannede dokumenter, kamerabilleder og kun billed-pdf'er, er bedst egnet til automatisk udtrækning af data fra leveringsdokumenter.

Der er mange typer OCR-software, der bruges til dataudtræk i branchen i dag. Den mest rudimentære type udtrækker simpelthen al teksten fra leveringsdokumentet, og yderligere kategorisering og meningsfuld dataudtræk kræver menneskelig indsats.

OCR til at udtrække data fra leveringsdokumenter
Dataudtræk ved hjælp af rudimentær OCR-software

Anden generation af OCR – Zonal eller Template-baseret OCR – udtrækker specifikke data fra leveringsdokumentet, afhængigt af dets position eller "zone" i dokumentet.

OCR til at udtrække data fra leveringsdokumenter
Dataudtræk ved hjælp af zonal OCR-software

Tredje generations OCR'er såsom Nanonets bruger AI- og ML-funktioner til intelligent at udtrække meningsfuld information fra følgesedlerne. Disse kognitive OCR-værktøjer er i stand til at lære nye formater og stile af leveringsdokumenter med brug og minimerer dermed menneskelig indgriben.

OCR til at udtrække data fra leveringsdokumenter
Dataudtræk ved hjælp af Nanonets

En god leveringsdokument OCR skal have følgende funktioner:

  • Evnen til at udtrække data, der kan være strukturerede, dårligt strukturerede og/eller ustrukturerede i den originale leveringsdokumentation. Sammenhængen af ​​data udtrukket fra disse forskellige kilder muliggøres ved brug af AI-baseret dataudtræk.
  • Evnen til at konvertere de udtrukne data til flere læsbare/redigerbare formater til efterfølgende brug.
  • Datasikkerhed – produktet købt af en virksomhed kan være meget følsomt og fortroligt, da det kan være en del af virksomhedens patenterede og varemærkebeskyttede processer. Dataudtrækssoftwaren skal være i stand til at sikre, at dataene beskyttes mod tyveri, hacking og dårlig forvaltning.


Vil du automatisere gentagne manuelle opgaver? Tjek vores Nanonets workflow-baserede dokumentbehandlingssoftware. Udtræk data fra fakturaer, identitetskort eller ethvert dokument på autopilot!

.cta-first-blue{ overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-radius: 0px; font-weight: fed; skriftstørrelse: 16px; linjehøjde: 24px; polstring: 12px 24px; baggrund: #546fff; farve: hvid; højde: 56px; tekst-align: venstre; display: inline-flex; flex-retning: række; -moz-box-align: center; align-items: center; bogstavmellemrum: 0px; kassestørrelse: border-box; border-width:2px !vigtigt; grænse: solid #546fff !vigtigt; } .cta-first-blue:hover{ color:#546fff; baggrund: hvid; overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !vigtigt; grænse: solid #546fff !vigtigt; } .cta-second-black{ overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-radius: 0px; font-weight: fed; skriftstørrelse: 16px; linjehøjde: 24px; polstring: 12px 24px; baggrund: hvid; farve: #333; højde: 56px; tekst-align: venstre; display: inline-flex; flex-retning: række; -moz-box-align: center; align-items: center; bogstavmellemrum: 0px; kassestørrelse: border-box; border-width:2px !vigtigt; grænse: solid #333 !vigtigt; } .cta-second-black:hover{ color:white; baggrund:#333; overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !vigtigt; grænse: solid #333 !vigtigt; } .column1{ min-width: 240px; max-width: fit-content; polstring-højre: 4%; } .column2{ min-width: 200px; max-width: fit-content; } .cta-main{ display: flex; }


Fordele ved AI-baserede Delivery Dockets OCR

Nogle fordele ved at bruge AI-drevne OCR-værktøjer såsom Nanonets til datastyring af leveringsdokumenter er:

  • Nøjagtighed af data: OCR'er, der udnytter AI, kan minimere eller endda helt eliminere menneskelige fejl forårsaget af træthed eller forglemmelse.
  • Tidsbesparelser: Manuel dataindtastning fra følgesedler kan være tidskrævende, og OCR'er kan spare meget af den tid, medarbejderne bruger på hverdagsagtige gentagne aktiviteter. AI-aktiveret OCR udtrækker relevante data fra ethvert dokument på 27 sekunder mod 3.5 minutter til manuel optagelse.
  • Medarbejderomlægning: Den tid, der er til rådighed for medarbejderen på grund af automatisering af udtræk af leveringsdokumentdata, kan omdirigeres til produktive opgaver, der kan forbedre deres kompetencer og virksomhedens bundlinje.
  • Centraliserede data: De data, der opsamles af OCR-softwaren, kan gemmes på et centralt sted og vil derfor være tilgængelige for alle virksomhedens interessenter.
  • Sikkerhed af data: Muligheden for at indføre kontroller på forskellige niveauer af automatiseringsprocessen, der er initieret af OCR, kan øge datasikkerheden.
  • Skalerbarhed: Efterhånden som forretningen udvider sig, er det besværligt at have et manuelt system til fakturahåndtering. OCR'er kan strømline processen med følgeseddelstyring, hvilket fører til opskaleringsforbedringer.
  • Integration med virksomhedens øvrige automationssystemer. Med hyper-automatisering, der langsomt finder fodfæste i erhvervslivet, kan brugen af ​​OCR inden for leveringsdokethåndtering hjælpe med at integrere driften i det større system, der gennemsyrer organisationen.


Vil du bruge robotprocesautomatisering? Tjek Nanonets workflow-baseret dokumentbehandlingssoftware. Ingen kode. Ingen besværlig platform.

.cta-first-blue{ overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-radius: 0px; font-weight: fed; skriftstørrelse: 16px; linjehøjde: 24px; polstring: 12px 24px; baggrund: #546fff; farve: hvid; højde: 56px; tekst-align: venstre; display: inline-flex; flex-retning: række; -moz-box-align: center; align-items: center; bogstavmellemrum: 0px; kassestørrelse: border-box; border-width:2px !vigtigt; grænse: solid #546fff !vigtigt; } .cta-first-blue:hover{ color:#546fff; baggrund: hvid; overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !vigtigt; grænse: solid #546fff !vigtigt; } .cta-second-black{ overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-radius: 0px; font-weight: fed; skriftstørrelse: 16px; linjehøjde: 24px; polstring: 12px 24px; baggrund: hvid; farve: #333; højde: 56px; tekst-align: venstre; display: inline-flex; flex-retning: række; -moz-box-align: center; align-items: center; bogstavmellemrum: 0px; kassestørrelse: border-box; border-width:2px !vigtigt; grænse: solid #333 !vigtigt; } .cta-second-black:hover{ color:white; baggrund:#333; overgang: alle 0.1s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !vigtigt; grænse: solid #333 !vigtigt; } .column1{ min-width: 240px; max-width: fit-content; polstring-højre: 4%; } .column2{ min-width: 200px; max-width: fit-content; } .cta-main{ display: flex; }


Egnetheden af ​​Nanonets som en OCR for leveringsdokumenter

Nanonets er et AI-drevet OCR-værktøj, der er bedst egnet til udtrækning af data fra leveringsdokumenter af følgende årsager:

  • Nøjagtig registrering af tabelstrukturen for en linjepost, der indeholder dokumenter som formularer.
  • Alle linjepostposter, der er til stede i formularerne som navn, produkt, mængde osv.
  • Dataene kan udtrækkes som JSON-output, der kan gøre det muligt at bygge tilpassede apps og platforme.
  • Selvom softwaren tilbyder en fantastisk API og dokumentation til udviklere, er den også ideel til organisationer uden et internt team af udviklere.
  • Det er et værktøj uden kode
  • Nem integration af Nanonets med de fleste CRM-, ERP-, indholdstjenester eller RPA-software.
  • Flersprogsbehandling: Nanonets OCR kan genkende håndskrevet tekst, billeder af tekst på flere sprog på én gang, billeder med lav opløsning, billeder med nye eller kursive skrifttyper og varierende størrelser, billeder med skyggetekst, skrå tekst, tilfældig ustruktureret tekst, billedstøj, slørede billeder og mere. Dette er, som det kan forstås, særligt relevant for leverancer mellem forskellige lande eller skal transportere varer mellem regioner, der bruger forskellige sprog.
  • Arbejder med brugerdefinerede data gennem brug af brugerdefinerede data til træning af OCR-modeller.
  • Uafhængighed af formater: Nanonetter er slet ikke bundet af skabelonen for dokumenter. Du kan indfange data kognitivt i tabeller eller linjeposter eller et hvilket som helst andet format.
  • Mange dataindtastningsværktøjer som Nanonets kommer med et robust teknisk assistanceteam, der kan hjælpe med at overvinde udfordringerne og udnytte det fulde potentiale af automatiserede dataindtastningsoperationer.

Nanonets' intelligente dokumentbehandlingsbrug hjælper organisationer med at indføre automatisering problemfrit. Her er nogle interessante casestudier:

Tag væk

Dataudtræk fra leveringsdokumenter kan være besværligt og tidskrævende, når det udføres manuelt. AI-drevet dataekstraktionssoftware som Nanonets kan hjælpe med at automatisere processen. Brugen af ​​AI-OCR i det sidste trin af Procure-to-Pay-arbejdsgangen kommer med overbevisende fordele såsom tids- og omkostningsbesparelser, en strømlinet godkendelsesproces og i sidste ende bedre bundlinjer.


var contentsTitle = "Indholdsfortegnelse"; // Indstil din titel her, for at undgå at lave en overskrift til den senere var ToC = “

"+contentsTitle+"

"; ToC += “

"; var tocDiv = document.getElementById('dynamictocnative'); tocDiv.outerHTML = ToC;

Nanonetter online OCR & OCR API har mange interessante brug sager that kunne optimere din virksomheds ydeevne, spare omkostninger og øge væksten. Finde ud af hvordan Nanonets' use cases kan gælde for dit produkt.


Tidsstempel:

Mere fra AI og maskinindlæring