OCR andmete väljavõtmiseks tarnedokettidest PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

OCR andmete väljavõtmiseks tarnedokumentidest



OCR andmete väljavõtmiseks tarnedokumentidest

Kas otsite ettevõtte automatiseerimislahendust? Ära enam otsi!

.cta-first-blue{ üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; piiri raadius: 0px; fondi kaal: paks; fondi suurus: 16 pikslit; rea kõrgus: 24 pikslit; polsterdus: 12px 24px; taust: #546fff; värvus: valge; kõrgus: 56 pikslit; teksti joondamine: vasakule; ekraan: inline-flex; painduv suund: rida; -moz-box-align: keskel; joonda-elemendid: keskel; tähevahe: 0 pikslit; box-sizing: border-box; border-width:2px !tähtis; ääris: tahke #546fff !tähtis; } .cta-first-blue:hover{ color:#546fff; taust: valge; üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !tähtis; ääris: tahke #546fff !tähtis; } .cta-second-black{ üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; piiri raadius: 0px; fondi kaal: paks; fondi suurus: 16 pikslit; rea kõrgus: 24 pikslit; polsterdus: 12px 24px; taust: valge; värv: #333; kõrgus: 56 pikslit; teksti joondamine: vasakule; ekraan: inline-flex; painduv suund: rida; -moz-box-align: keskel; joonda-elemendid: keskel; tähevahe: 0 pikslit; box-sizing: border-box; border-width:2px !tähtis; ääris: tahke #333 !tähtis; } .cta-second-black:hover{ värv:valge; taust:#333; üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !tähtis; ääris: tahke #333 !tähtis; } .column1{ min-width: 240px; max-laius: mahutav-sisu; polsterdus-parempoolne: 4%; } .column2{ min-width: 200px; max-laius: mahutav-sisu; } .cta-main{ kuva: flex; }


Tarnedokument on formaalne dokument, mis kaasneb kauba kohaletoimetamisega ja on kirje kohaletoimetatava kauba tüübi ja koguse kohta. Märkuse koopia tagastatakse tavaliselt müüjale kohaletoimetamise tõendina. Turu suureneva digitaliseerimisega on muutunud oluliseks tarnedokumentide automatiseeritud andmehaldus. Vaatame, kuidas OCR-i tööriistad saavad tarnedokumentidest andmeid eraldada.

var contentsTitle = "Sisukord"; // Määrake oma pealkiri siia, et vältida sellele hiljem pealkirja lisamist var ToC = "

"+contentsTitle+"

“; ToC += "

“; var tocDiv = document.getElementById('dynamictocnative'); tocDiv.outerHTML = ToC;


Saatedokumendi tähtsus

Saateleht või saateleht sarnaneb arvega, kuna see sisaldab ostja andmeid, müüja andmeid ja saadetava kauba tüüpi. See erineb arvest selle poolest, et sellel puudub hinnainfo (tavaliselt). Seda nimetatakse ka saateleheks või kauba vastuvõtmise teateks, selle väljastab müüja, saatja, vedaja või ekspediitor ning see on suunatud kliendile ja kõikidele vahendajatele, kes vastutavad toote kliendini jõudmise eest.

Kuigi puuduvad standardsed või ranged reeglid selle kohta, mida tarnedokument peab sisaldama, sisaldab saatedokument tavaliselt järgmist teavet:

  • Müüja/tarnija nimi ja aadress
  • Ostja/kliendi nimi ja aadress
  • Tellimuse kuupäev,
  • Saatmise kuupäev,
  • Eeldatav tarnekuupäev
  • Tellimuse number/nimi
  • Tarnega kaasas olevate kaupade nimekirjad
  • Võimalikud edasised tarned, nt tarne 1/3

Tarnedokument võib sisaldada selliseid üksikasju nagu müüja registreerimisnumber ja pangateave kindlustuse või uute klientide jaoks.

Hinnatud saateleht (või väärtustatud saateleht) võib sisaldada toote hinda, kuid sellistele märkidele peab olema lisatud arve.

Väärtusega saatedokumendi ja arve erinevus seisneb selles, et esimene ei kehti maksustamise eesmärgil ja on lihtsalt kättetoimetamise tõend. Seevastu arvet kasutatakse maksustamisel ja see sisaldab ostja ja müüja maksuandmeid, toodete hinda ning kõiki kohaldatavaid käibemaksu ja muid makse.

Saateleht annab müüjale tarnitavate toodetega parema käsitluse ja ülevaate nende tootlikkusest. See aitab klientidel (ostjatel) kontrollida, kas nad on saanud tooted, mille eest on tasutud. Sageli peab ostja märkusele alla kirjutama, andmaks ostjale teada, et tarne on olnud korras.

OCR andmete väljavõtmiseks tarnedokumentidest

Tahad kraapige andmed PDF-ist dokumendid, teisendada PDF-ist XML-i or automatiseerida tabeli väljavõtmist? Vaadake Nanonetsi PDF-kaabits or PDF-i parser teisendada PDF-id andmebaasi sissekandeid!

.cta-first-blue{ üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; piiri raadius: 0px; fondi kaal: paks; fondi suurus: 16 pikslit; rea kõrgus: 24 pikslit; polsterdus: 12px 24px; taust: #546fff; värvus: valge; kõrgus: 56 pikslit; teksti joondamine: vasakule; ekraan: inline-flex; painduv suund: rida; -moz-box-align: keskel; joonda-elemendid: keskel; tähevahe: 0 pikslit; box-sizing: border-box; border-width:2px !tähtis; ääris: tahke #546fff !tähtis; } .cta-first-blue:hover{ color:#546fff; taust: valge; üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !tähtis; ääris: tahke #546fff !tähtis; } .cta-second-black{ üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; piiri raadius: 0px; fondi kaal: paks; fondi suurus: 16 pikslit; rea kõrgus: 24 pikslit; polsterdus: 12px 24px; taust: valge; värv: #333; kõrgus: 56 pikslit; teksti joondamine: vasakule; ekraan: inline-flex; painduv suund: rida; -moz-box-align: keskel; joonda-elemendid: keskel; tähevahe: 0 pikslit; box-sizing: border-box; border-width:2px !tähtis; ääris: tahke #333 !tähtis; } .cta-second-black:hover{ värv:valge; taust:#333; üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !tähtis; ääris: tahke #333 !tähtis; } .column1{ min-width: 240px; max-laius: mahutav-sisu; polsterdus-parempoolne: 4%; } .column2{ min-width: 200px; max-laius: mahutav-sisu; } .cta-main{ kuva: flex; }


Väljakutsed tarnedokumentide andmete käsitsi väljavõtmisel

Tarnedokument võetakse tavaliselt vastu koos saadetise/tootega ettevõtte või lao vastuvõtul, olenevalt järgitavast äritavast. Mõlemal juhul peab saadetise vastuvõttev töötaja – vastavalt olukorrale esinduse töötajad või laotöötaja – võrdlema saatedokumendi üksikasju ostutellimuse, arve ja/või saadetise pakendi üksikasjadega. . Seejärel allkirjastab ta dokumendidokumendi, kui see selline on, ja esitab selle koopia ettevõtte registrisse.

Selle töötaja portfellis on tõenäoliselt liiga palju ülesandeid ja tarnedokumentide haldamine võib olla viimane piisk karikasse, mis tema moraali rikub.

Dokil loetletud esemete kontrollimine tarnitud esemetega on ühekordne protsess ja seda tuleb teha reaalajas. Saatedokumendi arhiveerimine ja arhiveerimine on kättetoimetamisjärgne toiming ning võib muutuda tüütuks, igavaks ja aeganõudvaks. Arhiveerimist ja arhiveerimist raskendavad veelgi tarnedokumentide erinevad vormingud ja paigutused. Saatelehed võivad olla paberkoopiatena, mis tarnitakse käsitsi või faksi teel, e-posti manusena või elektroonilise andmevahetusena (EDI). Enamikus ettevõtetes tuleb varude haldamiseks, arhiveerimiseks ja auditeerimiseks sisestada tarnedokumentide andmed andmebaasi.

Nendes mitmes vormingus tarnedokumentidest andmete käsitsi eraldamine võib olla aeganõudev ja tüütu. See põhjustab sageli vigu ja viivitusi dokumentide töötlemisel. Levinud väljakutsed andmete käsitsi väljavõtmisel tarnedokumentidest on järgmised:

  • Ajakulu, eriti ettevõtte kasvades ja ostude arvu suurenedes.
  • Liiga palju e-kirju ja paberit nõuab füüsilist faili salvestamist ja korrastamist.
  • Ostutellimuse, arve ja tarnedokumentide andmete mittevastavuse puudumine.
  • Valesti salvestatud ja unustatud esemed; see kehtib eriti siis, kui müüjad saadavad saatelehed kohe pärast kauba lähetamist. Kauba kättesaamise ajaks võib saatelehte sisaldav post mattuda sügavale saaja postkasti, mis põhjustab segadust.

Andmete käsitsi eraldamine tarnedokumentidest ja nende sisestamine andmebaasi, millele ei järgne kontrollimisetappe, võib olla kuni 4%. Andmesisestuse reegel 1-10-100 on andmesisestusringkondades hästi tuntud – andmete õigsuse kontrollimine sisestuspunktis maksab $1, vigade puhastamine 10$ partii kujul ning parandamata vead maksavad ettevõttele $100 või rohkemgi.

Tarnedokumentide OCR

Andmete ekstraheerimise tarkvara saab kasutada tarnedokumentidest andmete valikuliseks eraldamiseks. Optiline märgituvastus ehk OCR, tarkvara, mis eraldab andmeid skannitud dokumentidest, kaamerapiltidest ja ainult kujutisega pdf-idest, sobib kõige paremini andmete automaatseks väljavõtmiseks tarnedokumentidest.

Tänapäeval kasutatakse tööstuses andmete kaevandamiseks mitut tüüpi OCR-tarkvara. Kõige algelisem tüüp tõmbab saatedokumendist lihtsalt kogu teksti välja ning edasine kategoriseerimine ja mõtestatud andmete eraldamine nõuab inimlikku pingutust.

OCR andmete väljavõtmiseks tarnedokumentidest
Andmete ekstraheerimine algse OCR-tarkvara abil

Teise põlvkonna OCR – tsooni- või mallipõhine OCR – eraldab tarnedokumendist konkreetsed andmed, olenevalt selle asukohast või “tsoonist” dokumendis.

OCR andmete väljavõtmiseks tarnedokumentidest
Andmete ekstraheerimine tsoonilise OCR-tarkvara abil

Kolmanda põlvkonna optilised tekstituvastused (nt Nanonets) kasutavad tehisintellekti ja ML-i võimalusi saatelehtedest sisuka teabe targaks eraldamiseks. Need kognitiivsed optilise tekstituvastuse tööriistad on võimelised õppima uusi tarnedokumentide vorminguid ja stiile ning vähendavad seeläbi inimeste sekkumist.

OCR andmete väljavõtmiseks tarnedokumentidest
Andmete ekstraheerimine nanonettide abil

Heal tarnedokumendi OCR-il peavad olema järgmised omadused:

  • Võimalus hankida andmeid, mis võivad olla algses tarnedokumendis struktureeritud, halvasti struktureeritud ja/või struktureerimata. Nendest erinevatest allikatest eraldatud andmete sidususe tagab tehisintellektil põhineva andmete ekstraheerimise kasutamine.
  • Võimalus teisendada eraldatud andmed mitmeks loetavaks/redigeeritavaks vorminguks hilisemaks kasutamiseks.
  • Andmeturve – ettevõtte poolt ostetud toode võib olla väga tundlik ja konfidentsiaalne, kuna see võib olla osa ettevõtte patenteeritud ja kaubamärgiga kaitstud protsessidest. Andmete ekstraheerimise tarkvara peab suutma tagada andmete kaitsmise varguse, häkkimise ja halva haldamise eest.


Kas soovite korduvaid käsitsi tehtavaid ülesandeid automatiseerida? Vaadake meie Nanonetsi töövoopõhist dokumenditöötlustarkvara. Väljavõte autopiloodil andmeid arvetest, isikutunnistustest või mis tahes dokumendist!

.cta-first-blue{ üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; piiri raadius: 0px; fondi kaal: paks; fondi suurus: 16 pikslit; rea kõrgus: 24 pikslit; polsterdus: 12px 24px; taust: #546fff; värvus: valge; kõrgus: 56 pikslit; teksti joondamine: vasakule; ekraan: inline-flex; painduv suund: rida; -moz-box-align: keskel; joonda-elemendid: keskel; tähevahe: 0 pikslit; box-sizing: border-box; border-width:2px !tähtis; ääris: tahke #546fff !tähtis; } .cta-first-blue:hover{ color:#546fff; taust: valge; üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !tähtis; ääris: tahke #546fff !tähtis; } .cta-second-black{ üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; piiri raadius: 0px; fondi kaal: paks; fondi suurus: 16 pikslit; rea kõrgus: 24 pikslit; polsterdus: 12px 24px; taust: valge; värv: #333; kõrgus: 56 pikslit; teksti joondamine: vasakule; ekraan: inline-flex; painduv suund: rida; -moz-box-align: keskel; joonda-elemendid: keskel; tähevahe: 0 pikslit; box-sizing: border-box; border-width:2px !tähtis; ääris: tahke #333 !tähtis; } .cta-second-black:hover{ värv:valge; taust:#333; üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !tähtis; ääris: tahke #333 !tähtis; } .column1{ min-width: 240px; max-laius: mahutav-sisu; polsterdus-parempoolne: 4%; } .column2{ min-width: 200px; max-laius: mahutav-sisu; } .cta-main{ kuva: flex; }


AI-põhiste OCR-i kohaletoimetamise dokumentide eelised

AI-toega OCR-tööriistade (nt nanonetid) kasutamise eelised tarnedokumentide andmete haldamisel on järgmised:

  • Andmete täpsus: tehisintellekti võimendavad OCR-id võivad minimeerida või isegi täielikult kõrvaldada väsimusest või tähelepanuta jätmisest tingitud inimlikud vead.
  • Aja kokkuhoid: käsitsi andmete sisestamine saatelehtedelt võib olla aeganõudev ja optilise tekstituvastused võivad säästa palju aega, mida töötajad kulutavad igapäevastele korduvatele tegevustele. AI-toega OCR eraldab asjakohased andmed mis tahes dokumendist 27 sekundiga, samas kui käsitsi jäädvustamiseks kulub 3.5 minutit.
  • Töötajate ümberorienteerimine: tarnedokumentide andmete ekstraheerimise automatiseerimise tõttu töötaja käsutuses oleva aja saab ümber suunata tootlikeks ülesanneteks, mis võivad parandada nende oskusi ja ettevõtte kasumit.
  • Tsentraliseeritud andmed: OCR-tarkvaraga kogutud andmeid saab salvestada tsentraliseeritud asukohta ja seetõttu on need kättesaadavad kõigile ettevõtte sidusrühmadele.
  • Andmete turvalisus: OCR-i algatatud automatiseerimisprotsessi erinevatel tasanditel kontrollide sisseviimise võimalus võib suurendada andmete turvalisust.
  • Skaleeritavus: ettevõtte laienedes on käsitsi arvete haldamise süsteemi kasutamine tülikas. Optilised tekstituvastused võivad saatelehtede haldamise protsessi sujuvamaks muuta, mis toob kaasa mastaapi täiustamise.
  • Integratsioon ettevõtte teiste automaatikasüsteemidega. Kuna hüperautomaatika leiab aeglaselt ärisektoris tugipunkti, võib OCR-i kasutamine tarnedokumentide haldamise valdkonnas aidata operatsiooni integreerida suuremasse organisatsiooni, mis läbib.


Kas soovite kasutada robotiprotsesside automatiseerimist? Tutvuge Nanonetsi töövoopõhise dokumenditöötlustarkvaraga. Kood puudub. Ei mingit probleemiplatvormi.

.cta-first-blue{ üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; piiri raadius: 0px; fondi kaal: paks; fondi suurus: 16 pikslit; rea kõrgus: 24 pikslit; polsterdus: 12px 24px; taust: #546fff; värvus: valge; kõrgus: 56 pikslit; teksti joondamine: vasakule; ekraan: inline-flex; painduv suund: rida; -moz-box-align: keskel; joonda-elemendid: keskel; tähevahe: 0 pikslit; box-sizing: border-box; border-width:2px !tähtis; ääris: tahke #546fff !tähtis; } .cta-first-blue:hover{ color:#546fff; taust: valge; üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !tähtis; ääris: tahke #546fff !tähtis; } .cta-second-black{ üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; piiri raadius: 0px; fondi kaal: paks; fondi suurus: 16 pikslit; rea kõrgus: 24 pikslit; polsterdus: 12px 24px; taust: valge; värv: #333; kõrgus: 56 pikslit; teksti joondamine: vasakule; ekraan: inline-flex; painduv suund: rida; -moz-box-align: keskel; joonda-elemendid: keskel; tähevahe: 0 pikslit; box-sizing: border-box; border-width:2px !tähtis; ääris: tahke #333 !tähtis; } .cta-second-black:hover{ värv:valge; taust:#333; üleminek: kõik 0.1 s cubic-bezier(0.4, 0, 0.2, 1) 0s; border-width:2px !tähtis; ääris: tahke #333 !tähtis; } .column1{ min-width: 240px; max-laius: mahutav-sisu; polsterdus-parempoolne: 4%; } .column2{ min-width: 200px; max-laius: mahutav-sisu; } .cta-main{ kuva: flex; }


Nanonetside sobivus tarnedokumendi OCR-iks

Nanonets on AI-põhine OCR-tööriist, mis sobib kõige paremini tarnedokumentidest andmete eraldamiseks järgmistel põhjustel.

  • Dokumente (nt vorme) sisaldava reaüksuse tabelistruktuuri täpne tuvastamine.
  • Kõik rea artikli kirjed, mis esinevad sellistes vormides nagu nimi, toode, kogus jne.
  • Andmeid saab ekstraheerida JSON-väljundina, mis võimaldab luua kohandatud rakendusi ja platvorme.
  • Tarkvara pakub arendajatele suurepärast API-t ja dokumentatsiooni, kuid sobib ideaalselt ka organisatsioonidele, kus puudub sisemine arendajate meeskond.
  • See on tõeliselt koodivaba tööriist
  • Nanonetside lihtne integreerimine enamiku CRM-i, ERP-i, sisuteenuste või RPA-tarkvaraga.
  • Mitme keele töötlemine: Nanonets OCR suudab ära tunda käsitsi kirjutatud teksti, korraga mitmes keeles tekstipilte, madala eraldusvõimega pilte, uute või kursiivsete fontidega ja erineva suurusega pilte, varjulise tekstiga pilte, kallutatud teksti, juhuslikku struktureerimata teksti, pildimüra, udused pildid ja palju muud. Nagu aru võib saada, on see eriti oluline tarnete puhul eri riikide vahel või peab vedama kaupu eri keeli kasutavate piirkondade vahel.
  • Töötab kohandatud andmetega, kasutades kohandatud andmeid OCR-mudelite treenimiseks.
  • Sõltumatus vormingutest: Nanonetid ei ole dokumentide malliga üldse seotud. Saate andmeid kognitiivselt jäädvustada tabelitesse või reaüksustesse või mis tahes muusse vormingusse.
  • Paljud andmesisestustööriistad, nagu Nanonets, on varustatud tugeva tehnilise abi meeskonnaga, mis aitab ületada väljakutseid ja kasutada ära automatiseeritud andmesisestustoimingute täielikku potentsiaali.

Nanonetsi intelligentsed dokumenditöötluse kasutusjuhtumid aitavad organisatsioonidel automatiseerimist sujuvalt kasutusele võtta. Siin on mõned huvitavad juhtumiuuringud:

Ära viima

Andmete eraldamine tarnedokumentidest võib käsitsi tehes olla vaevarikas ja aeganõudev. Tehisintellektiga juhitud andmete ekstraheerimise tarkvara, nagu Nanonets, võib aidata protsessi automatiseerida. Tehisintellekti-OCR-i kasutamine töövoo hankimisest maksmiseks viimases etapis toob kaasa kaalukaid eeliseid, nagu aja- ja kulude kokkuhoid, sujuvam kinnitamisprotsess ja lõppkokkuvõttes paremad tulemused.


var contentsTitle = "Sisukord"; // Määrake oma pealkiri siia, et vältida sellele hiljem pealkirja lisamist var ToC = "

"+contentsTitle+"

“; ToC += "

“; var tocDiv = document.getElementById('dynamictocnative'); tocDiv.outerHTML = ToC;

Nanonetid võrgus OCR ja OCR API on palju huvitavaid kasutage juhtumeid tmüts võib teie ettevõtte toimivust optimeerida, kulusid kokku hoida ja kasvu kiirendada. Uuri välja kuidas saab Nanonetsi kasutusjuhtumeid teie tootele rakendada.


Ajatempel:

Veel alates Tehisintellekt ja masinõpe