Ne bi pretiraval, če bi rekel, da povprečen človek pošlje/prejme vsaj 10 računov na teden. Zaradi vse večje digitalizacije se podjetja vsak dan soočajo z ogromnimi količinami računov. Tradicionalno je bila obdelava računov ročni in dolgotrajen proces, ki zahteva precejšnja sredstva in je nagnjen k napakam.
S prihodom umetne inteligence in obdelave naravnega jezika je obdelava računov zdaj lahko avtomatizirana in poenostavljena, kar vodi k izboljšani učinkovitosti in natančnosti. GPT pomeni »Generative Pre-trained Transformer« in se nanaša na družino zmogljivih modelov za obdelavo jezikov, ki jih je razvil OpenAI. Modeli GPT so vnaprej usposobljeni za velike količine besedilnih podatkov in jih je nato mogoče natančno nastaviti za določene naloge, vključno z obdelavo računov.
Vzemimo primer obdelave računa za naročila knjigarne, vzorec računa je prikazan na spodnji sliki. Ta račun vsebuje informacije o pošiljanju, obračunu, artiklih in cenah. Predstavljajte si, da morate ročno zbirati podatke iz tisočih računov! Na srečo imamo orodja AI, ki pospešijo proces.
V tem spletnem dnevniku vas bom vodil skozi korake za obdelavo vašega računa z GPT-4 in Nanoneti. Vzemite skodelico kave in se opremite!
1. korak: Ustvarite račun Nanonets in naložite sliko
Prvi korak je izvleček besedilnih podatkov iz slike našega računa. Tehnike OCR (Optical Character Recognition) uporabljajo algoritme za prepoznavanje vzorcev za prepoznavanje in pretvorbo znakov v besedilo na slikah ali skeniranih dokumentih. Platforma umetne inteligence (AI) Nanonets, ki temelji na oblaku, ponuja izbrana orodja za OCR za posebne naloge, vključno z OCR za račune. Lahko se preprosto prijavite tukaj in brezplačno dostopajte do njihovega orodja za OCR za račune.
Ko se prijavite in kliknete OCR računa, lahko najdete možnost »Naloži datoteke«. Nanonets je zelo uporabniku prijazen in omogoča nalaganje datotek iz več kot 6 aplikacij.
Tukaj sem naložil vzorec računa iz knjigarne Agatha. Ekstrakcija bi bila končana v nekaj minutah in dobili bi zavržene rezultate, kot je prikazano. Tu se za ekstrahiranje entitet in njihovih vrednosti uporablja predhodno usposobljen model globokega učenja.
Vsa besedilna polja, ki jih prepozna Nanonets, so omejena z ločenimi okvirji. Vrednosti, ekstrahirane za ta polja, si lahko ogledate v zavihku 'KONČNI REZULTATI' na desni. To ekstrakcijo entitet, ki jo izvajajo Nanoneti, je mogoče izboljšati z uporabo GPT-4. Nanonets ponuja tudi možnosti za dodajanje ali spreminjanje imen polj, kar izboljša prilagajanje in uporabniško izkušnjo za stranke.
Želite avtomatizirati svoje ročne procese AP? Rezervirajte 30-minutno predstavitev v živo in si oglejte, kako lahko Nanonets vaši ekipi pomaga pri implementaciji od konca do konca AP avtomatizacija.
2. korak: Prenesite besedilne podatke OCR
Izvlečene besedilne podatke OCR je mogoče prenesti v več oblikah. Preverite spodnji GIF, če si želite ogledati predstavitev prenosa podatkov o računu v datoteko Excel ali CSV. V datoteki CSV so vsa imena entitet/podatkovnih polj shranjena kot stolpci, njihove vrednosti pa so v ustreznih vrsticah.
Kopiramo in prilepimo podatke iz prenesenega CSV-ja in pridobimo OCR-generirano besedilo. Tukaj je besedilo, ki sem ga prenesel iz našega vzorčnega računa v Nanonets.
Besedilo, ustvarjeno z OCR, je mogoče izboljšati z uporabo Chat GPT3 z naslednjimi koraki.
Izvleček entitete je mogoče povečati tako, da podpira različne poizvedbe, če uporabimo modele GPT4 poleg obdelanega besedila Nanonets. Za račun Open AI se lahko prijavite na tukaj in pridobite dostop do velikih jezikovnih modelov. Ko nastavite svoj račun, boste prejeli edinstven ključ API. Namenjen je varnostnim ukrepom za preverjanje pristnosti in avtorizacijo zahtev, poslanih strežnikom OpenAI. Uvozite paket OpenAI in nastavite vrednost ključa API.
Oblikovanje poziva na jasen, strukturiran način je skrivnost za odklepanje moči velikih jezikovnih modelov. Če želite ekstrahirati podatkovno polje ali entitete in njihove vrednosti, lahko uporabimo spodnji poziv.
#določite svoj poziv
prompt_text= To je OCR ustvarjeno besedilo računov za naročila v knjigarni” +ocr_generated_text” + “Izvleči entitete in njihove vrednosti kot par ključ-vrednost iz podanega OCR besedila in izhod v formatu ključ: vrednost”
Ko prejmete poziv, ga lahko posredujete kateremu koli vnaprej usposobljenemu modelu OpenAI in dobite odgovor prek » openai.Completion.create()".. Obstaja nekaj parametrov, ki jih lahko izberete, da dobite najboljši rezultat.
Parametri GPT:
- motor: Ta parameter vam omogoča, da izberete določen vnaprej usposobljen model velikega jezika (LLM), ki ga boste uporabili za generiranje besedila. Nastavite ga lahko na vnaprej pripravljen model ali po meri natančno nastavljen model. Text Davinci je močna in učinkovita izbira.
- Poziv: To je začetni besedilni poziv, ki ga damo modelu, da začne generirati besedilo. V našem primeru spremenljivka »prompt_text«, ki smo jo definirali prej.
- Max_tokens: Označuje največje število žetonov, ki jih lahko model ustvari za dani poziv. S tem lahko nadzorujete dolžino ustvarjenega besedila.
- temperatura: Uporabite ga za nadzor stopnje naključnosti ali ustvarjalnosti v ustvarjenem besedilu. Vrednost nizke temperature povzroči bolj konzervativen in predvidljiv rezultat, medtem ko vrednost visoke temperature vodi do bolj ustvarjalnega in raznolikega rezultata. Vrednost temperature se giblje od 0 do 1, pri čemer je 1 najbolj ustvarjalna.
Zdaj, ko ste seznanjeni s parametri GPT, napišimo kodo za ustvarjanje izhodnih podatkov s posredovanjem besedila poziva skupaj z drugimi parametri.
Rezultat smo dobili kot:
Entitete in njihove vrednosti so bile hitro ekstrahirane v samo nekaj korakih!
4. korak: izboljšanje popravkov podatkov
Med tisoči računov, ki krožijo v katerem koli podjetju, so nedoslednosti in manjše napake v podatkih o strankah neizogibne. Na primer, nekatere stranke so morda navedle neveljavno obliko e-pošte ali kontaktne številke ali pa je datum v drugačni obliki. Z Nanonets in GPT-4 lahko preprosto prepoznate te težave in izvedete popravke podatkov. Izvajamo lahko validacije na podlagi pravil, da preverimo pravilnost in obliko ter preverimo nedoslednosti.
Pozovem GPT, da opravi potrditev datuma in e-pošte namesto nas.
prompt_text= “V zgoraj izvlečenih podatkih subjektov preverite, ali sta oblika datuma (DD/MM/LLLL) in e-pošte pravilna?”
LLM zagotavlja kodo Python z uporabo regularnih izrazov za preverjanje oblike, kot je prikazano na spodnji sliki. V regularnem izrazu iščemo določen vzorec in ga ujemamo. Izvlečene entitete so shranjene v slovarju, funkcije pa so definirane ločeno za preverjanje e-pošte in datumov računa.
Po definiranju lahko tem funkcijam posredujete poljuben datum, kot je ('datum računa'), e-poštni ID prodajalca ali kupca, da dobite rezultat.
GPT vam pomaga tudi pri popravkih in spremembah podatkov na hiter in udoben način. Upoštevajte, da je na našem računu datum '02/05/2023'. Spodnji poziv dam za pretvorbo datuma v obliko »MM/DD/LL«.
prompt=” spremenite obliko podatkov v ekstrahiranih entitetah v 'MM/DD/LL'. Ohranite samo zadnji 2 števki v letu"
V izpisu so bili podatki popravljeni po želji. Lahko damo podobne pozive, da preverimo, ali ima kontaktna številka 10 števk, ali je naslov v želeni obliki in tudi preverimo manjkajoče vrednosti podatkov.
Nastavite delovne poteke AP brez dotika in poenostavite postopek obračunavanja obveznosti v nekaj sekundah. Rezervirajte 30-minutno predstavitev v živo zdaj.
5. korak: Preverite, ali obstajajo težave s podatki
Kakršno koli neskladnost v podatkih je mogoče enostavno prepoznati z GPT-4. V našem primeru lahko preverite, ali se skupni zapadli znesek ne ujema z vsoto posameznih cen artiklov. Zagotovimo poziv za to.
prompt=»Preverite, ali je skupno dolgovano stanje na računu skladno s količino in cenami artiklov na računu«
GPT-4 izda funkcijo v Pythonu, ki izračuna vsoto cen vseh naročil z množenjem količine in cene posameznega artikla. V primeru, da skupno stanje ni v skladu z zneskom, navedenim na računu, se določen račun označi in preišče. To bi lahko podjetjem pomagalo, da se izognejo kakršnim koli napakam, neskladjem in potrdijo svoje finančne podatke.
Če imate velik nabor podatkov o računih, lahko preverite tudi skladnost več računov. Primerjate lahko na primer podatke o prodajalcu in kupcu na več računih, da ugotovite morebitna odstopanja ali nepravilnosti.
6. korak: Poizvedovanje z GPT
Ko izvlečete entitete, lahko GPT uporabite tudi za pridobivanje odgovorov na določene poizvedbe iz celotnih informacij. Na primer, kaj, če želite vedeti informacije o podrobnostih pošiljanja določenega računa št.
Naredimo poziv za to:
#določite svoj poziv
prompt_text= “Izvlecite podrobnosti o pošiljanju iz parov ključ-vrednost entitete”
Izpolnitev, ustvarjena za ta poziv, je bila:
>> Seveda! Na podlagi posredovanih podatkov OCR lahko podatke o pošiljanju in podatke za obračun izvlečemo v dve skupini, kot sledi:
Informacije o pošiljanju:
“invoice_number”: “3522”
ship_to_name: Gayathri Natarajan
naslov_odpreme: 600053 No.22B, Chetpet, Chennai, Tamil Nadu, Indija: Tanaya Pakahale
Podobno poizvedbo lahko izvedete tudi za pridobitev podatkov o prodajalcu. Tukaj so izvlečeni podatki o prodajalcih iz posredovanih podatkov:
- seller_name: KNJIŽNA HIŠA AGATHA
- seller_address: No.13, 2nd avenue, Indiranagar, Bangalore, Karnataka, Indija, 721302
- telefon_prodajalca: 6783456723
Pri delu z več dokumenti lahko tudi iščemo in filtriramo račune s skupnim dolgovanim stanjem nad 5000 Rs, da analiziramo množična naročila. Ker lahko GPT ohrani pretekle pozive v pomnilniku, zagotavlja najboljšo enostavnost uporabe.
Želite avtomatizirati svoje ročne procese AP? Rezervirajte 30-minutno predstavitev v živo in si oglejte, kako lahko Nanonets vaši ekipi pomaga pri implementaciji od konca do konca AP avtomatizacija.
Zakaj izbrati Nanonets + Chat GPT za obdelavo računov?
- GPT lahko analizira besedilo na računih ter natančno prepozna in izloči ustrezne subjekte, tudi če so napisani v različnih oblikah ali imajo razlike v črkovanju ali besedilu. To lahko pomaga zmanjšati napake in povečati natančnost
- Avtomatizirajte in povečati podatkovni cevovod za podjetja
- Najučinkovitejši način za obdelavo velikih količin računov. Znatno skrajša čas, potreben za vnos in obdelavo podatkov.
- Orodja nudijo fleksibilnost in prilagodljivost. Ta orodja so lahko enostavno integriran v obstoječe sisteme in jih je mogoče prilagoditi posebnim poslovnim potrebam
- Ena od prednosti Nanonetsove rešitve OCR za račune je njena zmožnost učiti se iz svojih napak. Sistem uporablja strojno učenje za izboljšanje svoje natančnosti v daljšem časovnem obdobju, zaradi česar je bolj natančen z vsakim novim obdelanim računom. Platforma prav tako omogoča uporabnikom, da ročno pregledajo in popravijo morebitne napake, kar zagotavlja, da so izvlečeni podatki točni in zanesljivi.
Čeprav ima ta metoda veliko prednosti, moramo razumeti tudi omejitve. Natančnost je slaba v primerih, ko je kakovost slike/PDF nizka. Orodja, ki temeljijo na Al, so prav tako podvržena pristranskosti ali napakam, ki so del podatkov o usposabljanju.
Na splošno lahko uporaba GPT za ekstrakcijo entitet pri obdelavi računov pomaga podjetjem racionalizirati svoje poslovanje, zmanjšati ročno delo in izboljšati natančnost, kar vodi k boljšemu finančnemu upravljanju in sprejemanju odločitev.
Nastavite delovne poteke AP brez dotika in poenostavite postopek obračunavanja obveznosti v nekaj sekundah. Rezervirajte 30-minutno predstavitev v živo zdaj.
- Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
- EVM Finance. Poenoten vmesnik za decentralizirane finance. Dostopite tukaj.
- Quantum Media Group. IR/PR ojačan. Dostopite tukaj.
- PlatoAiStream. Podatkovna inteligenca Web3. Razširjeno znanje. Dostopite tukaj.
- vir: https://nanonets.com/blog/improving-invoice-processing-accuracy-nanonets-chat-gpt-4/
- :ima
- : je
- :ne
- :kje
- $GOR
- 1
- 10
- 13
- 5000
- 7
- 72
- a
- sposobnost
- O meni
- dostop
- Račun
- računi
- obveznosti do dobaviteljev
- natančnost
- natančna
- natančno
- čez
- dodajte
- Naslov
- Prednosti
- prihod
- AI
- algoritmi
- vsi
- omogoča
- skupaj
- Prav tako
- znesek
- zneski
- an
- analizirati
- in
- odgovori
- kaj
- API
- aplikacije
- SE
- umetni
- Umetna inteligenca
- Umetna inteligenca (AI)
- AS
- At
- preverjanje pristnosti
- odobri
- avtomatizirati
- Avtomatizirano
- Avenue
- povprečno
- izogniti
- Ravnovesje
- temeljijo
- BE
- bilo
- počutje
- spodaj
- BEST
- Boljše
- pristranskosti
- zaračunavanje
- Blog
- Knjiga
- škatle
- poslovni
- podjetja
- KUPEC..
- by
- CAN
- primeru
- spremenite
- Spremembe
- značaja
- prepoznavanje znakov
- znaki
- ChatGPT
- preveriti
- Chennai
- izbira
- Izberite
- jasno
- klik
- Koda
- Kava
- zbiranje
- Stolpci
- COM
- primerjate
- Končana
- dokončanje
- konzervativni
- dosledno
- kontakt
- nadzor
- Priročen
- pretvorbo
- popravi
- popravljen
- Popravki
- Ustrezno
- bi
- ustvarjajo
- Creative
- ustvarjalnost
- Pokal
- kurirano
- po meri
- stranka
- podatki o strankah
- Stranke, ki so
- customization
- meri
- datum
- vnos podatkov
- Datum
- Termini
- dan
- deliti
- Odločanje
- globoko
- globoko učenje
- opredeljen
- definiranje
- Stopnja
- demo
- želeno
- Podrobnosti
- razvili
- drugačen
- digitalizacijo
- števk
- Dokumenti
- ne
- opravljeno
- prenesi
- 2
- vsak
- prej
- enostavnost
- Enostavnost uporabe
- enostavno
- učinkovitosti
- učinkovite
- E-naslov
- konec koncev
- okrepljeno
- Izboljša
- zagotoviti
- Celotna
- subjekti
- entiteta
- Vpis
- napake
- Tudi
- Tudi vsak
- vsak dan
- Primer
- Excel
- obstoječih
- izkušnje
- izraz
- izrazi
- ekstrakt
- seznanjeni
- družina
- FAST
- Nekaj
- Polje
- Področja
- file
- datoteke
- filter
- finančna
- finančnih podatkov
- Najdi
- prva
- fit
- označeno
- prilagodljivost
- sledi
- za
- format
- Obrazci
- brezplačno
- iz
- funkcija
- funkcije
- Oprema
- ustvarjajo
- ustvarila
- ustvarjajo
- generativno
- dobili
- gif
- Daj
- dana
- zgrabi
- Skupine
- Pridelovanje
- Imajo
- ob
- pomoč
- Pomaga
- tukaj
- Kako
- HTTPS
- i
- Bom
- ID
- identificirati
- identificirati
- if
- slika
- slike
- slika
- izvajati
- uvoz
- izboljšanje
- izboljšalo
- izboljšanju
- in
- Vključno
- Povečajte
- india
- individualna
- Podatki
- inherentno
- začetna
- Intelligence
- v
- račun okr
- obdelava računov
- Vprašanja
- IT
- Izdelkov
- ITS
- samo
- Imejte
- Ključne
- Vedite
- jezik
- velika
- Zadnja
- vodi
- Interesenti
- UČITE
- učenje
- vsaj
- dolžina
- Lets
- vzvod
- omejitve
- v živo
- LLM
- prijavi
- Sklop
- nizka
- stroj
- strojno učenje
- je
- Znamka
- Izdelava
- upravljanje
- Navodilo
- ročno delo
- ročno
- ogromen
- Stave
- največja
- Maj ..
- ukrepe
- Spomin
- Metoda
- morda
- mladoletnika
- Minute
- manjka
- napake
- Model
- modeli
- spremenite
- več
- Najbolj
- več
- množenje
- Imena
- naravna
- Obdelava Natural Language
- Nimate
- potrebna
- potrebe
- Novo
- Naslednja
- št
- zdaj
- Številka
- številke
- pridobi
- pridobitev
- OCR
- Rešitev OCR
- orodje ocr
- of
- Ponudbe
- on
- enkrat
- ONE
- samo
- odprite
- OpenAI
- operacije
- optično prepoznavanje znakov
- Možnost
- možnosti
- or
- Da
- naročila
- Ostalo
- naši
- izhod
- več
- paket
- par
- parameter
- parametri
- zlasti
- mimo
- Podaje
- preteklosti
- Vzorec
- Izvedite
- opravljeno
- oseba
- plinovod
- platforma
- platon
- Platonova podatkovna inteligenca
- PlatoData
- slaba
- moč
- močan
- natančna
- Predvidljivo
- Cena
- Cene
- Postopek
- Predelano
- Procesi
- obravnavati
- proizvaja
- zagotavljajo
- če
- zagotavlja
- Python
- kakovost
- Količina
- poizvedbe
- hitro
- naključnost
- prejeti
- Priznanje
- zmanjša
- zmanjšuje
- nanaša
- redni
- pomembno
- zanesljiv
- zahteva
- viri
- Odgovor
- povzroči
- Rezultati
- ohranijo
- pregleda
- Pravica
- s
- Je dejal
- Lestvica
- Iskalnik
- sekund
- skrivnost
- varnost
- Varnostni ukrepi
- glej
- videl
- Prodajalci
- ločena
- Strežniki
- nastavite
- Dostava
- Trgovina
- pokazale
- podpisati
- pomemben
- bistveno
- Podoben
- preprosto
- saj
- situacije
- Rešitev
- nekaj
- specifična
- hitrost
- stojala
- Začetek
- Korak
- Koraki
- trgovina
- shranjeni
- racionalizirati
- racionaliziran
- strukturirano
- predmet
- taka
- podpora
- sistem
- sistemi
- Bodite
- Naloge
- skupina
- tehnike
- kot
- da
- O
- informacije
- njihove
- POTEM
- Tukaj.
- te
- jih
- ta
- tisoče
- skozi
- čas
- zamudno
- do
- Boni
- tudi
- orodje
- orodja
- vrh
- Skupaj za plačilo
- brez dotika
- tradicionalno
- usposabljanje
- transformator
- dva
- razumeli
- edinstven
- odklepanje
- naložili
- us
- uporaba
- Rabljeni
- uporabnik
- Uporabniška izkušnja
- Uporabniku prijazen
- Uporabniki
- uporablja
- uporabo
- POTRDI
- potrjevanje
- vrednost
- Vrednote
- preverjanje
- zelo
- prostornine
- želeli
- je
- način..
- we
- teden
- Kaj
- kdaj
- ki
- medtem
- bo
- z
- besedilo
- delo
- delovnih tokov
- deluje
- bi
- pisati
- pisni
- Vi
- Vaša rutina za
- zefirnet