Nem túlzok, ha azt mondanám, hogy egy átlagember hetente legalább 10 számlát küld/kap. A növekvő digitalizációval a vállalkozások nap mint nap hatalmas mennyiségű számlával szembesülnek. Hagyományosan a számlafeldolgozás kézi és időigényes folyamat volt, amely jelentős erőforrásokat igényel, és hajlamos a hibákra.
Az AI és a Natural Language Processing megjelenésével a számlafeldolgozás automatizálható és egyszerűsíthető, ami jobb hatékonyságot és pontosságot eredményez. A GPT a „Generative Pre-train Transformer” rövidítése, és az általa kifejlesztett hatékony nyelvfeldolgozási modellek családjára utal. OpenAI. A GPT-modellek nagy mennyiségű szöveges adatra vannak előtanulva, majd finomhangolhatók bizonyos feladatokhoz, beleértve a számlafeldolgozást is.
Vegyük egy könyvesbolt rendeléseinek számlafeldolgozásának esetét, egy számlaminta az alábbi képen látható. Ez a számla tartalmazza a szállítással, számlázással, tételekkel és árakkal kapcsolatos információkat. Képzelje el, hogy manuálisan kell adatokat gyűjtenie több ezer számláról! Szerencsére vannak mesterséges intelligencia eszközeink, amelyek felgyorsítják a folyamatot.
Ebben a blogban végigvezetem a számla GPT-4 és Nanonets használatával történő feldolgozásának lépésein. Igyál egy csésze kávét és készülj fel!
1. lépés: Hozzon létre egy Nanonets-fiókot, és töltse fel a képet
Első lépésként kinyerjük a szöveges adatokat a számlánk képéből. Az OCR (Optical Character Recognition) technikák mintafelismerő algoritmusokat használnak a karakterek azonosítására és szöveggé alakítására a képeken vagy a beolvasott dokumentumokon. A felhőalapú mesterséges intelligencia (AI) platform, a Nanonets kurált OCR-eszközöket kínál bizonyos feladatokhoz, beleértve a számla OCR-t is. Egyszerűen regisztrálhat itt és ingyenesen hozzáférhet a Számla OCR eszközéhez.
Miután bejelentkezett, és rákattint a Számla OCR-re, megtalálja a „Fájlok feltöltése” lehetőséget. A Nanonets nagyon felhasználóbarát, és lehetővé teszi a fájlok feltöltését több mint 6 alkalmazásból.
Ide töltöttem fel az Agatha Könyvesbolt számlamintáját. A kivonás néhány percen belül befejeződik, és a képen látható módon megkapja a kiselejtezett eredményeket. Itt egy előre betanított mély tanulási modellt használnak az entitások és azok értékeinek kinyerésére.
A Nanonets által azonosított összes szövegmezőt külön dobozok határolják. Az ezekhez a mezőkhöz kinyert értékek a jobb oldali "VÉGSŐ EREDMÉNYEK" fülön láthatók. Ez a Nanonets által végzett entitáskivonás javítható a GPT-4 használatával. A Nanonets lehetőséget biztosít a mezőnevek hozzáadására vagy módosítására is, ami javítja az ügyfelek testreszabását és felhasználói élményét.
Automatizálni szeretné manuális AP-folyamatait? Foglaljon le egy 30 perces élő bemutatót, hogy megtudja, hogyan segíthet a Nanonets csapatának a végpontok közötti megvalósításban AP automatizálás.
2. lépés: Töltse le az OCR szöveges adatokat
A kivont OCR szöveges adatok többféle formában letölthetők. Tekintse meg az alábbi GIF-et, hogy megtekinthesse a számlaadatok Excel- vagy CSV-fájlba történő letöltését. A CSV-fájlban az összes entitás/adatmező neve oszlopként van tárolva, értékeik pedig a megfelelő sorokban találhatók.
Kimásoljuk és beillesztjük az adatokat a letöltött CSV-ből, és megkapjuk az OCR által generált szöveget. Íme a szöveg, amelyet letöltöttem a Nanonets számlánkról.
Az OCR által generált szöveg a Chat GPT3 használatával javítható a következő lépésekkel.
Az entitás kinyerése felskálázható a különböző lekérdezések támogatására, ha GPT4 modelleket használunk a Nanonets feldolgozott szövegen felül. Open AI fiókot regisztrálhat a következő címen: itt és hozzáférhet a nagy nyelvi modellekhez. Miután beállította fiókját, egyedi API-kulcsot kap. Biztonsági intézkedésekre, az OpenAI szervereihez intézett kérések hitelesítésére és engedélyezésére szolgál. Importálja az OpenAI-csomagot, és állítsa be az API-kulcs értékét.
A prompt világos, strukturált tervezése a titka a nagy nyelvi modellek erejének felszabadításának. Az adatmező vagy entitások és azok értékeinek kinyeréséhez használhatjuk az alábbi promptot.
#definiálja a felszólítást
prompt_text= Ez a könyvesbolti rendelésekhez tartozó számlák OCR által generált szövege" +ocr_generated_text" + "Entitások és értékük kulcs-érték párként kinyerése a megadott OCR-szövegből és kimenete kulcs: érték formátumban"
Miután megkapta a kérést, átadhatja azt az OpenAI bármely előre betanított modelljének, és választ kaphat a „ openai.Completion.create()” függvény. Néhány paraméter közül választhat a legjobb teljesítmény elérése érdekében.
A GPT paraméterei:
- motor: Ezzel a paraméterrel kiválaszthat egy előre betanított nagy nyelvi modellt (LLM) a szöveg létrehozásához. Beállítható előre betanított modellre vagy egyedi finomhangolt modellre. A Davinci szöveg erőteljes és hatékony választás.
- prompt: Ez az első szöveges prompt, amelyet a modellnek kell megadni a szöveg generálásának megkezdéséhez. Esetünkben a korábban definiált „prompt_text” változó.
- Max_tokens: A modell által egy adott prompthoz generálható tokenek maximális számát jelöli. Ezen keresztül szabályozhatja a generált szöveg hosszát.
- Hőmérséklet: Használja a generált szöveg véletlenszerűségének vagy kreativitásának szabályozására. Az alacsony hőmérsékletű érték konzervatívabb és kiszámíthatóbb teljesítményt eredményez, míg a magas hőmérsékleti érték kreatívabb és változatosabb teljesítményt eredményez. A hőmérséklet értéke 0 és 1 között van, ahol az 1 a legkreatívabb.
Most, hogy ismeri a GPT-paramétereket, írjuk meg a kódot a kimenet létrehozásához a prompt szöveg más paraméterekkel együtt történő átadásával.
A kimenetet így kaptuk:
Az entitások és azok értékei gyorsan, néhány lépésben kinyerhetők!
4. lépés: Az adatjavítások javítása
Bármely üzletben forgalomban lévő több ezer számla között elkerülhetetlenek a következetlenségek és kisebb hibák az ügyféladatokban. Például előfordulhat, hogy egyes ügyfelek érvénytelen e-mail-formátumot vagy telefonszámot adtak meg, vagy a dátum eltérő formátumban szerepelhet. A nanonetekkel és a GPT-4-gyel könnyedén azonosíthatja ezeket a problémákat, és elvégezheti az adatjavításokat. Megvalósíthatjuk a szabályalapú érvényesítéseket a helyesség és a formátum ellenőrzésére, valamint az inkonzisztenciák ellenőrzésére.
Felszólítom a GPT-t, hogy végezze el a dátum és az e-mail érvényesítését számunkra.
prompt_text= "A fent kivont entitásadatokban ellenőrizze, hogy a dátum (NN/MM/YYYY) és az e-mail formátum helyes-e?"
Az LLM Python-kódot biztosít reguláris kifejezések használatával a formátum ellenőrzéséhez, amint az az alábbi képen látható. A reguláris kifejezésben megkeresünk egy adott mintát, és egyeztetünk vele. A kivont entitások egy szótárban vannak tárolva, és a függvények külön vannak meghatározva a számla e-mail címének és dátumának ellenőrzéséhez.
A definiálás után ezeknek a függvényeknek tetszőleges dátumot, például ('Számla dátuma'), eladó vagy vevő e-mail azonosítót átadhatunk az eredmény eléréséhez.
A GPT abban is segít, hogy gyorsan és kényelmesen javítsa és módosítsa az adatokat. Felhívjuk figyelmét, hogy számlánkon a dátum: '02.'. Az alábbi promptot adom a dátum „HH/NN/ÉÉ” formátumra konvertálásához.
prompt=” módosítsa a kivont entitásokban lévő adatok formátumát „HH/NN/ÉÉ”-re. Csak az év utolsó 2 számjegye maradjon meg”
A kimenetben az adatok tetszőlegesen javítva lettek. Hasonló promptokat adhatunk annak ellenőrzésére, hogy a telefonszám 10 számjegyű-e, a cím a kívánt formátumban van-e, illetve a hiányzó adatértékek ellenőrzésére is.
Érintésmentes hozzáférési pont munkafolyamatok beállítása és egyszerűsítse a szállítói kötelezettségek folyamatát másodpercek alatt. Foglaljon most egy 30 perces élő bemutatót.
5. lépés: Ellenőrizze az adatokkal kapcsolatos problémákat
Az adatok bármilyen inkoherenciája könnyen azonosítható a GPT-4 segítségével. Példánkban ellenőrizheti, hogy a teljes esedékes összeg nem egyezik-e az egyes tételek árának összegével. Adjunk rá felszólítást.
prompt=” Ellenőrizze, hogy a számlán szereplő teljes esedékes egyenleg megegyezik-e a számlán szereplő mennyiséggel és cikkárral”
A GPT-4 egy függvényt ad ki a Pythonban, amely kiszámítja az összes rendelés árának összegzését a mennyiség és az egyes cikkek árának megszorzásával. Abban az esetben, ha a végösszeg nem egyezik a számlán szereplő összeggel, az adott számla megjelölésre kerül és kivizsgálásra kerül. Ez segíthet a vállalkozásoknak abban, hogy elkerüljék a hibákat, az eltéréseket, és hitelesítsék pénzügyi adataikat.
Ha nagy számlaadatkészlettel rendelkezik, akkor több számla konzisztenciáját is ellenőrizheti. Például összehasonlíthatja az eladó és a vevő adatait több számlán, hogy azonosítsa az eltéréseket vagy anomáliákat.
6. lépés: Lekérdezés GPT-vel
Az entitások kinyerése után a GPT felhasználható arra, hogy adott lekérdezésekre is választ kapjon a teljes információból. Például mi a teendő, ha egy adott számla szállítási adataira vonatkozó információkat szeretne megtudni.
Tegyünk rá felszólítást:
#definiálja a felszólítást
prompt_text= "A szállítás részleteinek kinyerése az entitás kulcs-érték párokból"
Az ehhez a prompthoz generált befejezés a következő volt:
>> Persze! A megadott OCR-adatok alapján a szállítási és számlázási információkat két csoportba bonthatjuk az alábbiak szerint:
Szállítási információk:
"számla_száma": "3522"
ship_to_name: Gayathri Natarajan
ship_to_address: 600053 No.22B , Chetpet , Chennai , Tamil Nadu , India: Tanaya Pakahale
Hasonló lekérdezés végezhető az eladó adatainak megszerzéséhez is. Íme a megadott adatokból kinyert információk az eladókról:
- eladó_neve: AGATHA KÖNYVHÁZ
- eladó_címe: No.13 , 2nd avenue , Indiranagar, Bangalore , Karnataka , India , 721302
- eladó_telefonszáma: 6783456723
Ha több dokumentummal dolgozik, akkor a tömeges rendelések elemzéséhez kereshetünk és szűrhetünk a 5000 Rs.-nál nagyobb esedékes számlák között. Mivel a GPT képes megőrizni a múltbeli felszólításokat a memóriában, ez biztosítja a legjobb használatot.
Automatizálni szeretné manuális AP-folyamatait? Foglaljon le egy 30 perces élő bemutatót, hogy megtudja, hogyan segíthet a Nanonets csapatának a végpontok közötti megvalósításban AP automatizálás.
Miért válassza a Nanonets + Chat GPT-t a számlafeldolgozáshoz?
- A GPT képes elemezni a számlákon lévő szöveget, és pontosan azonosítani és kivonatolni a releváns entitásokat, még akkor is, ha azok eltérő formátumban vannak megírva, vagy eltér a helyesírásuk vagy szövegezésük. Ez csökkentheti a hibákat és növelheti a pontosságot
- automatizálják és bővíteni kell az adatfolyamot a vállalkozások számára
- A leghatékonyabb módszer nagy mennyiségű számla feldolgozására. Jelentősen csökkenti az adatbevitelhez és -feldolgozáshoz szükséges időt.
- Az eszközök rugalmasságot és alkalmazkodóképességet kínálnak. Ezek az eszközök lehetnek könnyen integrálható meglévő rendszerekbe, és testreszabható az egyedi üzleti igényekhez
- A Nanonets számlás OCR megoldásának egyik előnye, hogy képes tanul a hibáiból. A rendszer gépi tanulás segítségével javítja pontosságát az idő múlásával, így minden egyes feldolgozott számlával pontosabbá válik. A platform lehetővé teszi a felhasználók számára a hibák manuális áttekintését és kijavítását, így biztosítva, hogy a kinyert adatok pontosak és megbízhatóak legyenek.
Noha sok előnye van, meg kell értenünk ennek a módszernek a korlátait is. A pontosság gyenge olyan helyzetekben, amikor a kép/PDF minősége alacsony. Az Al-alapú eszközök is ki vannak téve a betanítási adatokban rejlő torzításoknak vagy hibáknak.
Összességében a GPT kihasználása az entitások kivonására a számlafeldolgozásban segítheti a vállalkozásokat működésük egyszerűsítésében, a kézi munka csökkentésében és a pontosság javításában, ami jobb pénzügyi irányítást és döntéshozatalt eredményezhet.
Érintésmentes hozzáférési pont munkafolyamatok beállítása és egyszerűsítse a szállítói kötelezettségek folyamatát másodpercek alatt. Foglaljon most egy 30 perces élő bemutatót.
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- EVM Finance. Egységes felület a decentralizált pénzügyekhez. Hozzáférés itt.
- Quantum Media Group. IR/PR erősített. Hozzáférés itt.
- PlatoAiStream. Web3 adatintelligencia. Felerősített tudás. Hozzáférés itt.
- Forrás: https://nanonets.com/blog/improving-invoice-processing-accuracy-nanonets-chat-gpt-4/
- :van
- :is
- :nem
- :ahol
- $ UP
- 1
- 10
- 13
- 5000
- 7
- 72
- a
- képesség
- Rólunk
- hozzáférés
- Fiók
- Fiókok
- fizetendő számlák
- pontosság
- pontos
- pontosan
- át
- hozzá
- cím
- előnyei
- megérkezés
- AI
- algoritmusok
- Minden termék
- lehetővé teszi, hogy
- mentén
- Is
- összeg
- Összegek
- an
- elemez
- és a
- válaszok
- bármilyen
- api
- alkalmazások
- VANNAK
- mesterséges
- mesterséges intelligencia
- Mesterséges intelligencia (AI)
- AS
- At
- hitelesíteni
- engedélyez
- automatizált
- Automatizált
- Sugárút
- átlagos
- elkerülése érdekében
- Egyenleg
- alapján
- BE
- óta
- hogy
- lent
- BEST
- Jobb
- torzítások
- számlázás
- Blog
- könyv
- dobozok
- üzleti
- vállalkozások
- VEVŐ..
- by
- TUD
- eset
- változik
- Változások
- karakter
- karakter felismerés
- karakter
- ChatGPT
- ellenőrizze
- Chennai
- választás
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a
- világos
- kettyenés
- kód
- Kávé
- gyűjt
- Oszlopok
- COM
- összehasonlítani
- Befejezett
- befejezés
- konzervatív
- következetes
- kapcsolat
- ellenőrzés
- Kényelmes
- megtérít
- kijavítására
- korrigált
- Hiba
- Megfelelő
- tudott
- teremt
- Kreatív
- kreativitás
- Csésze
- a válogatott
- szokás
- vevő
- ügyféladatok
- Ügyfelek
- testreszabás
- szabott
- dátum
- adatbevitel
- találka
- Időpontok
- nap
- foglalkozó
- Döntéshozatal
- mély
- mély tanulás
- meghatározott
- meghatározó
- Fok
- demó
- kívánatos
- részletek
- fejlett
- különböző
- digitalizálás
- számjegy
- dokumentumok
- nem
- csinált
- letöltés
- két
- minden
- Korábban
- könnyű
- egyszerű használat
- könnyen
- hatékonyság
- hatékony
- végtől végig
- fokozott
- Javítja
- biztosítása
- Egész
- Szervezetek
- egység
- belépés
- hibák
- Még
- Minden
- minden nap
- példa
- Excel
- létező
- tapasztalat
- kifejezés
- kifejezések
- kivonat
- ismerős
- család
- GYORS
- kevés
- mező
- Fields
- filé
- Fájlok
- szűrő
- pénzügyi
- pénzügyi adat
- Találjon
- vezetéknév
- megfelelő
- megjelölve
- Rugalmasság
- következik
- A
- formátum
- formák
- Ingyenes
- ból ből
- funkció
- funkciók
- Fogaskerék
- generál
- generált
- generáló
- nemző
- kap
- gif
- Ad
- adott
- megragad
- Csoportok
- Növekvő
- Legyen
- tekintettel
- segít
- segít
- itt
- Hogyan
- HTTPS
- i
- BETEG
- ID
- azonosított
- azonosítani
- if
- kép
- képek
- kép
- végre
- importál
- javul
- javított
- javuló
- in
- Beleértve
- Növelje
- India
- egyéni
- információ
- velejáró
- kezdetben
- Intelligencia
- bele
- számla okr
- számlafeldolgozás
- kérdések
- IT
- tételek
- ITS
- éppen
- Tart
- Kulcs
- Ismer
- nyelv
- nagy
- keresztnév
- vezető
- vezetékek
- TANUL
- tanulás
- legkevésbé
- Hossz
- Lets
- erőfölény
- korlátozások
- él
- LLM
- log
- Sok
- Elő/Utó
- gép
- gépi tanulás
- készült
- csinál
- Gyártás
- vezetés
- kézikönyv
- kézi munka
- kézzel
- tömeges
- Mérkőzés
- maximális
- Lehet..
- intézkedések
- Memory design
- módszer
- esetleg
- kisebb
- Perc
- hiányzó
- hibákat
- modell
- modellek
- módosítása
- több
- a legtöbb
- többszörös
- szaporodását
- nevek
- Természetes
- Természetes nyelvi feldolgozás
- Szükség
- szükséges
- igények
- Új
- következő
- nem
- Most
- szám
- számok
- szerez
- megszerzése
- OCR
- OCR megoldás
- ocr eszköz
- of
- Ajánlatok
- on
- egyszer
- ONE
- csak
- nyitva
- OpenAI
- Művelet
- optikai karakter felismerés
- opció
- Opciók
- or
- érdekében
- rendelés
- Más
- mi
- teljesítmény
- felett
- csomag
- pár
- paraméter
- paraméterek
- különös
- elhalad
- Múló
- múlt
- Mintás
- Teljesít
- teljesített
- person
- csővezeték
- emelvény
- Plató
- Platón adatintelligencia
- PlatoData
- szegény
- hatalom
- erős
- pontos
- Kiszámítható
- ár
- Áraink
- folyamat
- Feldolgozott
- Folyamatok
- feldolgozás
- termel
- ad
- feltéve,
- biztosít
- Piton
- világítás
- mennyiség
- lekérdezések
- gyorsan
- véletlenszerűség
- kap
- elismerés
- csökkenteni
- csökkenti
- kifejezés
- szabályos
- megbízható
- kéri
- Tudástár
- válasz
- eredményez
- Eredmények
- megtartása
- Kritika
- jobb
- s
- Mondott
- Skála
- Keresés
- másodperc
- Titkos
- biztonság
- Biztonsági intézkedések
- lát
- látott
- Sellers
- különálló
- Szerverek
- készlet
- Szállítás
- Webshop
- mutatott
- <p></p>
- jelentős
- jelentősen
- hasonló
- egyszerűen
- óta
- helyzetek
- megoldások
- néhány
- különleges
- sebesség
- állványok
- kezdet
- Lépés
- Lépései
- tárolni
- memorizált
- áramvonal
- áramvonalas
- szerkesztett
- tárgy
- ilyen
- támogatás
- rendszer
- Systems
- Vesz
- feladatok
- csapat
- technikák
- mint
- hogy
- A
- az információ
- azok
- akkor
- Ott.
- Ezek
- ők
- ezt
- ezer
- Keresztül
- idő
- időigényes
- nak nek
- tokenek
- is
- szerszám
- szerszámok
- felső
- Végösszeg
- érintés nélküli
- hagyományosan
- Képzések
- transzformátor
- kettő
- megért
- egyedi
- kinyitó
- feltöltve
- us
- használ
- használt
- használó
- User Experience
- barátságos felhasználói
- Felhasználók
- használ
- segítségével
- ÉRVÉNYESÍT
- érvényesítés
- érték
- Értékek
- ellenőrzése
- nagyon
- kötetek
- akar
- volt
- Út..
- we
- hét
- Mit
- amikor
- ami
- míg
- lesz
- val vel
- megfogalmazás
- Munka
- munkafolyamatok
- dolgozó
- lenne
- ír
- írott
- te
- A te
- zephyrnet