Ich würde nicht übertreiben, wenn ich sagen würde, dass eine durchschnittliche Person mindestens 10 Rechnungen pro Woche sendet/empfängt. Durch die zunehmende Digitalisierung müssen Unternehmen täglich riesige Rechnungsmengen bewältigen. Traditionell war die Rechnungsbearbeitung ein manueller und zeitaufwändiger Prozess, der erhebliche Ressourcen erforderte und fehleranfällig war.
Mit dem Aufkommen von KI und natürlicher Sprachverarbeitung kann die Rechnungsverarbeitung nun automatisiert und rationalisiert werden, was zu einer verbesserten Effizienz und Genauigkeit führt. GPT steht für „Generative Pre-trained Transformer“ und bezieht sich auf eine Familie leistungsstarker Sprachverarbeitungsmodelle, die von entwickelt wurden OpenAI. Die GPT-Modelle werden anhand großer Textdatenmengen vorab trainiert und können dann für bestimmte Aufgaben, einschließlich der Rechnungsverarbeitung, fein abgestimmt werden.
Nehmen wir den Fall der Rechnungsverarbeitung für die Bestellungen eines Buchladens. Eine Beispielrechnung ist im Bild unten dargestellt. Diese Rechnung enthält Informationen zu Versand, Rechnung, Artikeln und Preisen. Stellen Sie sich vor, Sie müssten manuell Daten aus Tausenden von Rechnungen sammeln! Glücklicherweise verfügen wir über KI-Tools, die den Prozess beschleunigen.
In diesem Blog führe ich Sie durch die Schritte zur Verarbeitung Ihrer Rechnung mit GPT-4 und Nanonets. Schnappen Sie sich eine Tasse Kaffee und machen Sie sich bereit!
Schritt 1: Erstellen Sie ein Nanonets-Konto und laden Sie das Bild hoch
Der erste Schritt besteht darin, die Textdaten aus dem Bild unserer Rechnung zu extrahieren. OCR-Techniken (Optical Character Recognition) nutzen Mustererkennungsalgorithmen, um Zeichen auf Bildern oder gescannten Dokumenten zu identifizieren und in Text umzuwandeln. Die cloudbasierte Plattform für künstliche Intelligenz (KI) Nanonets bietet kuratierte OCR-Tools für bestimmte Aufgaben, einschließlich Rechnungs-OCR. Sie können sich einfach anmelden hier und greifen Sie kostenlos auf ihr Rechnungs-OCR-Tool zu.
Sobald Sie sich angemeldet und auf Rechnungs-OCR geklickt haben, finden Sie die Option „Dateien hochladen“. Nanonets ist sehr benutzerfreundlich und ermöglicht das Hochladen von Dateien aus über 6 Apps.
Ich habe die Beispielrechnung vom Agatha Book Store hier hochgeladen. Die Extraktion wäre in wenigen Minuten abgeschlossen und Sie würden die verworfenen Ergebnisse wie gezeigt erhalten. Hier wird ein vorab trainiertes Deep-Learning-Modell zum Extrahieren der Entitäten und ihrer Werte verwendet.
Alle durch Nanonets identifizierten Textfelder sind durch separate Kästchen begrenzt. Die für diese Felder extrahierten Werte sind auf der Registerkarte „ENDGÜLTIGE ERGEBNISSE“ rechts zu sehen. Diese von Nanonets durchgeführte Entitätsextraktion kann durch die Verwendung von GPT-4 verbessert werden. Nanonets bietet außerdem Optionen zum Hinzufügen oder Ändern der Feldnamen, was die Anpassung und Benutzererfahrung für Kunden verbessert.
Möchten Sie Ihre manuellen AP-Prozesse automatisieren? Buchen Sie eine 30-minütige Live-Demo, um zu sehen, wie Nanonets Ihrem Team bei der Implementierung von End-to-End helfen kann AP-Automatisierung.
Schritt 2: Laden Sie OCR-Textdaten herunter
Die extrahierten OCR-Textdaten können in verschiedenen Formen heruntergeladen werden. Sehen Sie sich das folgende GIF an, um die Demonstration des Herunterladens der Rechnungsdaten in eine Excel- oder CSV-Datei zu sehen. In der CSV-Datei werden alle Entitäts-/Datenfeldnamen als Spalten gespeichert und ihre Werte befinden sich in den entsprechenden Zeilen.
Wir kopieren und fügen die Daten aus der heruntergeladenen CSV-Datei ein und erhalten den OCR-generierten Text. Hier ist der Text, den ich von unserer Beispielrechnung in Nanonets heruntergeladen habe.
Der OCR-generierte Text kann mit den nächsten Schritten mithilfe von Chat GPT3 erweitert werden.
Die Entitätsextraktion kann hochskaliert werden, um verschiedene Abfragen zu unterstützen, wenn wir GPT4-Modelle zusätzlich zum von Nanonets verarbeiteten Text verwenden. Sie können sich unter für ein Open AI-Konto anmelden hier und erhalten Sie Zugriff auf die großen Sprachmodelle. Sobald Sie Ihr Konto eingerichtet haben, erhalten Sie einen eindeutigen API-Schlüssel. Es dient Sicherheitsmaßnahmen, um die an die Server von OpenAI gestellten Anfragen zu authentifizieren und zu autorisieren. Importieren Sie das OpenAI-Paket und legen Sie den API-Schlüsselwert fest.
Die klare und strukturierte Gestaltung einer Eingabeaufforderung ist das Geheimnis, um die Leistungsfähigkeit großer Sprachmodelle freizusetzen. Um Datenfelder oder Entitäten und ihre Werte zu extrahieren, können wir die folgende Eingabeaufforderung verwenden.
#definieren Sie Ihre Eingabeaufforderung
prompt_text= Dies ist der OCR-generierte Text von Rechnungen für Buchhandlungsbestellungen“ +ocr_generated_text“ + „Entitäten und ihre Werte als Schlüssel-Wert-Paar aus dem bereitgestellten OCR-Text extrahieren und im Format Schlüssel: Wert ausgeben“
Sobald Sie eine Eingabeaufforderung erhalten, können Sie diese an jedes vorab trainierte OpenAI-Modell weitergeben und über die Schaltfläche „“ eine Antwort erhalten. openai.Completion.create()“-Funktion. Es gibt einige Parameter, die Sie auswählen können, um die beste Ausgabe zu erzielen.
Parameter von GPT:
- Motor: Mit diesem Parameter können Sie ein bestimmtes vorab trainiertes großes Sprachmodell (LLM) auswählen, das zum Generieren des Texts verwendet werden soll. Es kann auf ein vorab trainiertes Modell oder ein benutzerdefiniertes, fein abgestimmtes Modell eingestellt werden. Text Davinci ist eine leistungsstarke und effiziente Wahl.
- Prompt: Dies ist die erste Textaufforderung, die dem Modell gegeben wird, um mit der Textgenerierung zu beginnen. In unserem Fall die Variable „prompt_text“, die wir zuvor definiert haben.
- Max_tokens: Gibt die maximale Anzahl von Token an, die das Modell für eine bestimmte Eingabeaufforderung generieren kann. Hierdurch können Sie die Länge des generierten Textes steuern.
- Temperatur: Verwenden Sie es, um den Grad der Zufälligkeit oder Kreativität im generierten Text zu steuern. Ein niedriger Temperaturwert führt zu einer konservativeren und vorhersehbareren Ausgabe, während ein hoher Temperaturwert zu einer kreativeren und abwechslungsreicheren Ausgabe führt. Der Temperaturwert reicht von 0 bis 1, wobei 1 der kreativste Wert ist.
Nachdem Sie nun mit den GPT-Parametern vertraut sind, schreiben wir den Code, um eine Ausgabe zu generieren, indem wir den Eingabeaufforderungstext zusammen mit anderen Parametern übergeben.
Wir haben die Ausgabe erhalten als:
Die Entitäten und ihre Werte wurden in nur wenigen Schritten schnell extrahiert!
Schritt 4: Verbesserung der Datenkorrekturen
Unter den Tausenden von Rechnungen, die in jedem Unternehmen im Umlauf sind, sind Inkonsistenzen und kleinere Fehler in den Kundendaten unvermeidlich. Beispielsweise könnten einige Kunden ein ungültiges E-Mail-Format oder ungültige Kontaktnummern angegeben haben oder das Datum könnte in einem anderen Format vorliegen. Mit Nanonets und GPT-4 können Sie diese Probleme leicht identifizieren und Datenkorrekturen durchführen. Wir können regelbasierte Validierungen implementieren, um die Richtigkeit und das Format zu überprüfen und auch auf Inkonsistenzen zu prüfen.
Ich fordere GPT auf, das Datum und die E-Mail-Adresse für uns zu validieren.
prompt_text= „Überprüfen Sie in den oben extrahierten Entitätsdaten, ob das Datumsformat (TT/MM/JJJJ) und die E-Mail-Adresse korrekt sind?“
Das LLM stellt einen Python-Code bereit, der reguläre Ausdrücke verwendet, um das Format zu überprüfen, wie im folgenden Bild gezeigt. In einem regulären Ausdruck suchen wir nach einem bestimmten Muster und gleichen es ab. Die extrahierten Entitäten werden in einem Wörterbuch gespeichert und Funktionen werden separat definiert, um die E-Mail-Adresse und die Rechnungsdaten zu validieren.
Nach der Definition kann man diesen Funktionen ein beliebiges Datum wie („Rechnungsdatum“) oder die E-Mail-ID des Verkäufers oder Käufers übergeben, um das Ergebnis zu erhalten.
GPT hilft Ihnen außerdem dabei, schnell und bequem Korrekturen und Änderungen an den Daten vorzunehmen. Beachten Sie, dass in unserer Rechnung das Datum „02“ steht. Ich gebe die folgende Aufforderung, das Datum in das Format „MM/TT/JJ“ zu konvertieren.
prompt=“ ändert das Format der Daten in extrahierten Entitäten in „MM/TT/JJ“. Behalten Sie nur die letzten beiden Ziffern des Jahres bei.
In der Ausgabe wurden die Daten wie gewünscht korrigiert. Wir können ähnliche Eingabeaufforderungen geben, um zu überprüfen, ob die Kontaktnummer 10 Ziffern hat, ob die Adresse im gewünschten Format vorliegt und auch nach fehlenden Datenwerten sucht.
Richten Sie berührungslose AP-Workflows ein und den Prozess der Kreditorenbuchhaltung optimieren in Sekunden. Buchen Sie jetzt eine 30-minütige Live-Demo.
Schritt 5: Suchen Sie nach Datenproblemen
Eventuelle Inkohärenzen in den Daten können mit GPT-4 leicht identifiziert werden. In unserem Beispiel können Sie prüfen, ob der fällige Gesamtbetrag nicht mit der Summe der einzelnen Artikelpreise übereinstimmt. Lassen Sie uns eine Aufforderung dazu geben.
prompt=“Überprüfen Sie, ob der in der Rechnung fällige Gesamtsaldo mit der Menge und den Artikelpreisen in der Rechnung übereinstimmt.“
GPT-4 gibt eine Funktion in Python aus, die die Summe der Preise aller Bestellungen berechnet, indem sie die Menge und den Einzelartikelpreis multipliziert. Falls der Gesamtsaldo nicht mit dem auf der Rechnung angegebenen Betrag übereinstimmt, wird die jeweilige Rechnung markiert und untersucht. Dies könnte Unternehmen dabei helfen, Fehler und Unstimmigkeiten zu vermeiden und ihre Finanzdaten zu validieren.
Wenn Sie über einen großen Rechnungsdatensatz verfügen, können Sie auch die Konsistenz mehrerer Rechnungen prüfen. Sie können beispielsweise die Verkäufer- und Käuferinformationen mehrerer Rechnungen vergleichen, um etwaige Unstimmigkeiten oder Anomalien zu erkennen.
Schritt 6: Abfrage mit GPT
Sobald Sie die Entitäten extrahiert haben, kann GPT verwendet werden, um aus den gesamten Informationen auch Antworten auf bestimmte Fragen zu erhalten. Was ist beispielsweise, wenn Sie Informationen zu den Versanddetails einer bestimmten Rechnungsnummer wissen möchten?
Lassen Sie uns eine Eingabeaufforderung dafür erstellen:
#definieren Sie Ihre Eingabeaufforderung
prompt_text= „Extrahieren Sie die Details zum Versand aus den Entity-Schlüssel-Wert-Paaren“
Die für diese Eingabeaufforderung generierte Vervollständigung lautete:
>> Klar! Basierend auf den bereitgestellten OCR-Daten können wir die Versandinformationen und Rechnungsinformationen wie folgt in zwei Gruppen extrahieren:
Versandinformationen:
„Rechnungsnummer“: „3522“
Name des Empfängers: Gayathri Natarajan
Versandadresse: 600053 No.22B, Chetpet, Chennai, Tamil Nadu, Indien: Tanaya Pakahale
Eine ähnliche Abfrage kann auch zum Abrufen von Verkäuferdetails durchgeführt werden. Hier sind die extrahierten Informationen über Verkäufer aus den bereitgestellten Daten:
- Verkäufername: AGATHA BOOK HOUSE
- Verkäuferadresse: No.13, 2nd Avenue, Indiranagar, Bangalore, Karnataka, Indien, 721302
- Telefonnummer des Verkäufers: 6783456723
Wenn wir mit mehreren Dokumenten arbeiten, können wir auch Rechnungen mit einem fälligen Gesamtsaldo von mehr als 5000 Rupien suchen und filtern, um die Großbestellungen zu analysieren. Da GPT frühere Eingabeaufforderungen im Speicher behalten kann, bietet es die beste Benutzerfreundlichkeit.
Möchten Sie Ihre manuellen AP-Prozesse automatisieren? Buchen Sie eine 30-minütige Live-Demo, um zu sehen, wie Nanonets Ihrem Team bei der Implementierung von End-to-End helfen kann AP-Automatisierung.
Warum sollten Sie sich für Nanonets + Chat GPT für die Rechnungsbearbeitung entscheiden?
- GPT kann den Text auf Rechnungen analysieren und relevante Entitäten genau identifizieren und extrahieren, selbst wenn diese in unterschiedlichen Formaten verfasst sind oder Abweichungen in der Schreibweise oder Formulierung aufweisen. Dies kann dazu beitragen, Fehler zu reduzieren und die Genauigkeit zu erhöhen
- Automatisieren und Skalierung der Datenpipeline für Unternehmen
- Die effizienteste Methode zur Bearbeitung großer Rechnungsmengen. Reduziert den Zeitaufwand für die Dateneingabe und -verarbeitung erheblich.
- Die Tools bieten Flexibilität und Anpassungsfähigkeit. Diese Werkzeuge können sein leicht integrierbar in bestehende Systeme integrieren und an spezifische Geschäftsanforderungen anpassen
- Einer der Vorteile der Rechnungs-OCR-Lösung von Nanonets ist ihre Fähigkeit aus seinen Fehlern lernen. Das System nutzt maschinelles Lernen, um seine Genauigkeit im Laufe der Zeit zu verbessern und es mit jeder neuen Rechnung, die verarbeitet wird, präziser zu machen. Die Plattform ermöglicht Benutzern außerdem die manuelle Überprüfung und Korrektur etwaiger Fehler, um sicherzustellen, dass die extrahierten Daten korrekt und zuverlässig sind.
Obwohl es viele Vorteile gibt, müssen wir auch die Grenzen dieser Methode verstehen. In Situationen, in denen die Bild-/PDF-Qualität schlecht ist, ist die Genauigkeit schlecht. Al-basierte Tools unterliegen außerdem Verzerrungen oder Fehlern, die den Trainingsdaten innewohnen.
Insgesamt kann der Einsatz von GPT zur Entitätsextraktion bei der Rechnungsverarbeitung Unternehmen dabei helfen, ihre Abläufe zu rationalisieren, manuelle Arbeit zu reduzieren und die Genauigkeit zu verbessern, was zu einem besseren Finanzmanagement und einer besseren Entscheidungsfindung führt.
Richten Sie berührungslose AP-Workflows ein und den Prozess der Kreditorenbuchhaltung optimieren in Sekunden. Buchen Sie jetzt eine 30-minütige Live-Demo.
- SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
- EVM-Finanzen. Einheitliche Schnittstelle für dezentrale Finanzen. Hier zugreifen.
- Quantum Media Group. IR/PR verstärkt. Hier zugreifen.
- PlatoAiStream. Web3-Datenintelligenz. Wissen verstärkt. Hier zugreifen.
- Quelle: https://nanonets.com/blog/improving-invoice-processing-accuracy-nanonets-chat-gpt-4/
- :hast
- :Ist
- :nicht
- :Wo
- $UP
- 1
- 10
- 13
- 5000
- 7
- 72
- a
- Fähigkeit
- Über Uns
- Zugang
- Konto
- Trading Konten
- abbrechnungsverbindlichkeiten
- Genauigkeit
- genau
- genau
- über
- hinzufügen
- Adresse
- Vorteilen
- Advent
- AI
- Algorithmen
- Alle
- erlaubt
- entlang
- ebenfalls
- Betrag
- Beträge
- an
- analysieren
- und
- Antworten
- jedem
- Bienen
- Apps
- SIND
- künstlich
- künstliche Intelligenz
- Künstliche Intelligenz (AI)
- AS
- At
- authentifizieren
- autorisieren
- automatisieren
- Automatisiert
- Avenue
- durchschnittlich
- vermeiden
- Balance
- basierend
- BE
- war
- Sein
- unten
- BESTE
- Besser
- Vorurteile
- Rechnungs-
- Blog
- buchen
- Boxen
- Geschäft
- Unternehmen
- KÄUFER..
- by
- CAN
- Häuser
- Übernehmen
- Änderungen
- Charakter
- Zeichenerkennung
- Zeichen
- ChatGPT
- aus der Ferne überprüfen
- Chennai
- Wahl
- Auswählen
- klar
- klicken Sie auf
- Code
- Kaffee
- sammeln
- Spalten
- COM
- vergleichen
- Abgeschlossene Verkäufe
- Abschluss
- konservativ
- konsistent
- Kontakt
- Smartgeräte App
- Praktische
- verkaufen
- und beseitigen Muskelschwäche
- korrigiert
- Korrekturen
- Dazugehörigen
- könnte
- erstellen
- Kreativ (Creative)
- Kreativität
- Tasse
- kuratiert
- Original
- Kunde
- Kundendaten
- Kunden
- Anpassung
- maßgeschneiderte
- technische Daten
- Dateneingabe
- Datum
- Datum
- Tag
- Behandlung
- Decision Making
- tief
- tiefe Lernen
- definiert
- Definition
- Grad
- Demo
- erwünscht
- Details
- entwickelt
- anders
- Digitalisierung
- Ziffern
- Unterlagen
- die
- erledigt
- herunterladen
- zwei
- jeder
- Früher
- erleichtern
- Benutzerfreundlichkeit
- leicht
- Effizienz
- effizient
- End-to-End
- verbesserte
- Verbessert
- Gewährleistung
- Ganz
- Entitäten
- Einheit
- Eintrag
- Fehler
- Sogar
- Jedes
- jeden Tag
- Beispiel
- Excel
- vorhandenen
- ERFAHRUNGEN
- Ausdruck
- Ausdrücke
- Extrakt
- vertraut
- Familie
- FAST
- wenige
- Feld
- Felder
- Reichen Sie das
- Mappen
- Filter
- Revolution
- Finanzdaten
- Finden Sie
- Vorname
- passen
- markiert
- Flexibilität
- folgt
- Aussichten für
- Format
- Formen
- Frei
- für
- Funktion
- Funktionen
- Ausrüstung
- erzeugen
- erzeugt
- Erzeugung
- generativ
- bekommen
- gif
- ABSICHT
- gegeben
- greifen
- Gruppen
- persönlichem Wachstum
- Haben
- mit
- Hilfe
- hilft
- hier
- Ultraschall
- HTTPS
- i
- KRANK
- ID
- identifiziert
- identifizieren
- if
- Image
- Bilder
- Bild
- implementieren
- importieren
- zu unterstützen,
- verbessert
- Verbesserung
- in
- Einschließlich
- Erhöhung
- Indien
- Krankengymnastik
- Information
- inhärent
- Anfangs-
- Intelligenz
- in
- Rechnung ocr
- Rechnungsverarbeitung
- Probleme
- IT
- Artikel
- SEINE
- nur
- Behalten
- Wesentliche
- Wissen
- Sprache
- grosse
- Nachname
- führenden
- umwandeln
- LERNEN
- lernen
- am wenigsten
- Länge
- Lasst uns
- Nutzung
- Einschränkungen
- leben
- LLM
- Log
- Los
- Sneaker
- Maschine
- Maschinelles Lernen
- gemacht
- um
- Making
- Management
- manuell
- Handarbeit
- manuell
- massiv
- Spiel
- maximal
- Kann..
- Maßnahmen
- Memory
- Methode
- könnte
- Moll
- Minuten
- Kommt demnächst...
- Fehler
- Modell
- für
- ändern
- mehr
- vor allem warme
- mehrere
- Multiplizieren
- Namen
- Natürliche
- Verarbeitung natürlicher Sprache
- Need
- erforderlich
- Bedürfnisse
- Neu
- weiter
- nicht
- jetzt an
- Anzahl
- Zahlen
- erhalten
- beschaffen
- OCR
- OCR-Lösung
- OCR-Tool
- of
- Angebote
- on
- einmal
- EINEM
- einzige
- XNUMXh geöffnet
- OpenAI
- Einkauf & Prozesse
- optische Zeichenerkennung
- Option
- Optionen
- or
- Auftrag
- Bestellungen
- Andere
- UNSERE
- Möglichkeiten für das Ausgangssignal:
- übrig
- Paket
- Paar
- Parameter
- Parameter
- besondere
- passieren
- Bestehen
- passt
- Schnittmuster
- Ausführen
- durchgeführt
- person
- Pipeline
- Plattform
- Plato
- Datenintelligenz von Plato
- PlatoData
- Arm
- Werkzeuge
- größte treibende
- präzise
- Vorhersagbar
- Preis
- Preise
- Prozessdefinierung
- Verarbeitet
- anpassen
- Verarbeitung
- produziert
- die
- vorausgesetzt
- bietet
- Python
- Qualität
- Menge
- Abfragen
- schnell
- Zufälligkeit
- erhalten
- Anerkennung
- Veteran
- reduziert
- bezieht sich
- regulär
- relevant
- zuverlässig
- Zugriffe
- Downloads
- Antwort
- Folge
- Die Ergebnisse
- behalten
- Überprüfen
- Recht
- s
- Said
- Skalieren
- Suche
- Sekunden
- Die Geheime
- Sicherheitdienst
- Sicherheitsmaßnahmen
- sehen
- gesehen
- Sellers
- getrennte
- Fertige Server
- kompensieren
- Versand
- Shop
- gezeigt
- Schild
- signifikant
- bedeutend
- ähnlich
- einfach
- da
- Umstände
- Lösung
- einige
- spezifisch
- Geschwindigkeit
- steht
- Anfang
- Schritt
- Shritte
- speichern
- gelagert
- rationalisieren
- gestrafft
- strukturierte
- Fach
- so
- Support
- System
- Systeme und Techniken
- Nehmen
- und Aufgaben
- Team
- Techniken
- als
- zur Verbesserung der Gesundheitsgerechtigkeit
- Das
- die Informationen
- ihr
- dann
- Dort.
- Diese
- vom Nutzer definierten
- fehlen uns die Worte.
- Tausende
- Durch
- Zeit
- Zeitaufwendig
- zu
- Tokens
- auch
- Werkzeug
- Werkzeuge
- Top
- Gesamt
- touchless
- traditionell
- Ausbildung
- Transformator
- XNUMX
- verstehen
- einzigartiges
- Entriegelung
- hochgeladen
- us
- -
- benutzt
- Mitglied
- Benutzererfahrung
- benutzerfreundlich
- Nutzer
- verwendet
- Verwendung von
- BESTÄTIGEN
- Bestätigung
- Wert
- Werte
- überprüfen
- sehr
- Volumen
- wollen
- wurde
- Weg..
- we
- Woche
- Was
- wann
- welche
- während
- werden wir
- mit
- Wortlaut
- Arbeiten
- Workflows
- arbeiten,
- würde
- schreiben
- geschrieben
- Du
- Ihr
- Zephyrnet