Ekstrakt z amazonki to usługa uczenia maszynowego (ML), która umożliwia automatyczne wyodrębnianie tekstu, pisma ręcznego i danych ze zeskanowanych dokumentów, przewyższając tradycyjne optyczne rozpoznawanie znaków (OCR). Potrafi identyfikować, rozumieć i wydobywać dane z tabel i formularzy z niezwykłą dokładnością. Obecnie kilka firm opiera się na ręcznych metodach ekstrakcji lub podstawowym oprogramowaniu OCR, co jest żmudne i czasochłonne oraz wymaga ręcznej konfiguracji i wymaga aktualizacji w przypadku zmiany formularza. Amazon Texttract pomaga sprostać tym wyzwaniom, wykorzystując ML do automatycznego przetwarzania różnych typów dokumentów i dokładnego wydobywania informacji przy minimalnej interwencji ręcznej. Dzięki temu możesz zautomatyzować przetwarzanie dokumentów i wykorzystać wyodrębnione dane do różnych celów, takich jak automatyzacja przetwarzania kredytów czy zbieranie informacji z faktur i paragonów.
Gdy podróże zostaną wznowione po pandemii, w wielu przypadkach może być wymagana weryfikacja statusu szczepienia podróżnego. Hotele i biura podróży często muszą przeglądać karty szczepień, aby zebrać ważne szczegóły, takie jak to, czy podróżny jest w pełni zaszczepiony, daty szczepień i imię i nazwisko podróżnego. Niektóre agencje robią to poprzez ręczną weryfikację kart, co może być czasochłonne dla personelu i pozostawia miejsce na błędy ludzkie. Inni zbudowali niestandardowe rozwiązania, ale mogą one być kosztowne i trudne do skalowania, a ich wdrożenie zajmuje dużo czasu. W przyszłości mogą pojawić się możliwości usprawnienia procesu weryfikacji statusu szczepień w sposób skuteczny dla przedsiębiorstw, przy jednoczesnym poszanowaniu prywatności i wygody podróżnych.
Zapytania tekstowe Amazona pomaga sprostać tym wyzwaniom. Amazon Text Queries pozwala określić i wyodrębnić z dokumentu tylko te informacje, które są potrzebne. Daje dokładne i dokładne informacje z dokumentu.
W tym poście przeprowadzimy Cię przez przewodnik krok po kroku dotyczący tworzenia rozwiązania do weryfikacji statusu szczepień przy użyciu zapytań Amazon Textract Queries. Rozwiązanie pokazuje, jak przetwarzać karty szczepień za pomocą zapytania Amazon Texttract, weryfikować status szczepień i przechowywać informacje do wykorzystania w przyszłości.
Omówienie rozwiązania
Poniższy schemat ilustruje architekturę rozwiązania.
Przepływ pracy obejmuje następujące kroki:
- Użytkownik robi zdjęcie karty szczepień.
- Obraz jest przesyłany do pliku Usługa Amazon Simple Storage Łyżka (Amazon S3).
- Kiedy obraz zostanie zapisany w wiadrze S3, wywołuje on Funkcje kroków AWS przepływ pracy:
- Zapytanie-decydent AWS Lambda Funkcja sprawdza przekazany dokument i dodaje informacje o typie MIME, liczbie stron i liczbie zapytań do przepływu pracy Step Functions (w naszym przykładzie mamy cztery zapytania).
NumberQueriesAndPagesChoice
to stan wyboru, który dodaje logikę warunkową do przepływu pracy. Jeśli jest 15–31 zapytań, a liczba stron mieści się w przedziale 2–3,001 15, jedyną opcją jest przetwarzanie asynchroniczne Amazon Textract, ponieważ synchroniczne interfejsy API obsługują tylko do XNUMX zapytań i jednostronicowych dokumentów. We wszystkich innych przypadkach kierujemy do losowego wyboru przetwarzania synchronicznego lub asynchronicznego.- Połączenia
TextractSync
Funkcja Lambda wysyła żądanie do Amazon Textract w celu analizy dokumentu na podstawie następujących zapytań Amazon Textract:- Jaki jest status szczepień?
- Jaka jest nazwa?
- Co to jest data urodzenia?
- Co to jest numer dokumentu?
- Amazon Texttract analizuje obraz i wysyła odpowiedzi na te zapytania z powrotem do funkcji Lambda.
- Funkcja Lambda weryfikuje status szczepienia klienta i przechowuje wynik końcowy w formacie CSV w tym samym zasobniku S3 (
demoqueries-textractxxx
) wcsv-output
teczka.
Wymagania wstępne
Aby ukończyć to rozwiązanie, powinieneś mieć konto AWS i odpowiednie uprawnienia do tworzenia zasobów wymaganych w ramach rozwiązania.
Pobierz kod wdrożenia i przykładową kartę szczepień ze strony GitHub.
Użyj funkcji Zapytania w konsoli Amazon Texttract
Zanim zbudujesz rozwiązanie do weryfikacji szczepień, przyjrzyjmy się, jak wykorzystać zapytania Amazon Textract Queries do wyodrębnienia statusu szczepień za pośrednictwem konsoli Amazon Textract. Możesz użyć próbki karty szczepień pobranej z repozytorium GitHub.
- W konsoli Amazon Texttract wybierz Analizuj dokument w okienku nawigacji.
- Pod Prześlij dokumentwybierz Wybierz dokument aby przesłać kartę szczepień z dysku lokalnego.
- Po przesłaniu dokumentu wybierz Pytania Skonfiguruj dokument
- Następnie możesz dodawać zapytania w formie pytań w języku naturalnym. Dodajmy co następuje:
- Jaki jest status szczepień?
- Jaka jest nazwa?
- Co to jest data urodzenia?
- Co to jest numer dokumentu?
- Po dodaniu wszystkich zapytań wybierz Zastosuj konfigurację.
- Sprawdź zapytania aby zobaczyć odpowiedzi na pytania.
Możesz zobaczyć, że Amazon Texttract wyodrębnia odpowiedź na Twoje zapytanie z dokumentu.
Wdróż rozwiązanie do weryfikacji szczepień
W tym poście używamy Chmura AWS9 instancję i zainstaluj niezbędne zależności w instancji za pomocą pliku Zestaw programistyczny AWS Cloud (AWS CDK) i Dockera. AWS Cloud9 to zintegrowane środowisko programistyczne (IDE) oparte na chmurze, które umożliwia pisanie, uruchamianie i debugowanie kodu za pomocą samej przeglądarki.
- W terminalu wybierz Prześlij pliki lokalne na filet menu.
- Dodaj Wybierz folder i wybierz
vaccination_verification_solution
folder pobrany z GitHub. - W terminalu przygotuj aplikację bezserwerową do kolejnych etapów przepływu pracy programistycznej AWS Serverless Model aplikacji (AWS SAM) za pomocą następującego polecenia:
- Wdróż aplikację za pomocą pliku
cdk deploy
polecenie:Poczekaj, aż AWS CDK wdroży model i utwórz zasoby wymienione w szablonie.
- Po zakończeniu wdrażania możesz sprawdzić wdrożone zasoby na stronie Tworzenie chmury AWS konsola na Zasoby na stronie szczegółów stosu.
Przetestuj rozwiązanie
Teraz czas przetestować rozwiązanie. Aby uruchomić przepływ pracy, użyj aws s3 cp
aby przesłać vac_card.jpg
złożyć do DemoQueries.DocumentUploadLocation
w folderze dokumentów:
Plik świadectwa szczepienia zostanie automatycznie przesłany do zasobnika S3 demoqueries-textractxxx
w folderze przesłanych plików.
Przepływ pracy Step Functions jest uruchamiany poprzez funkcję Lambda zaraz po przesłaniu pliku świadectwa szczepienia do segmentu S3.
Funkcja Queries-Decider Lambda sprawdza dokument i dodaje informacje o typie MIME, liczbie stron oraz liczbie zapytań do przepływu pracy Step Functions (w tym przykładzie użyliśmy czterech zapytań — numer dokumentu, nazwa klienta, data urodzenie i stan szczepień).
Połączenia TextractSync
Funkcja wysyła zapytania wejściowe do Amazon Texttract i synchronicznie zwraca pełny wynik jako część odpowiedzi. Obsługuje dokumenty 1-stronicowe (TIFF, PDF, JPG, PNG) i do 15 zapytań. The GenerateCsvTask
Funkcja pobiera dane wyjściowe JSON z Amazon Texttract i konwertuje je do pliku CSV.
Ostateczny wynik jest przechowywany w tym samym zasobniku S3 w folderze CSV-Output, co plik CSV.
Możesz pobrać plik na komputer lokalny za pomocą następującego polecenia:
Wynik ma format timestamp
, classification
, filename
, page number
, key name
, key_confidence
, value
, value_confidence
, key_bb_top
, key_bb_height
, key_bb.width
, key_bb_left
, value_bb_top
, value_bb_height
, value_bb_width
, value_bb_left
.
Możesz skalować rozwiązanie do setek dokumentów świadectw szczepień dla wielu klientów, przesyłając ich świadectwa szczepień do DemoQueries.DocumentUploadLocation
. To automatycznie wyzwala wielokrotne uruchomienia maszyny stanu Step Functions, a końcowy wynik jest przechowywany w tym samym zasobniku S3 w folderze CSV-Output.
Aby zmienić początkowy zestaw zapytań wprowadzanych do Amazon Textract, możesz przejść do swojej instancji AWS Cloud9 i otworzyć plik start_execution.py. W widoku plików w lewym okienku przejdź do lambda, start_queries
, app
, start_execution.py
. Ta funkcja Lambda jest wywoływana po przesłaniu pliku do DemoQueries.DocumentUploadLocation
. Zapytania wysyłane do przepływu pracy definiuje się w start_execution.py
; możesz je zmienić, aktualizując kod, jak pokazano na poniższym zrzucie ekranu.
Sprzątać
Aby uniknąć naliczania bieżących opłat, usuń zasoby utworzone w tym poście, używając następującego polecenia:
Odpowiedz na pytanie Are you sure you want to delete: DemoQueries (y/n)?
z y.
Wnioski
W tym poście pokazaliśmy, jak wykorzystać zapytania Amazon Textract Queries do zbudowania rozwiązania do weryfikacji szczepień dla branży turystycznej. Możesz używać zapytań Amazon Textract Queries do tworzenia rozwiązań w innych branżach, takich jak finanse i opieka zdrowotna, oraz uzyskiwać informacje z dokumentów, takich jak odcinki wypłat, noty hipoteczne i karty ubezpieczeniowe, w oparciu o pytania w języku naturalnym.
Aby uzyskać więcej informacji, zobacz Analiza dokumentówlub sprawdź konsolę Amazon Texttract i wypróbuj tę funkcję.
O autorach
Dhiraj Thakura jest architektem rozwiązań w Amazon Web Services. Współpracuje z klientami i partnerami AWS, aby zapewnić wskazówki dotyczące wdrażania chmury korporacyjnej, migracji i strategii. Pasjonuje się technologią, lubi budować i eksperymentować w przestrzeni analitycznej i AI / ML.
Rishabh Yadav jest architektem rozwiązań partnerskich w AWS z rozległym doświadczeniem w zakresie DevOps i ofert bezpieczeństwa w AWS. Współpracuje z partnerami z ASEAN, aby zapewnić wytyczne dotyczące wdrażania chmury korporacyjnej i przeglądów architektury, a także budować praktyki AWS poprzez wdrożenie Well-Architected Framework. Poza pracą lubi spędzać czas na boisku sportowym i grach typu FPS.
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
- PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
- PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
- Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
- Źródło: https://aws.amazon.com/blogs/machine-learning/build-a-vaccination-verification-solution-using-the-queries-feature-in-amazon-textract/
- :Jest
- $W GÓRĘ
- 001
- 100
- 15%
- 1930
- 2468
- 258
- 7
- 8
- a
- O nas
- Konto
- precyzja
- dokładny
- dokładnie
- Dodaj
- adres
- Dodaje
- Przyjęcie
- agencje
- AI / ML
- Wszystkie kategorie
- pozwala
- wzdłuż
- Amazonka
- Ekstrakt z amazonki
- Amazon Web Services
- an
- analityka
- w czasie rzeczywistym sprawiają,
- ćwiczenie
- i
- odpowiedź
- odpowiedzi
- Pszczoła
- Zastosowanie
- właściwy
- architektura
- SĄ
- AS
- ASEAN
- At
- zautomatyzować
- automatycznie
- automatycznie
- automatyzacja
- uniknąć
- AWS
- Chmura AWS9
- Tworzenie chmury AWS
- z powrotem
- tło
- na podstawie
- podstawowy
- BE
- bo
- pomiędzy
- narodziny
- przeglądarka
- budować
- Budowanie
- wybudowany
- biznes
- ale
- by
- CAN
- karta
- Kartki okolicznosciowe
- Etui
- CD
- świadectwo
- certyfikaty
- wyzwania
- zmiana
- Zmiany
- charakter
- rozpoznawanie znaków
- Opłaty
- ZOBACZ
- wybór
- Dodaj
- Chmura
- adopcja chmury
- Cloud9
- kod
- Firmy
- kompletny
- systemu
- Konsola
- wygoda
- kosztowny
- Stwórz
- stworzony
- zwyczaj
- klient
- Klientów
- dane
- Data
- Daty
- zdefiniowane
- Zależności
- rozwijać
- wdrażane
- Wdrożenie
- zniszczyć
- detale
- oprogramowania
- różne
- trudny
- do
- Doker
- dokument
- dokumenty
- pobieranie
- napęd
- wydajny
- Umożliwia
- Enterprise
- Środowisko
- błąd
- Bada
- przykład
- odkryj
- rozległy
- wyciąg
- ekstrakcja
- Wyciągi
- Cecha
- nakarmiony
- pole
- filet
- finał
- finansować
- następujący
- W razie zamówieenia projektu
- Nasz formularz
- format
- formularze
- Naprzód
- cztery
- fps
- Framework
- od
- pełny
- w pełni
- funkcjonować
- Funkcje
- przyszłość
- gier
- zbierać
- zebranie
- GitHub
- daje
- Go
- poradnictwo
- poprowadzi
- Have
- he
- opieki zdrowotnej
- pomaga
- jego
- Hotele
- W jaki sposób
- How To
- HTML
- http
- HTTPS
- człowiek
- Setki
- zidentyfikować
- if
- ilustruje
- obraz
- wdrożenia
- realizacja
- ważny
- in
- W innych
- obejmuje
- przemysłowa
- przemysł
- Informacja
- początkowy
- wkład
- wewnątrz
- zainstalować
- przykład
- ubezpieczenie
- zintegrowany
- interwencja
- najnowszych
- faktury
- przywołany
- inwokuje
- IT
- jpg
- json
- właśnie
- język
- nauka
- lewo
- pozwala
- lubić
- lubi
- Kredyty
- miejscowy
- logika
- maszyna
- uczenie maszynowe
- podręcznik
- wiele
- Może..
- wzmiankowany
- Menu
- metody
- migracja
- minimalny
- ML
- model
- jeszcze
- Hipoteka
- przeniesienie
- wielokrotność
- Nazwa
- Naturalny
- Nawigacja
- Nawigacja
- niezbędny
- Potrzebować
- wymagania
- Uwagi
- numer
- OCR
- Oprogramowanie OCR
- of
- Oferty
- często
- on
- trwający
- tylko
- koncepcja
- Szanse
- optyczne rozpoznawanie znaków
- Option
- or
- Inne
- Pozostałe
- ludzkiej,
- na zewnątrz
- wydajność
- zewnętrzne
- strona
- stron
- chleb
- część
- partnerem
- wzmacniacz
- minęło
- namiętny
- uprawnienia
- kawałek
- plato
- Analiza danych Platona
- PlatoDane
- Post
- po pandemii
- praktyki
- precyzyjny
- Przygotować
- obecnie
- prywatność
- wygląda tak
- przetwarzanie
- zapewniać
- cele
- zapytania
- pytanie
- pytania
- przypadkowy
- wpływy
- uznanie
- polegać
- znakomity
- zażądać
- wymagany
- wymagania
- Wymaga
- Zasoby
- co do
- odpowiedź
- dalsze
- powraca
- przeglądu
- Recenzje
- Pokój
- Trasa
- run
- działa
- Sam
- taki sam
- zapisywane
- Skala
- Sekcja
- bezpieczeństwo
- widzieć
- wybierać
- wybór
- wysyła
- wysłany
- Bezserwerowe
- usługa
- Usługi
- zestaw
- kilka
- powinien
- pokazał
- pokazane
- znaczący
- Prosty
- Tworzenie
- rozwiązanie
- Rozwiązania
- ROZWIĄZANIA
- kilka
- wkrótce
- Typ przestrzeni
- wydać
- SPORTOWE
- stos
- Personel
- Stan
- Rynek
- Ewolucja krok po kroku
- Cel
- przechowywanie
- sklep
- przechowywany
- sklep
- Strategia
- opływowy
- kolejny
- taki
- wsparcie
- podpory
- pewnie
- niezrównany
- Brać
- trwa
- Technologia
- nudny
- szablon
- terminal
- test
- XNUMX
- że
- Połączenia
- Informacje
- ich
- następnie
- Tam.
- Te
- to
- tych
- Przez
- czas
- czasochłonne
- do
- tradycyjny
- podróżować
- branża turystyczna
- podróżnik
- wyzwalać
- rozsierdzony
- próbować
- rodzaj
- typy
- zrozumieć
- aktualizowanie
- przesłanych
- Uploading
- URL
- posługiwać się
- Użytkownik
- za pomocą
- Wykorzystując
- Szczepionka
- wartość
- Weryfikacja
- zweryfikować
- weryfikacja
- przez
- Zobacz i wysłuchaj
- spacer
- chcieć
- Droga..
- we
- sieć
- usługi internetowe
- jeśli chodzi o komunikację i motywację
- czy
- który
- Podczas
- w
- Praca
- workflow
- działa
- napisać
- You
- Twój
- zefirnet