Текст Amazon – це служба машинного навчання (ML), яка дозволяє автоматично витягувати текст, рукописний текст і дані зі сканованих документів, перевершуючи традиційне оптичне розпізнавання символів (OCR). Він може ідентифікувати, розуміти та витягувати дані з таблиць і форм із надзвичайною точністю. Наразі кілька компаній покладаються на ручні методи вилучення або базове програмне забезпечення OCR, яке є виснажливим і трудомістким, а також потребує ручного налаштування, яке потребує оновлення, коли змінюється форма. Amazon Texttract допомагає вирішити ці проблеми, використовуючи ML для автоматичної обробки різних типів документів і точного вилучення інформації з мінімальним ручним втручанням. Це дає змогу автоматизувати обробку документів і використовувати витягнуті дані для різних цілей, наприклад для автоматизації обробки кредитів або збору інформації з рахунків-фактур і квитанцій.
Оскільки подорожі відновлюються після пандемії, у багатьох випадках може знадобитися перевірка статусу вакцинації мандрівника. Готелям і туристичним агентствам часто доводиться переглядати карти вакцинації, щоб отримати важливі відомості, наприклад, чи мандрівник повністю вакцинований, дати вакцинації та ім’я мандрівника. Деякі агентства роблять це шляхом ручної перевірки карток, що може зайняти багато часу для персоналу та залишає місце для людських помилок. Інші створили спеціальні рішення, але вони можуть бути дорогими та складними для масштабування, а впровадження потребує багато часу. У майбутньому, можливо, з’являться можливості оптимізувати процес перевірки статусу вакцинації таким чином, щоб це було ефективним для компаній і водночас поважало конфіденційність і зручність мандрівників.
Текстові запити Amazon допомагає вирішити ці проблеми. Amazon Texttract Queries дозволяє вказувати та витягувати з документа лише ту інформацію, яка вам потрібна. Це дає вам точну та точну інформацію з документа.
У цій публікації ми ознайомимо вас із покроковим посібником із впровадження, щоб створити рішення для перевірки статусу вакцинації за допомогою текстових запитів Amazon. Рішення демонструє, як обробляти картки вакцинації за допомогою запиту Amazon Texttract, перевіряти статус вакцинації та зберігати інформацію для подальшого використання.
Огляд рішення
Наступна діаграма ілюструє архітектуру рішення.
Робочий процес включає наступні кроки:
- Користувач фотографує картку вакцинації.
- Зображення завантажується в Служба простого зберігання Amazon (Amazon S3) відро.
- Коли зображення зберігається у відрі S3, воно викликає an Функції кроку AWS робочий процес:
- Queries-Decider AWS Lambda перевіряє переданий документ і додає інформацію про тип MIME, кількість сторінок і кількість запитів до робочого циклу «Крокові функції» (у нашому прикладі ми маємо чотири запити).
NumberQueriesAndPagesChoice
це стан вибору, який додає умовну логіку до робочого процесу. Якщо є від 15 до 31 запитів, а кількість сторінок становить від 2 до 3,001, тоді асинхронна обробка Amazon Texttract є єдиним варіантом, оскільки синхронні API підтримують лише до 15 запитів і односторінкових документів. У всіх інших випадках ми використовуємо випадковий вибір синхронної чи асинхронної обробки.- Команда
TextractSync
Функція Lambda надсилає запит до Amazon Texttract для аналізу документа на основі таких запитів Amazon Texttract:- Що таке статус вакцинації?
- Що таке ім'я?
- Що таке дата народження?
- Що таке номер документа?
- Amazon Texttract аналізує зображення та надсилає відповіді на ці запити назад до функції Lambda.
- Функція Lambda перевіряє статус вакцинації клієнта та зберігає кінцевий результат у форматі CSV у тому самому відрі S3 (
demoqueries-textractxxx
) Уcsv-output
папку.
Передумови
Щоб виконати це рішення, ви повинні мати обліковий запис AWS і відповідні дозволи для створення ресурсів, необхідних як частину рішення.
Завантажте код розгортання та зразок карти вакцинації з GitHub.
Використовуйте функцію запитів на консолі Amazon Texttract
Перш ніж створювати рішення для перевірки вакцинації, давайте дослідимо, як можна використовувати запити Amazon Texttract для отримання статусу вакцинації через консоль Amazon Texttract. Ви можете використати зразок картки вакцинації, який ви завантажили зі сховища GitHub.
- На консолі Amazon Texttract виберіть Проаналізуйте документ у навігаційній панелі.
- під Завантажити документвиберіть Виберіть документ щоб завантажити картку вакцинації з локального диска.
- Після завантаження документа виберіть Запити в Налаштувати документ .
- Потім ви можете додавати запити у формі питань природною мовою. Додамо наступне:
- Що таке статус вакцинації?
- Що таке ім'я?
- Що таке дата народження?
- Що таке номер документа?
- Додавши всі свої запити, виберіть Застосувати конфігурацію.
- Перевірте запити вкладку, щоб переглянути відповіді на запитання.
Ви можете побачити, як Amazon Texttract витягує відповідь на ваш запит із документа.
Розгорніть рішення для перевірки вакцинації
У цій публікації ми використовуємо AWS Cloud9 екземпляр і встановіть необхідні залежності для екземпляра за допомогою Набір хмарних розробок AWS (AWS CDK) і Docker. AWS Cloud9 — це хмарне інтегроване середовище розробки (IDE), яке дозволяє писати, запускати та налагоджувати код за допомогою лише браузера.
- У терміналі виберіть Завантажте локальні файли на філе меню.
- Вибирати Виберіть папку і оберіть
vaccination_verification_solution
папку, яку ви завантажили з GitHub. - У терміналі підготуйте свою безсерверну програму до подальших кроків у робочому процесі розробки Модель безсерверного додатка AWS (AWS SAM) за допомогою такої команди:
- Розгорніть програму за допомогою
cdk deploy
команда:Зачекайте, поки AWS CDK розгорне модель і створить ресурси, згадані в шаблоні.
- Після завершення розгортання ви можете перевірити розгорнуті ресурси на AWS CloudFormation консоль на ресурси вкладка сторінки деталей стека.
Перевірте розчин
Тепер настав час перевірити рішення. Щоб запустити робочий процес, використовуйте aws s3 cp
щоб завантажити vac_card.jpg
файл в DemoQueries.DocumentUploadLocation
всередині папки документів:
Файл сертифіката про вакцинацію автоматично завантажується в сегмент S3 demoqueries-textractxxx
у папці завантажень.
Робочий процес Step Functions запускається через функцію Lambda, щойно файл сертифіката про вакцинацію завантажується в сегмент S3.
Функція Queries-Decider Lambda перевіряє документ і додає інформацію про тип MIME, кількість сторінок і кількість запитів до робочого процесу Step Functions (у цьому прикладі ми використовуємо чотири запити: номер документа, ім’я клієнта, дата народження та статус вакцинації).
Команда TextractSync
функція надсилає вхідні запити до Amazon Texttract і синхронно повертає повний результат як частину відповіді. Він підтримує 1-сторінкові документи (TIFF, PDF, JPG, PNG) і до 15 запитів. The GenerateCsvTask
функція бере вивід JSON з Amazon Texttract і перетворює його на файл CSV.
Остаточний результат зберігається в тому самому відрі S3 у папці csv-output, що й файл CSV.
Ви можете завантажити файл на свою локальну машину за допомогою такої команди:
Формат результату такий timestamp
, classification
, filename
, page number
, key name
, key_confidence
, value
, value_confidence
, key_bb_top
, key_bb_height
, key_bb.width
, key_bb_left
, value_bb_top
, value_bb_height
, value_bb_width
, value_bb_left
.
Ви можете масштабувати рішення для сотень документів сертифікатів вакцинації для кількох клієнтів, завантаживши їхні сертифікати вакцинації в DemoQueries.DocumentUploadLocation
. Це автоматично запускає кілька запусків кінцевого автомата Step Functions, і кінцевий результат зберігається в тому самому відрі S3 у вихідній папці csv.
Щоб змінити початковий набір запитів, які надсилаються в Amazon Texttract, ви можете перейти до свого екземпляра AWS Cloud9 і відкрити файл start_execution.py. У вікні перегляду файлів на лівій панелі перейдіть до лямбда, start_queries
, app
, start_execution.py
. Ця лямбда-функція викликається, коли файл завантажується в DemoQueries.DocumentUploadLocation
. Запити, надіслані до робочого процесу, визначені в start_execution.py
; ви можете змінити їх, оновивши код, як показано на наступному знімку екрана.
Прибирати
Щоб уникнути поточних платежів, видаліть ресурси, створені в цій публікації, за допомогою наступної команди:
Відповідь на питання Are you sure you want to delete: DemoQueries (y/n)?
з у.
Висновок
У цій публікації ми показали вам, як використовувати текстові запити Amazon для створення рішення перевірки вакцинації для туристичної індустрії. Ви можете використовувати Amazon Texttract Queries, щоб створювати рішення в інших галузях, як-от фінанси та охорона здоров’я, і отримувати інформацію з таких документів, як платіжні квитанції, іпотечні квитанції та страхові картки на основі запитань природною мовою.
Для отримання додаткової інформації див Аналіз документівабо перевірте консоль Amazon Texttract і спробуйте цю функцію.
Про авторів
Дхірадж Тхакур є архітектором рішень Amazon Web Services. Він співпрацює з клієнтами та партнерами AWS, щоб надати вказівки щодо впровадження корпоративної хмари, міграції та стратегії. Він захоплений технологіями та любить будувати та експериментувати в аналітиці та просторі AI/ML.
Рішабх Ядав є архітектором партнерських рішень в AWS із великим досвідом у сфері DevOps і пропозицій безпеки в AWS. Він співпрацює з партнерами з АСЕАН, щоб надати вказівки щодо адаптації корпоративної хмари та перегляду архітектури, а також розробки практик AWS шляхом впровадження добре архітектурної структури. Поза роботою він любить проводити час у спорті та іграх FPS.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/build-a-vaccination-verification-solution-using-the-queries-feature-in-amazon-textract/
- :є
- $UP
- 001
- 100
- 15%
- 1930
- 2468
- 258
- 7
- 8
- a
- МЕНЮ
- рахунки
- точність
- точний
- точно
- додавати
- адреса
- Додає
- Прийняття
- агентства
- AI / ML
- ВСІ
- дозволяє
- по
- Amazon
- Текст Amazon
- Amazon Web Services
- an
- аналітика
- аналізувати
- аналізи
- та
- відповідь
- Відповіді
- Інтерфейси
- додаток
- відповідний
- архітектура
- ЕСТЬ
- AS
- Асейна
- At
- автоматизувати
- автоматичний
- автоматично
- автоматизація
- уникнути
- AWS
- AWS Cloud9
- AWS CloudFormation
- назад
- фон
- заснований
- основний
- BE
- оскільки
- між
- народження
- браузер
- будувати
- Створюємо
- побудований
- підприємства
- але
- by
- CAN
- карта
- Cards
- випадків
- CD
- сертифікат
- сертифікати
- проблеми
- зміна
- Зміни
- характер
- розпізнавання символів
- вантажі
- перевірка
- вибір
- Вибирати
- хмара
- прийняття хмари
- Cloud9
- код
- Компанії
- повний
- конфігурація
- Консоль
- зручність
- дорого
- створювати
- створений
- виготовлений на замовлення
- клієнт
- Клієнти
- дані
- Дата
- Дати
- певний
- залежно
- розгортання
- розгорнути
- розгортання
- знищити
- деталі
- розробка
- різний
- важкий
- do
- Docker
- документ
- документація
- скачати
- управляти
- ефективний
- дозволяє
- підприємство
- Навколишнє середовище
- помилка
- Обстежує
- приклад
- дослідити
- обширний
- витяг
- видобуток
- Виписки
- особливість
- Fed
- поле
- філе
- остаточний
- фінансування
- після
- для
- форма
- формат
- форми
- Вперед
- чотири
- кадрів в секунду
- Рамки
- від
- Повний
- повністю
- функція
- Функції
- майбутнє
- азартні ігри
- збирати
- збір
- GitHub
- дає
- Go
- керівництво
- керівництво
- Мати
- he
- охорона здоров'я
- допомагає
- його
- готелі
- Як
- How To
- HTML
- HTTP
- HTTPS
- людина
- Сотні
- ідентифікувати
- if
- ілюструє
- зображення
- здійснювати
- реалізація
- важливо
- in
- В інших
- includes
- промисловості
- промисловість
- інформація
- початковий
- вхід
- всередині
- встановлювати
- екземпляр
- страхування
- інтегрований
- втручання
- в
- рахунки
- викликали
- викликає
- IT
- JPG
- json
- просто
- мова
- вивчення
- залишити
- дозволяє
- як
- Сподобалося
- Кредити
- місцевий
- логіка
- машина
- навчання за допомогою машини
- керівництво
- багато
- Може..
- згаданий
- Меню
- методика
- міграція
- мінімальний
- ML
- модель
- більше
- Іпотека
- переміщення
- множинний
- ім'я
- Природний
- Переміщення
- навігація
- необхідно
- Необхідність
- потреби
- примітки
- номер
- OCR
- Програмне забезпечення OCR
- of
- Пропозиції
- часто
- on
- постійний
- тільки
- відкрити
- Можливості
- оптичне розпізнавання символів
- варіант
- or
- Інше
- інші
- наші
- з
- вихід
- поза
- сторінка
- сторінок
- pane
- частина
- партнер
- партнери
- Пройшов
- пристрасний
- Дозволи
- фото
- частина
- plato
- Інформація про дані Платона
- PlatoData
- пошта
- після пандемії
- практики
- необхідність
- Готувати
- нині
- недоторканність приватного життя
- процес
- обробка
- забезпечувати
- цілей
- запити
- питання
- питань
- випадковий
- надходження
- визнання
- покладатися
- чудовий
- запросити
- вимагається
- Вимога
- Вимагається
- ресурси
- поважаючи
- відповідь
- результат
- Умови повернення
- огляд
- Відгуки
- Кімната
- Маршрут
- прогін
- пробіжки
- Сем
- то ж
- зберігаються
- шкала
- розділ
- безпеку
- побачити
- вибрати
- вибір
- посилає
- посланий
- Без сервера
- обслуговування
- Послуги
- комплект
- кілька
- Повинен
- показав
- показаний
- значний
- простий
- Софтвер
- рішення
- Рішення
- ВИРІШИТИ
- деякі
- скоро
- Простір
- витрачати
- SPORTS
- стек
- Персонал
- стан
- Статус
- Крок
- заходи
- зберігання
- зберігати
- зберігати
- магазинів
- Стратегія
- раціоналізувати
- наступні
- такі
- підтримка
- Опори
- Переконайтеся
- перевершує
- Приймати
- приймає
- Технологія
- нудний
- шаблон
- термінал
- тест
- текст
- Що
- Команда
- інформація
- їх
- потім
- Там.
- Ці
- це
- ті
- через
- час
- трудомісткий
- до
- традиційний
- подорожувати
- туристична індустрія
- мандрівник
- викликати
- спрацьовує
- намагатися
- тип
- Типи
- розуміти
- оновлення
- завантажено
- Завантаження
- URL
- використання
- користувач
- використання
- використовує
- Вакцина
- значення
- перевірка
- перевірити
- перевірка
- через
- вид
- ходити
- хотіти
- шлях..
- we
- Web
- веб-сервіси
- коли
- Чи
- який
- в той час як
- з
- Work
- робочий
- працює
- запис
- Ти
- вашу
- зефірнет