Амазонка Текст — это служба машинного обучения (ML), которая позволяет автоматически извлекать текст, рукописный текст и данные из отсканированных документов, превосходя традиционное оптическое распознавание символов (OCR). Он может идентифицировать, понимать и извлекать данные из таблиц и форм с поразительной точностью. В настоящее время несколько компаний полагаются на методы ручного извлечения или базовое программное обеспечение для оптического распознавания символов, что является утомительным и трудоемким и требует ручной настройки, которая требует обновления при изменении формы. Amazon Textract помогает решить эти проблемы, используя машинное обучение для автоматической обработки различных типов документов и точного извлечения информации с минимальным вмешательством вручную. Это позволяет автоматизировать обработку документов и использовать извлеченные данные для различных целей, например для автоматизации обработки кредитов или сбора информации из счетов и квитанций.
Поскольку путешествия возобновляются после пандемии, во многих случаях может потребоваться проверка вакцинационного статуса путешественника. Отелям и туристическим агентствам часто приходится проверять карты вакцинации, чтобы собрать важную информацию, например, полностью ли вакцинирован путешественник, даты вакцинации и имя путешественника. Некоторые агентства делают это путем ручной проверки карт, что может отнимать у сотрудников много времени и оставляет место для человеческих ошибок. Другие разработали собственные решения, но они могут быть дорогостоящими и сложными в масштабировании, а их внедрение может занять значительное время. В будущем могут появиться возможности упростить процесс проверки статуса вакцинации таким образом, чтобы это было эффективно для бизнеса, сохраняя при этом конфиденциальность и удобство путешественников.
Запросы Amazon Textract помогает решить эти проблемы. Amazon Textract Queries позволяет указать и извлечь из документа только ту часть информации, которая вам нужна. Это дает вам точную и точную информацию из документа.
В этом посте мы познакомим вас с пошаговым руководством по созданию решения для проверки статуса вакцинации с использованием запросов Amazon Textract. Решение демонстрирует, как обрабатывать карты вакцинации с помощью запроса Amazon Textract, проверять статус вакцинации и сохранять информацию для будущего использования.
Обзор решения
Следующая диаграмма иллюстрирует архитектуру решения.
Рабочий процесс включает в себя следующие шаги:
- Пользователь фотографирует карту прививок.
- Изображение загружается в Простой сервис хранения Amazon (Amazon S3) ведро.
- Когда изображение сохраняется в корзине S3, оно вызывает Шаговые функции AWS рабочий процесс:
- Решение запросов AWS Lambda Функция проверяет переданный документ и добавляет информацию о типе mime, количестве страниц и количестве запросов в рабочий процесс Step Functions (в нашем примере у нас есть четыре запроса).
NumberQueriesAndPagesChoice
— это состояние выбора, которое добавляет условную логику в рабочий процесс. Если имеется от 15 до 31 запроса и количество страниц составляет от 2 до 3,001 15, то асинхронная обработка Amazon Textract является единственным вариантом, поскольку синхронные API поддерживают только до XNUMX запросов и одностраничных документов. Во всех остальных случаях мы направляем случайный выбор синхронной или асинхронной обработки.- Ассоциация
TextractSync
Лямбда-функция отправляет запрос в Amazon Textract для анализа документа на основе следующих запросов Amazon Textract:- Что такое статус вакцинации?
- Как зовут?
- Что такое Дата рождения?
- Что такое номер документа?
- Amazon Textract анализирует изображение и отправляет ответы на эти запросы обратно в функцию Lambda.
- Функция Lambda проверяет статус вакцинации клиента и сохраняет окончательный результат в формате CSV в той же корзине S3 (
demoqueries-textractxxx
) Вcsv-output
папку.
Предпосылки
Для выполнения этого решения у вас должна быть учетная запись AWS и соответствующие разрешения для создания ресурсов, необходимых в рамках решения.
Загрузите код развертывания и образец карты вакцинации с сайта GitHub.
Используйте функцию «Запросы» в консоли Amazon Text.
Прежде чем создавать решение для проверки вакцинации, давайте рассмотрим, как можно использовать запросы Amazon Textract для получения статуса вакцинации через консоль Amazon Textract. Вы можете использовать образец карты вакцинации, скачанный из репозитория GitHub.
- В консоли Amazon Textract выберите Анализ документа в навигационной панели.
- Под Загрузить документ, выберите Выберите документ чтобы загрузить карту вакцинации с локального диска.
- После загрузки документа выберите Запросы в Настроить документ .
- Затем вы можете добавить запросы в форме вопросов на естественном языке. Добавим следующее:
- Что такое статус вакцинации?
- Как зовут?
- Что такое Дата рождения?
- Что такое номер документа?
- После добавления всех запросов выберите Применить конфигурацию.
- Проверьте запросы вкладка, чтобы увидеть ответы на вопросы.
Вы можете видеть, что Amazon Textract извлекает ответ на ваш запрос из документа.
Развертывание решения для проверки вакцинации
В этом посте мы используем Облако AWS9 экземпляр и установите необходимые зависимости от экземпляра с помощью Комплект для разработки облачных сервисов AWS (AWS CDK) и Docker. AWS Cloud9 — это облачная интегрированная среда разработки (IDE), которая позволяет писать, запускать и отлаживать код с помощью всего лишь браузера.
- В терминале выберите Загрузить локальные файлы на Файл .
- Выберите Выбор папки и выберите
vaccination_verification_solution
папка, которую вы скачали с GitHub. - В терминале подготовьте бессерверное приложение для последующих этапов рабочего процесса разработки. Модель безсерверного приложения AWS (AWS SAM), используя следующую команду:
- Разверните приложение с помощью
cdk deploy
команда:Подождите, пока AWS CDK развернет модель и создаст ресурсы, упомянутые в шаблоне.
- После завершения развертывания вы можете проверить развернутые ресурсы на AWS CloudFormation консоль на Полезные ресурсы вкладка страницы сведений о стеке.
Проверить решение
Теперь пришло время протестировать решение. Чтобы запустить рабочий процесс, используйте aws s3 cp
загрузить vac_card.jpg
файл в DemoQueries.DocumentUploadLocation
внутри папки документов:
Файл сертификата о вакцинации автоматически загружается в корзину S3. demoqueries-textractxxx
в папке загрузок.
Рабочий процесс Step Functions запускается с помощью функции Lambda, как только файл сертификата о вакцинации загружается в корзину S3.
Функция Queries-Decider Lambda проверяет документ и добавляет информацию о типе mime, количестве страниц и количестве запросов в рабочий процесс Step Functions (в этом примере мы используем четыре запроса — номер документа, имя клиента, дату рождения и статус вакцинации).
Ассоциация TextractSync
Функция отправляет входные запросы в Amazon Textract и синхронно возвращает полный результат как часть ответа. Он поддерживает одностраничные документы (TIFF, PDF, JPG, PNG) и до 1 запросов. GenerateCsvTask
Функция принимает выходные данные JSON из Amazon Textract и преобразует их в файл CSV.
Конечный результат сохраняется в том же сегменте S3 в папке вывода CSV, что и файл CSV.
Вы можете загрузить файл на свой локальный компьютер, используя следующую команду:
Формат результата: timestamp
, classification
, filename
, page number
, key name
, key_confidence
, value
, value_confidence
, key_bb_top
, key_bb_height
, key_bb.width
, key_bb_left
, value_bb_top
, value_bb_height
, value_bb_width
, value_bb_left
.
Вы можете масштабировать решение для сотен документов сертификатов о вакцинации для нескольких клиентов, загрузив их сертификаты о вакцинации в DemoQueries.DocumentUploadLocation
. Это автоматически запускает несколько запусков конечного автомата Step Functions, а конечный результат сохраняется в том же сегменте S3 в папке вывода csv.
Чтобы изменить исходный набор запросов, поступающих в Amazon Textract, вы можете перейти к своему экземпляру AWS Cloud9 и открыть файл start_execution.py. В представлении файлов на левой панели перейдите к лямбда-выражению, start_queries
, app
, start_execution.py
. Эта функция Lambda вызывается, когда файл загружается на DemoQueries.DocumentUploadLocation
. Запросы, отправляемые в рабочий процесс, определены в start_execution.py
; вы можете изменить их, обновив код, как показано на следующем снимке экрана.
Убирать
Чтобы избежать текущих расходов, удалите ресурсы, созданные в этом сообщении, с помощью следующей команды:
Ответь на вопрос Are you sure you want to delete: DemoQueries (y/n)?
с ю.
Заключение
В этом посте мы показали вам, как использовать запросы Amazon Textract для создания решения по проверке вакцинации для туристической индустрии. Вы можете использовать Amazon Textract Queries для создания решений в других отраслях, таких как финансы и здравоохранение, а также получать информацию из таких документов, как платежные квитанции, ипотечные квитанции и страховые карты, на основе вопросов на естественном языке.
Для получения дополнительной информации см. Анализ документовили воспользуйтесь консолью Amazon Textract и попробуйте эту функцию.
Об авторах
Дхирадж Тхакур является архитектором решений в Amazon Web Services. Он работает с клиентами и партнерами AWS, предоставляя рекомендации по внедрению, миграции и стратегии корпоративного облака. Он увлечен технологиями и любит строить и экспериментировать в области аналитики и AI/ML.
Ришаб Ядав — архитектор партнерских решений в AWS с обширным опытом работы в области DevOps и предложений безопасности в AWS. Он работает с партнерами из АСЕАН, предоставляя рекомендации по внедрению корпоративных облаков и анализу архитектуры, а также формируя практики AWS посредством внедрения Well-Architected Framework. В свободное от работы время он любит заниматься спортом и играть в шутеры от первого лица.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/build-a-vaccination-verification-solution-using-the-queries-feature-in-amazon-textract/
- :является
- $UP
- 001
- 100
- 15%
- 1930
- 2468
- 258
- 7
- 8
- a
- О нас
- Учетная запись
- точность
- точный
- точно
- Добавить
- адрес
- Добавляет
- Принятие
- агентствах
- AI / ML
- Все
- позволяет
- вдоль
- Amazon
- Амазонка Текст
- Amazon Web Services
- an
- аналитика
- анализировать
- анализы
- и
- ответ
- ответы
- API
- Применение
- соответствующий
- архитектура
- МЫ
- AS
- Asean
- At
- автоматизировать
- Автоматический
- автоматически
- Автоматизация
- избежать
- AWS
- Облако AWS9
- AWS CloudFormation
- назад
- фон
- основанный
- основной
- BE
- , так как:
- между
- рождение
- браузер
- строить
- Строительство
- построенный
- бизнес
- но
- by
- CAN
- карта
- Карты
- случаев
- CD
- сертификат
- сертификаты
- проблемы
- изменение
- изменения
- персонаж
- распознавание символов
- расходы
- проверка
- выбор
- Выберите
- облако
- принятие облака
- Cloud9
- код
- Компании
- полный
- Конфигурация
- Консоли
- удобство
- дорогостоящий
- Создайте
- создали
- изготовленный на заказ
- клиент
- Клиенты
- данным
- Время
- Финики
- определенный
- Зависимости
- развертывание
- развернуть
- развертывание
- уничтожить
- подробнее
- Развитие
- различный
- трудный
- do
- Docker
- документ
- Документация
- скачать
- управлять
- эффективный
- позволяет
- Предприятие
- Окружающая среда
- ошибка
- Исследует
- пример
- Больше
- обширный
- извлечение
- добыча
- Экстракты
- Особенность
- ФРС
- поле
- Файл
- окончательный
- финансы
- после
- Что касается
- форма
- формат
- формы
- вперед
- 4
- кадров в секунду
- Рамки
- от
- полный
- полностью
- функция
- Функции
- будущее
- игровой
- собирать
- сбор
- GitHub
- дает
- Go
- руководство
- инструкция
- Есть
- he
- здравоохранение
- помогает
- его
- отели
- Как
- How To
- HTML
- HTTP
- HTTPS
- человек
- Сотни
- определения
- if
- иллюстрирует
- изображение
- осуществлять
- реализация
- важную
- in
- В других
- включает в себя
- промышленности
- промышленность
- информация
- начальный
- вход
- внутри
- устанавливать
- пример
- страхование
- интегрированный
- вмешательство
- в
- счета-фактуры
- вызывается
- Запускает
- IT
- JPG
- JSON
- всего
- язык
- изучение
- оставил
- Lets
- такое как
- нравится
- Кредиты
- локальным
- логика
- машина
- обучение с помощью машины
- руководство
- многих
- Май..
- упомянутый
- Меню
- методы
- миграция
- минимальный
- ML
- модель
- БОЛЕЕ
- Ипотека
- перемещение
- с разными
- имя
- натуральный
- Откройте
- Навигация
- необходимо
- Необходимость
- потребности
- Заметки
- номер
- OCR
- Программное обеспечение OCR
- of
- Предложения
- .
- on
- постоянный
- только
- открытый
- Возможности
- оптическое распознавание символов
- Опция
- or
- Другое
- Другое
- наши
- внешний
- выходной
- внешнюю
- страница
- страниц
- хлеб
- часть
- партнер
- партнеры
- Прошло
- страстный
- Разрешения
- Фото
- кусок
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- После
- Постпандемический
- практиками
- необходимость
- Подготовить
- в настоящее время
- политикой конфиденциальности.
- процесс
- обработка
- обеспечивать
- целей
- Запросы
- вопрос
- Вопросы
- случайный
- поступления
- признание
- полагаться
- замечательный
- запросить
- обязательный
- Требования
- требуется
- Полезные ресурсы
- относительно
- ответ
- результат
- Возвращает
- обзоре
- Отзывы
- Комната
- дорога
- Run
- работает
- Сэм
- то же
- сохраняются
- Шкала
- Раздел
- безопасность
- посмотреть
- выберите
- выбор
- посылает
- послать
- Serverless
- обслуживание
- Услуги
- набор
- несколько
- должен
- показал
- показанный
- значительный
- просто
- Software
- Решение
- Решения
- РЕШАТЬ
- некоторые
- скоро
- Space
- тратить
- Спорт
- стек
- Персонал
- Область
- Статус:
- Шаг
- Шаги
- диск
- магазин
- хранить
- магазины
- Стратегия
- упорядочить
- последующее
- такие
- поддержка
- Поддержка
- Убедитесь
- превосходящие
- взять
- принимает
- Технологии
- утомительный
- шаблон
- Терминал
- тестXNUMX
- текст
- который
- Ассоциация
- информация
- их
- тогда
- Там.
- Эти
- этой
- те
- Через
- время
- кропотливый
- в
- традиционный
- путешествовать
- индустрии туризма
- путешественник
- вызвать
- срабатывает
- стараться
- напишите
- Типы
- понимать
- обновление
- загружено
- Загрузка
- URL
- использование
- Информация о пользователе
- через
- Использующий
- Вакцины
- ценностное
- проверка
- проверить
- проверка
- с помощью
- Вид
- от
- хотеть
- Путь..
- we
- Web
- веб-сервисы
- когда
- будь то
- , которые
- в то время как
- Работа
- рабочий
- работает
- записывать
- Ты
- ВАШЕ
- зефирнет