アマゾンテキストラック は、従来の光学式文字認識 (OCR) を超え、スキャンされたドキュメントからテキスト、手書き文字、およびデータを自動的に抽出できる機械学習 (ML) サービスです。驚くべき精度でテーブルやフォームからデータを識別、理解、抽出できます。現在、いくつかの企業は手動の抽出方法または基本的な OCR ソフトウェアに依存していますが、これは退屈で時間がかかり、フォームの変更時に更新が必要な手動の構成が必要です。 Amazon Textract は、ML を利用してさまざまなドキュメントタイプを自動的に処理し、最小限の手動介入で情報を正確に抽出することで、これらの課題の解決に役立ちます。これにより、ドキュメント処理を自動化し、ローン処理の自動化や請求書や領収書からの情報収集など、さまざまな目的で抽出したデータを使用できます。
パンデミック後に旅行が再開されると、多くの場合、旅行者のワクチン接種状況の確認が必要になる可能性があります。ホテルや旅行代理店は多くの場合、ワクチン接種カードを確認して、旅行者が完全にワクチン接種を受けているかどうか、ワクチン接種日、旅行者の名前などの重要な詳細を収集する必要があります。一部の代理店では、カードの手動検証によってこれを行っていますが、スタッフにとっては時間がかかる可能性があり、人的ミスの余地が残ります。カスタム ソリューションを構築している企業もいますが、コストが高く、拡張が難しく、実装にはかなりの時間がかかる場合があります。今後は、旅行者のプライバシーと利便性を尊重しながら、企業にとって効率的な方法でワクチン接種状況の確認プロセスを合理化する機会が生まれる可能性があります。
Amazon Textract クエリ これらの課題に対処するのに役立ちます。 Amazon Textract クエリを使用すると、ドキュメントから必要な情報のみを指定して抽出できます。文書から正確かつ正確な情報が得られます。
この投稿では、Amazon Textract クエリを使用してワクチン接種ステータス検証ソリューションを構築するための段階的な実装ガイドを説明します。このソリューションでは、Amazon Textract クエリを使用してワクチン接種カードを処理し、ワクチン接種のステータスを確認し、将来の使用に備えて情報を保存する方法を紹介します。
ソリューションの概要
次の図は、ソリューションのアーキテクチャを示しています。
ワークフローには次の手順が含まれます。
- ユーザーはワクチン接種カードの写真を撮ります。
- 画像は次の場所にアップロードされます Amazon シンプル ストレージ サービス (Amazon S3)バケット。
- 画像が S3 バケットに保存されると、 AWSステップ関数 ワークフロー:
- クエリの決定者 AWSラムダ この関数は、渡されたドキュメントを検査し、MIME タイプ、ページ数、クエリ数に関する情報を Step Functions ワークフローに追加します (この例では、クエリが 4 つあります)。
NumberQueriesAndPagesChoice
条件付きロジックをワークフローに追加する選択状態です。 15 ~ 31 のクエリがあり、ページ数が 2 ~ 3,001 の場合、同期 API は最大 15 のクエリと XNUMX ページのドキュメントしかサポートしないため、Amazon Textract 非同期処理が唯一のオプションになります。他のすべてのケースでは、同期処理または非同期処理のランダムな選択にルーティングされます。-
TextractSync
Lambda 関数は、次の Amazon Textract クエリに基づいてドキュメントを分析するリクエストを Amazon Textract に送信します。- ワクチン接種状況とは何ですか?
- 名前は何ですか?
- 生年月日とは何ですか?
- 文書番号とは何ですか?
- Amazon Textract は画像を分析し、これらのクエリの回答を Lambda 関数に送り返します。
- Lambda 関数は顧客のワクチン接種ステータスを検証し、最終結果を CSV 形式で同じ S3 バケットに保存します (
demoqueries-textractxxx
) の中にcsv-output
フォルダにコピーします。
前提条件
このソリューションを完了するには、AWS アカウントと、ソリューションの一部として必要なリソースを作成するための適切なアクセス許可が必要です。
導入コードとサンプルワクチン接種カードを以下からダウンロードします。 GitHubの.
Amazon Textract コンソールのクエリ機能を使用する
ワクチン接種検証ソリューションを構築する前に、Amazon Textract クエリを使用して、Amazon Textract コンソール経由でワクチン接種ステータスを抽出する方法を見てみましょう。 GitHub リポジトリからダウンロードしたワクチン接種カードのサンプルを使用できます。
- Amazon Textract コンソールで、選択します ドキュメントの分析 ナビゲーションペインに表示されます。
- ドキュメントをアップロード、選択する ドキュメントを選択 ローカルドライブからワクチン接種カードをアップロードします。
- ドキュメントをアップロードした後、選択します クエリ セクションに ドキュメントの構成 のセクションから無料でダウンロードできます。
- その後、自然言語の質問の形式でクエリを追加できます。以下を追加してみましょう。
- ワクチン接種状況とは何ですか?
- 名前は何ですか?
- 生年月日とは何ですか?
- 文書番号とは何ですか?
- すべてのクエリを追加したら、選択します 構成を適用する.
- クエリを確認する タブをクリックすると、質問に対する回答が表示されます。
Amazon Textract がドキュメントからクエリに対する回答を抽出していることがわかります。
ワクチン接種検証ソリューションを導入する
この投稿では、 AWS クラウド9 インスタンスを作成し、必要な依存関係をインスタンスにインストールします。 AWSクラウド開発キット (AWS CDK) と Docker。 AWS Cloud9 は、ブラウザだけでコードを作成、実行、デバッグできるクラウドベースの統合開発環境 (IDE) です。
- ターミナルで、を選択します ローカルファイルをアップロードする File メニュー。
- 選択する フォルダーを選択する を選択して
vaccination_verification_solution
GitHub からダウンロードしたフォルダー。 - ターミナルで、開発ワークフローの後続のステップに備えてサーバーレス アプリケーションを準備します。 AWSサーバーレスアプリケーションモデル (AWS SAM) 次のコマンドを使用します。
- を使用してアプリケーションをデプロイします。
cdk deploy
コマンド:AWS CDK がモデルをデプロイし、テンプレートに記載されているリソースを作成するまで待ちます。
- デプロイが完了すると、デプロイされたリソースを確認できます。 AWS CloudFormation 上のコンソール リソース スタック詳細ページのタブ。
ソリューションをテストする
今度はソリューションをテストします。ワークフローをトリガーするには、次を使用します aws s3 cp
アップロードする vac_card.jpg
ファイルへ DemoQueries.DocumentUploadLocation
docs フォルダー内:
ワクチン接種証明書ファイルは自動的に S3 バケットにアップロードされます demoqueries-textractxxx
アップロードフォルダー内にあります。
Step Functions ワークフローは、ワクチン接種証明書ファイルが S3 バケットにアップロードされるとすぐに、Lambda 関数経由でトリガーされます。
Queries-Decider Lambda 関数はドキュメントを検査し、MIME タイプ、ページ数、クエリ数に関する情報を Step Functions ワークフローに追加します (この例では、ドキュメント番号、顧客名、日付の 4 つのクエリを使用します)。出生、ワクチン接種の状況など)。
TextractSync
関数は入力クエリを Amazon Textract に送信し、応答の一部として完全な結果を同期的に返します。 1 ページのドキュメント (TIFF、PDF、JPG、PNG) と最大 15 個のクエリをサポートします。の GenerateCsvTask
関数は、Amazon Textract から JSON 出力を取得し、CSV ファイルに変換します。
最終出力は、csv-output フォルダー内の同じ S3 バケットに CSV ファイルとして保存されます。
次のコマンドを使用して、ファイルをローカル マシンにダウンロードできます。
結果の形式は次のとおりです timestamp
, classification
, filename
, page number
, key name
, key_confidence
, value
, value_confidence
, key_bb_top
, key_bb_height
, key_bb.width
, key_bb_left
, value_bb_top
, value_bb_height
, value_bb_width
, value_bb_left
.
ワクチン接種証明書を DemoQueries.DocumentUploadLocation
。これにより、Step Functions ステート マシンの複数の実行が自動的にトリガーされ、最終結果は csv-output フォルダー内の同じ S3 バケットに保存されます。
Amazon Textract に供給されるクエリの初期セットを変更するには、AWS Cloud9 インスタンスに移動して start_execution.py ファイルを開きます。左側のペインのファイル ビューで、lambda に移動します。 start_queries
, app
, start_execution.py
。この Lambda 関数は、ファイルがアップロードされるときに呼び出されます。 DemoQueries.DocumentUploadLocation
。ワークフローに送信されるクエリは次のように定義されます。 start_execution.py
;次のスクリーンショットに示すようにコードを更新することで、これらを変更できます。
クリーンアップ
継続的な料金の発生を避けるには、次のコマンドを使用してこの投稿で作成したリソースを削除します。
質問に答えて Are you sure you want to delete: DemoQueries (y/n)?
Yさんと。
まとめ
この投稿では、Amazon Textract クエリを使用して旅行業界向けのワクチン接種検証ソリューションを構築する方法を説明しました。 Amazon Textract クエリを使用して、金融やヘルスケアなどの他の業界でソリューションを構築したり、自然言語の質問に基づいて給与明細、住宅ローン手形、保険カードなどのドキュメントから情報を取得したりできます。
詳細については、を参照してください。 文書の分析、または、Amazon Textract コンソールをチェックして、この機能を試してみてください。
著者について
ディーラジ・タクール アマゾンウェブサービスのソリューションアーキテクトです。 彼はAWSのお客様やパートナーと協力して、エンタープライズクラウドの採用、移行、戦略に関するガイダンスを提供しています。 彼はテクノロジーに情熱を注いでおり、分析とAI / MLの分野での構築と実験を楽しんでいます。
リシャブ・ヤダフ は、AWS のパートナー ソリューション アーキテクトであり、AWS での DevOps とセキュリティ製品に豊富な経験を持っています。彼は ASEAN パートナーと協力して、Well-Architected フレームワークの実装を通じて AWS プラクティスを構築するとともに、エンタープライズ クラウドの導入とアーキテクチャのレビューに関するガイダンスを提供しています。仕事以外では、スポーツや FPS ゲームに時間を費やすのが好きです。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/build-a-vaccination-verification-solution-using-the-queries-feature-in-amazon-textract/
- :は
- $UP
- 001
- 100
- 視聴者の38%が
- 1930
- 2468
- 258
- 7
- 8
- a
- 私たちについて
- 精度
- 正確な
- 正確にデジタル化
- 加えます
- 住所
- 追加
- 養子縁組
- 機関
- AI / ML
- すべて
- ことができます
- 沿って
- Amazon
- アマゾンテキストラック
- Amazon Webサービス
- an
- 分析論
- 分析します
- 分析
- および
- 回答
- 回答
- API
- 申し込み
- 適切な
- 建築
- です
- AS
- アセアン
- At
- 自動化する
- オートマチック
- 自動的に
- 自動化する
- 避ける
- AWS
- AWS クラウド9
- AWS CloudFormation
- バック
- 背景
- ベース
- 基本
- BE
- なぜなら
- の間に
- 出産
- ブラウザ
- ビルド
- 建物
- 内蔵
- ビジネス
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- 缶
- カード
- カード
- 例
- CD
- 証明書
- 証明書
- 課題
- 変化する
- 変更
- 文字
- 文字認識
- 課金
- チェック
- 選択
- 選択する
- クラウド
- クラウドの採用
- Cloud9
- コード
- 企業
- コンプリート
- 領事
- 利便性
- 高額で
- 作ります
- 作成した
- カスタム
- 顧客
- Customers
- データ
- 日付
- 試合日
- 定義済みの
- 依存関係
- 展開します
- 展開
- 展開
- 破壊する
- 細部
- 開発
- 異なります
- 難しい
- do
- デッカー
- ドキュメント
- ドキュメント
- ダウンロード
- ドライブ
- 効率的な
- 可能
- Enterprise
- 環境
- エラー
- 試験
- 例
- 探る
- 広範囲
- エキス
- 抽出
- 抽出物
- 特徴
- FRBは
- フィールド
- File
- ファイナル
- ファイナンス
- フォロー中
- フォーム
- 形式でアーカイブしたプロジェクトを保存します.
- フォーム
- フォワード
- 4
- FPS
- フレームワーク
- から
- フル
- 完全に
- function
- 機能
- 未来
- 賭博
- 集める
- 集まり
- GitHubの
- 与える
- Go
- ガイダンス
- ガイド
- 持ってる
- he
- ヘルスケア
- ことができます
- 彼の
- ホテル
- 認定条件
- How To
- HTML
- HTTP
- HTTPS
- 人間
- 何百
- 識別する
- if
- 説明する
- 画像
- 実装する
- 実装
- 重要
- in
- その他の
- 含ま
- 産業
- 産業を変えます
- 情報
- 初期
- 内部
- install
- 保険
- 統合された
- 介入
- に
- 請求書
- 呼び出された
- 呼び出す
- IT
- JPG
- JSON
- ただ
- 言語
- 学習
- 左
- ことができます
- ような
- 好き
- ローン
- ローカル
- ロジック
- 機械
- 機械学習
- マニュアル
- 多くの
- 五月..
- 言及した
- メニュー
- メソッド
- 移行
- 最小限の
- ML
- 他には?
- モーゲージ
- 移動する
- の試合に
- 名
- ナチュラル
- ナビゲート
- ナビゲーション
- 必要
- 必要
- ニーズ
- ノート
- 数
- OCR
- OCRソフトウェア
- of
- オファリング
- 頻繁に
- on
- 継続
- の
- 開いた
- 機会
- 光学式文字認識
- オプション
- or
- その他
- その他
- 私たちの
- でる
- 出力
- 外側
- ページ
- ページ
- ペイン
- 部
- パートナー
- パートナー
- 渡された
- 情熱的な
- パーミッション
- 写真
- ピース
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- ポスト
- パンデミック後
- プラクティス
- 正確な
- 準備
- 現在
- プライバシー
- プロセス
- 処理
- 提供します
- 目的
- クエリ
- 質問
- 質問
- ランダム
- 領収書
- 認識
- 頼る
- 顕著
- 要求
- の提出が必要です
- 要件
- 必要
- リソース
- 尊敬する
- 応答
- 結果
- 収益
- レビュー
- レビュー
- ルーム
- ルート
- ラン
- runs
- サム
- 同じ
- 保存されました
- 規模
- セクション
- セキュリティ
- select
- 選択
- 送る
- 送信
- サーバレス
- サービス
- サービス
- セッションに
- いくつかの
- すべき
- 示されました
- 示す
- 重要
- 簡単な拡張で
- ソフトウェア
- 溶液
- ソリューション
- 解決する
- 一部
- すぐに
- スペース
- 過ごす
- スポーツ
- スタック
- スタッフ
- 都道府県
- Status:
- 手順
- ステップ
- ストレージ利用料
- 店舗
- 保存され
- 店舗
- 戦略
- 流線
- それに続きます
- そのような
- サポート
- サポート
- 確か
- 凌駕する
- 取る
- 取り
- テクノロジー
- 退屈な
- template
- ターミナル
- test
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- それ
- 情報
- アプリ環境に合わせて
- その後
- そこ。
- ボーマン
- この
- それらの
- 介して
- 時間
- 時間がかかる
- 〜へ
- 伝統的な
- 旅行
- 旅行産業
- 旅行者
- トリガー
- トリガ
- 試します
- type
- わかる
- 更新
- アップロード
- アップロード
- URL
- つかいます
- ユーザー
- 活用
- ワクチン
- 値
- Verification
- 確認する
- 検証する
- 、
- 詳しく見る
- 歩く
- 欲しいです
- 仕方..
- we
- ウェブ
- Webサービス
- いつ
- かどうか
- which
- while
- 仕事
- ワークフロー
- 作品
- 書きます
- You
- あなたの
- ゼファーネット