Amazon SageMaker Canvas を使用すると、コードを XNUMX 行も記述せずに機械学習を使用できます。 アマゾン ウェブ サービス

Amazon SageMaker Canvas を使用すると、コードを XNUMX 行も記述せずに機械学習を使用できます。 アマゾン ウェブ サービス

最近では、機械学習 (ML) を使用して、特にテキストや画像の形式のデータに対して予測を行うには、深層学習モデルの作成と調整のための広範な ML の知識が必要でした。 現在、ML モデルを使用してビジネス価値を生み出したいと考えているすべてのユーザーが ML にアクセスしやすくなりました。 と Amazon SageMaker キャンバスを使用すると、コードを XNUMX 行も記述することなく、表形式または時系列データだけでなく、さまざまなデータ型の予測を作成できます。 これらの機能には、画像、テキスト、ドキュメントのデータ型の事前トレーニングされたモデルが含まれます。

この投稿では、事前トレーニングされたモデルを使用して、表形式データ以外のサポートされているデータ型の予測を取得する方法について説明します。

テキストデータ

SageMaker Canvas は、ML モデルを構築、トレーニング、デプロイするためのコード不要の視覚的な環境を提供します。 自然言語処理 (NLP) タスクの場合、SageMaker Canvas は次の機能とシームレスに統合します。 Amazon Comprehend 言語検出、エンティティ認識、センチメント分析、トピック モデリングなどの主要な NLP 機能を実行できるようにします。 この統合により、Amazon Comprehend の堅牢な NLP モデルを使用するためのコーディングやデータエンジニアリングが不要になります。 テキスト データを提供し、一般的に使用される XNUMX つの機能 (感情分析、言語検出、エンティティ抽出、個人情報検出) から選択するだけです。 シナリオごとに、UI を使用してテストし、バッチ予測を使用して、保存されているデータを選択できます。 Amazon シンプル ストレージ サービス (Amazon S3)。

SageMaker Canvas 上のテキストデータの分析

感情分析

センチメント分析を使用すると、SageMaker Canvas を使用して入力テキストのセンチメントを分析できます。 次のスクリーンショットに示すように、全体的な感情が肯定的、否定的、混合的、または中立的であるかどうかを判断できます。 これは、製品レビューの分析などの状況に役立ちます。 たとえば、「この製品が大好きです。素晴らしいです!」というテキストです。 「この製品はひどい、買ったことを後悔しています」は SageMaker Canvas によって肯定的な感情を持つものとして分類されますが、「この製品はひどい、買ったことを後悔しています。」は否定的な感情として分類されます。

SageMaker Canvas での感情分析

エンティティの抽出

SageMaker Canvas はテキストを分析し、その中で言及されているエンティティを自動的に検出できます。 ドキュメントが分析のために SageMaker Canvas に送信されると、テキスト内の人物、組織、場所、日付、数量、およびその他のエンティティが識別されます。 このエンティティ抽出機能を使用すると、ドキュメントで説明されている主要な人物、場所、詳細についての洞察を迅速に得ることができます。 サポートされているエンティティのリストについては、次を参照してください。 エンティティ.

SageMaker Canvas でのエンティティの抽出

言語検出

SageMaker Canvas は、Amazon Comprehend を使用してテキストの主要言語を決定することもできます。 テキストを分析して主要言語を特定し、検出された主要言語の信頼スコアを提供しますが、多言語ドキュメントのパーセンテージの内訳は示しません。 複数の言語で構成される長い文書で最良の結果を得るには、テキストを小さな部分に分割し、結果を集計して言語の割合を推定します。 少なくとも 20 文字のテキストを使用する場合に最適です。

SageMaker Canvas での言語検出

個人情報の検出

SageMaker Canvas の個人情報検出を使用して機密データを保護することもできます。 テキスト文書を分析して個人識別情報 (PII) エンティティを自動的に検出し、名前、住所、生年月日、電話番号、電子メール アドレスなどの機密データを見つけることができます。 最大 100 KB のドキュメントを分析し、検出された各エンティティの信頼スコアを提供するため、最も機密性の高い情報を確認して選択的に編集できます。 検出されたエンティティのリストについては、を参照してください。 PII エンティティの検出.

SageMaker Canvas での PII 検出

画像データ

SageMaker Canvas は、コード不要の視覚的なインターフェイスを提供し、 Amazonの再認識 画像解析用。 たとえば、画像のデータセットをアップロードし、Amazon Rekognition を使用してオブジェクトやシーンを検出し、テキスト検出を実行して幅広いユースケースに対応できます。 ビジュアルインターフェイスと Amazon Rekognition の統合により、開発者以外でも高度なコンピュータービジョン技術を利用できるようになります。

SageMaker Canvas 上の画像データの分析

画像内の物体検出

SageMaker Canvas は、Amazon Rekognition を使用して画像内のラベル (オブジェクト) を検出します。 SageMaker Canvas UI から画像をアップロードするか、 バッチ予測 タブをクリックして、S3 バケットに保存されている画像を選択します。 次の例に示すように、時計塔、バス、建物などの画像内のオブジェクトを抽出できます。 インターフェイスを使用して、予測結果を検索し、並べ替えることができます。

SageMaker Canvas 上の画像内のオブジェクト検出

画像内のテキスト検出

画像からテキストを抽出することは、非常に一般的な使用例です。 これで、SageMaker Canvas 上でコードなしでこのタスクを簡単に実行できるようになりました。 次のスクリーンショットに示すように、テキストは行項目として抽出されます。 画像内の短いフレーズがまとめて分類され、フレーズとして識別されます。

SageMaker Canvas 上の画像内のテキスト検出

一連の画像をアップロードしてバッチ予測を実行し、単一のバッチ ジョブですべての画像を抽出し、結果を CSV ファイルとしてダウンロードできます。 このソリューションは、画像内のテキストを抽出して検出する場合に役立ちます。

文書データ

SageMaker Canvas は、日常の文書理解のニーズを解決する、すぐに使えるさまざまなソリューションを提供します。 これらのソリューションを活用するのは、 アマゾンテキストラック。 ドキュメントで使用可能なすべてのオプションを表示するには、次のことを選択します。 すぐに使えるモデル ナビゲーション ウィンドウでフィルタリングします。 資料、次のスクリーンショットに示すように。

SageMaker Canvas でのドキュメントデータの分析

文書分析

文書分析では、文書とフォームを分析して、検出されたテキスト間の関係を調べます。 この操作では、生のテキスト、フォーム、表、署名という XNUMX つのカテゴリのドキュメント抽出が返されます。 ドキュメント構造を理解するソリューションの機能により、ドキュメントから抽出するデータの種類をより柔軟に選択できるようになります。 次のスクリーンショットは、テーブル検出がどのようなものかを示す例です。

SageMaker Canvas でのドキュメント分析

このソリューションは、複雑なドキュメントのレイアウトを理解できるため、ドキュメント内の特定の情報を抽出する必要がある場合に役立ちます。

本人確認書類の分析

このソリューションは、個人識別カード、運転免許証、またはその他の類似の身分証明書などの文書を分析するように設計されています。 次のスクリーンショットに示すように、ミドルネーム、郡、出生地などの情報が、正確性に関する個別の信頼スコアとともに、各身分証明書に対して返されます。

SageMaker Canvas でのアイデンティティ文書分析

バッチ予測を実行するオプションがあり、これにより、本人確認書類のセットを一括アップロードし、バッチ ジョブとして処理できます。 これにより、識別ドキュメントの詳細を、データ分析などの下流プロセスで使用できるキーと値のペアに変換するための迅速かつシームレスな方法が提供されます。

経費分析

経費分析は、請求書や領収書などの経費ドキュメントを分析するように設計されています。 次のスクリーンショットは、抽出された情報がどのようなものかを示す例です。

SageMaker Canvas での経費分析

結果は、概要フィールドと明細フィールドとして返されます。 概要フィールドはドキュメントから抽出されたキーと値のペアであり、次のようなキーが含まれます。 総計, 期日, 。 明細項目フィールドは、ドキュメント内のテーブルとして構造化されたデータを参照します。 これは、レイアウトを維持しながらドキュメントから情報を抽出する場合に便利です。

ドキュメントクエリ

ドキュメント クエリは、ドキュメントについて質問できるように設計されています。 これは、複数ページの文書があり、文書から非常に具体的な回答を抽出したい場合に使用する優れたソリューションです。 以下は、質問できる質問の種類と、抽出された回答がどのようなものであるかの例です。

SageMaker Canvas でのドキュメント クエリ

このソリューションは、ドキュメントを操作するための簡単なインターフェイスを提供します。 これは、大きなドキュメント内の特定の詳細を取得する場合に役立ちます。

まとめ

SageMaker Canvas は、テキスト、画像、ドキュメントなどのさまざまなデータ型で ML を簡単に使用するためのノーコード環境を提供します。 ビジュアルインターフェイスと、Amazon Comprehend、Amazon Rekognition、Amazon Textract などの AWS サービスとの統合により、コーディングやデータエンジニアリングの必要がなくなります。 テキストのセンチメント、エンティティ、言語、PII を分析できます。 画像の場合、オブジェクトとテキストの検出により、コンピューター ビジョンのユースケースが可能になります。 最後に、ドキュメント分析では、下流のプロセスのためにレイアウトを維持しながらテキストを抽出できます。 SageMaker Canvas のすぐに使用できるソリューションを使用すると、高度な ML テクニックを活用して、構造化データと非構造化データの両方から洞察を生成できます。 すぐに使用できる ML モデルを備えたノーコード ツールの使用に興味がある場合は、今すぐ SageMaker Canvas を試してください。 詳細については、以下を参照してください。 AmazonSageMakerCanvasの使用を開始する.


著者について

Amazon SageMaker Canvas を使用すると、コードを 1 行も記述せずに機械学習を使用できます。アマゾン ウェブ サービス PlatoBlockchain データ インテリジェンス。垂直検索。あい。ジュリア・アン は、シンガポールを拠点とするソリューション アーキテクトです。 彼女は、医療や公共部門からデジタル ネイティブ ビジネスに至るまで、さまざまな分野の顧客と協力して、ビジネス ニーズに応じたソリューションを導入してきました。 彼女はまた、東南アジアやその他の地域の顧客がビジネスで AI と ML を使用できるようサポートしてきました。 仕事以外では、旅行やクリエイティブな活動を通じて世界について学ぶことを楽しんでいます。

Amazon SageMaker Canvas を使用すると、コードを 1 行も記述せずに機械学習を使用できます。アマゾン ウェブ サービス PlatoBlockchain データ インテリジェンス。垂直検索。あい。ロク・ジュン・カイ シンガポールを拠点とする AI/ML のスペシャリスト ソリューション アーキテクトです。 彼は ASEAN 全体の顧客と協力して、AWS で大規模な機械学習ソリューションを構築しています。 Jun Kai は、ローコード ノーコード機械学習ツールの提唱者です。 余暇には、自然と過ごすことを楽しんでいます。

タイムスタンプ:

より多くの AWS機械学習