最近では、機械学習 (ML) を使用して、特にテキストや画像の形式のデータに対して予測を行うには、深層学習モデルの作成と調整のための広範な ML の知識が必要でした。 現在、ML モデルを使用してビジネス価値を生み出したいと考えているすべてのユーザーが ML にアクセスしやすくなりました。 と Amazon SageMaker キャンバスを使用すると、コードを XNUMX 行も記述することなく、表形式または時系列データだけでなく、さまざまなデータ型の予測を作成できます。 これらの機能には、画像、テキスト、ドキュメントのデータ型の事前トレーニングされたモデルが含まれます。
この投稿では、事前トレーニングされたモデルを使用して、表形式データ以外のサポートされているデータ型の予測を取得する方法について説明します。
テキストデータ
SageMaker Canvas は、ML モデルを構築、トレーニング、デプロイするためのコード不要の視覚的な環境を提供します。 自然言語処理 (NLP) タスクの場合、SageMaker Canvas は次の機能とシームレスに統合します。 Amazon Comprehend 言語検出、エンティティ認識、センチメント分析、トピック モデリングなどの主要な NLP 機能を実行できるようにします。 この統合により、Amazon Comprehend の堅牢な NLP モデルを使用するためのコーディングやデータエンジニアリングが不要になります。 テキスト データを提供し、一般的に使用される XNUMX つの機能 (感情分析、言語検出、エンティティ抽出、個人情報検出) から選択するだけです。 シナリオごとに、UI を使用してテストし、バッチ予測を使用して、保存されているデータを選択できます。 Amazon シンプル ストレージ サービス (Amazon S3)。
感情分析
センチメント分析を使用すると、SageMaker Canvas を使用して入力テキストのセンチメントを分析できます。 次のスクリーンショットに示すように、全体的な感情が肯定的、否定的、混合的、または中立的であるかどうかを判断できます。 これは、製品レビューの分析などの状況に役立ちます。 たとえば、「この製品が大好きです。素晴らしいです!」というテキストです。 「この製品はひどい、買ったことを後悔しています」は SageMaker Canvas によって肯定的な感情を持つものとして分類されますが、「この製品はひどい、買ったことを後悔しています。」は否定的な感情として分類されます。
エンティティの抽出
SageMaker Canvas はテキストを分析し、その中で言及されているエンティティを自動的に検出できます。 ドキュメントが分析のために SageMaker Canvas に送信されると、テキスト内の人物、組織、場所、日付、数量、およびその他のエンティティが識別されます。 このエンティティ抽出機能を使用すると、ドキュメントで説明されている主要な人物、場所、詳細についての洞察を迅速に得ることができます。 サポートされているエンティティのリストについては、次を参照してください。 エンティティ.
言語検出
SageMaker Canvas は、Amazon Comprehend を使用してテキストの主要言語を決定することもできます。 テキストを分析して主要言語を特定し、検出された主要言語の信頼スコアを提供しますが、多言語ドキュメントのパーセンテージの内訳は示しません。 複数の言語で構成される長い文書で最良の結果を得るには、テキストを小さな部分に分割し、結果を集計して言語の割合を推定します。 少なくとも 20 文字のテキストを使用する場合に最適です。
個人情報の検出
SageMaker Canvas の個人情報検出を使用して機密データを保護することもできます。 テキスト文書を分析して個人識別情報 (PII) エンティティを自動的に検出し、名前、住所、生年月日、電話番号、電子メール アドレスなどの機密データを見つけることができます。 最大 100 KB のドキュメントを分析し、検出された各エンティティの信頼スコアを提供するため、最も機密性の高い情報を確認して選択的に編集できます。 検出されたエンティティのリストについては、を参照してください。 PII エンティティの検出.
画像データ
SageMaker Canvas は、コード不要の視覚的なインターフェイスを提供し、 Amazonの再認識 画像解析用。 たとえば、画像のデータセットをアップロードし、Amazon Rekognition を使用してオブジェクトやシーンを検出し、テキスト検出を実行して幅広いユースケースに対応できます。 ビジュアルインターフェイスと Amazon Rekognition の統合により、開発者以外でも高度なコンピュータービジョン技術を利用できるようになります。
画像内の物体検出
SageMaker Canvas は、Amazon Rekognition を使用して画像内のラベル (オブジェクト) を検出します。 SageMaker Canvas UI から画像をアップロードするか、 バッチ予測 タブをクリックして、S3 バケットに保存されている画像を選択します。 次の例に示すように、時計塔、バス、建物などの画像内のオブジェクトを抽出できます。 インターフェイスを使用して、予測結果を検索し、並べ替えることができます。
画像内のテキスト検出
画像からテキストを抽出することは、非常に一般的な使用例です。 これで、SageMaker Canvas 上でコードなしでこのタスクを簡単に実行できるようになりました。 次のスクリーンショットに示すように、テキストは行項目として抽出されます。 画像内の短いフレーズがまとめて分類され、フレーズとして識別されます。
一連の画像をアップロードしてバッチ予測を実行し、単一のバッチ ジョブですべての画像を抽出し、結果を CSV ファイルとしてダウンロードできます。 このソリューションは、画像内のテキストを抽出して検出する場合に役立ちます。
文書データ
SageMaker Canvas は、日常の文書理解のニーズを解決する、すぐに使えるさまざまなソリューションを提供します。 これらのソリューションを活用するのは、 アマゾンテキストラック。 ドキュメントで使用可能なすべてのオプションを表示するには、次のことを選択します。 すぐに使えるモデル ナビゲーション ウィンドウでフィルタリングします。 資料、次のスクリーンショットに示すように。
文書分析
文書分析では、文書とフォームを分析して、検出されたテキスト間の関係を調べます。 この操作では、生のテキスト、フォーム、表、署名という XNUMX つのカテゴリのドキュメント抽出が返されます。 ドキュメント構造を理解するソリューションの機能により、ドキュメントから抽出するデータの種類をより柔軟に選択できるようになります。 次のスクリーンショットは、テーブル検出がどのようなものかを示す例です。
このソリューションは、複雑なドキュメントのレイアウトを理解できるため、ドキュメント内の特定の情報を抽出する必要がある場合に役立ちます。
本人確認書類の分析
このソリューションは、個人識別カード、運転免許証、またはその他の類似の身分証明書などの文書を分析するように設計されています。 次のスクリーンショットに示すように、ミドルネーム、郡、出生地などの情報が、正確性に関する個別の信頼スコアとともに、各身分証明書に対して返されます。
バッチ予測を実行するオプションがあり、これにより、本人確認書類のセットを一括アップロードし、バッチ ジョブとして処理できます。 これにより、識別ドキュメントの詳細を、データ分析などの下流プロセスで使用できるキーと値のペアに変換するための迅速かつシームレスな方法が提供されます。
経費分析
経費分析は、請求書や領収書などの経費ドキュメントを分析するように設計されています。 次のスクリーンショットは、抽出された情報がどのようなものかを示す例です。
結果は、概要フィールドと明細フィールドとして返されます。 概要フィールドはドキュメントから抽出されたキーと値のペアであり、次のようなキーが含まれます。 総計, 期日, 税。 明細項目フィールドは、ドキュメント内のテーブルとして構造化されたデータを参照します。 これは、レイアウトを維持しながらドキュメントから情報を抽出する場合に便利です。
ドキュメントクエリ
ドキュメント クエリは、ドキュメントについて質問できるように設計されています。 これは、複数ページの文書があり、文書から非常に具体的な回答を抽出したい場合に使用する優れたソリューションです。 以下は、質問できる質問の種類と、抽出された回答がどのようなものであるかの例です。
このソリューションは、ドキュメントを操作するための簡単なインターフェイスを提供します。 これは、大きなドキュメント内の特定の詳細を取得する場合に役立ちます。
まとめ
SageMaker Canvas は、テキスト、画像、ドキュメントなどのさまざまなデータ型で ML を簡単に使用するためのノーコード環境を提供します。 ビジュアルインターフェイスと、Amazon Comprehend、Amazon Rekognition、Amazon Textract などの AWS サービスとの統合により、コーディングやデータエンジニアリングの必要がなくなります。 テキストのセンチメント、エンティティ、言語、PII を分析できます。 画像の場合、オブジェクトとテキストの検出により、コンピューター ビジョンのユースケースが可能になります。 最後に、ドキュメント分析では、下流のプロセスのためにレイアウトを維持しながらテキストを抽出できます。 SageMaker Canvas のすぐに使用できるソリューションを使用すると、高度な ML テクニックを活用して、構造化データと非構造化データの両方から洞察を生成できます。 すぐに使用できる ML モデルを備えたノーコード ツールの使用に興味がある場合は、今すぐ SageMaker Canvas を試してください。 詳細については、以下を参照してください。 AmazonSageMakerCanvasの使用を開始する.
著者について
ジュリア・アン は、シンガポールを拠点とするソリューション アーキテクトです。 彼女は、医療や公共部門からデジタル ネイティブ ビジネスに至るまで、さまざまな分野の顧客と協力して、ビジネス ニーズに応じたソリューションを導入してきました。 彼女はまた、東南アジアやその他の地域の顧客がビジネスで AI と ML を使用できるようサポートしてきました。 仕事以外では、旅行やクリエイティブな活動を通じて世界について学ぶことを楽しんでいます。
ロク・ジュン・カイ シンガポールを拠点とする AI/ML のスペシャリスト ソリューション アーキテクトです。 彼は ASEAN 全体の顧客と協力して、AWS で大規模な機械学習ソリューションを構築しています。 Jun Kai は、ローコード ノーコード機械学習ツールの提唱者です。 余暇には、自然と過ごすことを楽しんでいます。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/use-machine-learning-without-writing-a-single-line-of-code-with-amazon-sagemaker-canvas/
- :持っている
- :は
- $UP
- 100
- 20
- 360
- 385
- 400
- 7
- a
- できる
- 私たちについて
- アクセス可能な
- 従った
- 精度
- 越えて
- 住所
- アドレス
- 採用
- 高度な
- 支持者
- 集計
- AI
- AI / ML
- すべて
- 許す
- 許可
- ことができます
- また
- Amazon
- Amazon Comprehend
- Amazonの再認識
- アマゾンセージメーカー
- Amazon SageMaker キャンバス
- アマゾンテキストラック
- Amazon Webサービス
- 間で
- an
- 分析
- 分析します
- 分析
- 分析する
- および
- 回答
- どれか
- です
- AS
- アセアン
- アジア
- 頼む
- At
- 自動的に
- 利用できます
- AWS
- ベース
- BE
- になる
- き
- さ
- BEST
- 越えて
- 出産
- 両言語で
- 建物
- 建物
- バス
- ビジネス
- ビジネス
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- 買収
- by
- 缶
- キャンバス
- 機能
- 機能
- カード
- 場合
- 例
- カテゴリ
- 文字
- 選択する
- 分類された
- 時計
- コード
- コーディング
- コマンドと
- 一般に
- 複雑な
- 理解する
- コンピュータ
- Computer Vision
- 信頼
- 含む
- 郡
- 作ります
- 作成
- クリエイティブ
- 顧客
- Customers
- データ
- データ分析
- 試合日
- 日々
- 深いです
- 深い学習
- 展開する
- 設計
- 細部
- 検出
- 検出された
- 検出
- 決定する
- 異なります
- デジタル
- 話し合います
- 議論する
- do
- ドキュメント
- ドキュメント
- そうではありません
- 支配的
- ダウンロード
- 各
- 緩和する
- 排除
- 可能
- 魅力的
- エンジニアリング
- エンティティ
- エンティティ
- 環境
- 特に
- 推定
- 例
- 広範囲
- 余分な
- エキス
- 抽出
- フィールズ
- File
- filter
- 最後に
- 柔軟性
- フォロー中
- フォーム
- フォーム
- 4
- から
- 利得
- 生成する
- 取得する
- 与える
- 素晴らしい
- ハーネス
- 持ってる
- 持って
- he
- 健康
- 役立つ
- 彼の
- 認定条件
- HTML
- HTTPS
- i
- 識別
- 特定され
- 識別する
- アイデンティティ
- if
- 画像
- 画像
- in
- include
- 示す
- 個人
- 情報
- 洞察
- 統合する
- 統合
- 統合
- 対話
- 興味がある
- インタフェース
- に
- 請求書
- IT
- リーディングシート
- ITS
- ジョブ
- ただ
- キー
- キー
- 知識
- ラベル
- 言語
- ESL, ビジネスESL <br> 中国語/フランス語、その他
- 大
- レイアウト
- 学習
- 最低
- ライセンス
- ような
- LINE
- リスト
- 場所
- 長い
- 見て
- のように見える
- LOOKS
- 愛
- 機械
- 機械学習
- メイン
- make
- 作る
- 言及した
- 真ん中
- 混合
- ML
- モデリング
- モデル
- 他には?
- 最も
- の試合に
- 名
- 名
- ネイティブ
- ナチュラル
- 自然言語処理
- 自然
- ナビゲーション
- 必要
- ニーズ
- 負
- 普通
- NLP
- いいえ
- 今
- 数
- 番号
- オブジェクト
- オブジェクト検出
- オブジェクト
- of
- オファー
- on
- 業務執行統括
- オプション
- オプション
- or
- 組織
- その他
- でる
- 外側
- 全体
- 足
- ペイン
- 過去
- のワークプ
- 割合
- 実行する
- 個人的な
- 個人的に
- 電話
- フレーズ
- ピース
- 場所
- 場所
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- 正の
- 可能
- ポスト
- パワード
- 予測
- 予測
- 保存する
- プロセス
- ラボレーション
- 処理
- プロダクト
- 商品レビュー
- 守る
- 提供します
- は、大阪で
- 公共
- クエリ
- 質問
- クイック
- すぐに
- 範囲
- Raw
- 領収書
- 最近
- 認識
- 参照する
- 後悔
- の関係
- の提出が必要です
- 結果
- 保持
- return
- レビュー
- レビュー
- 堅牢な
- セージメーカー
- 規模
- シナリオ
- シーン
- スコア
- シームレス
- シームレス
- を検索
- セクター
- 敏感な
- 送信
- 感情
- シリーズ
- サービス
- セッションに
- セット
- 彼女
- ショート
- 示す
- 署名
- 同様の
- 簡単な拡張で
- 単に
- シンガポール
- 状況
- より小さい
- So
- 溶液
- ソリューション
- 解決する
- 南東
- 東南アジア
- 専門家
- 特定の
- split
- 開始
- ストレージ利用料
- 保存され
- 簡単な
- 構造
- 構造化された
- そのような
- 概要
- サポート
- 支援する
- テーブル
- 仕事
- タスク
- テクニック
- test
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- それ
- 世界
- アプリ環境に合わせて
- それら
- ボーマン
- この
- 介して
- 時間
- 時系列
- 〜へ
- 今日
- 一緒に
- 豊富なツール群
- トピック
- タワー
- トレーニング
- 最適化の適用
- 旅行
- 試します
- チューニング
- type
- ui
- わかる
- 理解する
- アップロード
- つかいます
- 使用事例
- 中古
- ユーザー
- 使用されます
- 値
- 多様
- さまざまな
- 非常に
- 詳しく見る
- ビジョン
- 欲しいです
- 望んでいる
- 仕方..
- we
- ウェブ
- Webサービス
- この試験は
- いつ
- 一方
- which
- while
- 誰
- ワイド
- 広い範囲
- 意志
- 以内
- 無し
- 仕事
- 働いていました
- 作品
- 世界
- でしょう
- 書き込み
- You
- あなたの
- ゼファーネット