Використовуйте машинне навчання без написання жодного рядка коду за допомогою Amazon SageMaker Canvas | Веб-сервіси Amazon

Використовуйте машинне навчання без написання жодного рядка коду за допомогою Amazon SageMaker Canvas | Веб-сервіси Amazon

У недавньому минулому використання машинного навчання (ML) для прогнозування, особливо для даних у формі тексту та зображень, вимагало глибоких знань ML для створення та налаштування моделей глибокого навчання. Сьогодні ML став більш доступним для будь-якого користувача, який хоче використовувати моделі ML для створення цінності для бізнесу. с Canvas Amazon SageMaker, ви можете створювати прогнози для ряду різних типів даних, окрім даних у вигляді таблиці чи часових рядів, без написання жодного рядка коду. Ці можливості включають попередньо підготовлені моделі для типів даних зображення, тексту та документа.

У цій публікації ми обговорюємо, як можна використовувати попередньо навчені моделі для отримання прогнозів для підтримуваних типів даних, окрім табличних даних.

Текстові дані

SageMaker Canvas надає візуальне середовище без коду для створення, навчання та розгортання моделей ML. Для завдань обробки природної мови (NLP) SageMaker Canvas бездоганно інтегрується з «Амазонка» щоб дозволити вам виконувати такі ключові можливості НЛП, як виявлення мови, розпізнавання сутностей, аналіз настроїв, моделювання теми тощо. Інтеграція усуває необхідність будь-якого кодування чи обробки даних для використання надійних моделей NLP Amazon Comprehend. Ви просто надаєте свої текстові дані та вибираєте одну з чотирьох широко використовуваних можливостей: аналіз настроїв, визначення мови, вилучення об’єктів і виявлення особистої інформації. Для кожного сценарію ви можете використовувати користувальницький інтерфейс для перевірки та використання пакетного прогнозування для вибору даних, які зберігаються в Служба простого зберігання Amazon (Amazon S3).

Аналіз текстових даних на SageMaker Canvas

Аналіз почуттів

Завдяки аналізу настроїв SageMaker Canvas дозволяє аналізувати настрої введеного тексту. Він може визначити, чи є загальний настрій позитивним, негативним, змішаним чи нейтральним, як показано на наступному знімку екрана. Це корисно в таких ситуаціях, як аналіз відгуків про продукт. Наприклад, текст «Мені подобається цей продукт, він чудовий!» буде класифіковано SageMaker Canvas як позитивне, тоді як «Цей продукт жахливий, я шкодую, що купив його» буде позначено як негативне.

Аналіз настроїв на полотні SageMaker

Вилучення сутностей

SageMaker Canvas може аналізувати текст і автоматично виявляти згадані в ньому сутності. Коли документ надсилається до SageMaker Canvas для аналізу, він визначає людей, організації, місцезнаходження, дати, кількість та інші сутності в тексті. Ця можливість вилучення об’єктів дає змогу швидко отримати інформацію про ключових людей, місця та деталі, які обговорюються в документах. Список підтримуваних об’єктів див Суб'єкти.

Вилучення Entites на Canvas SageMaker

Виявлення мови

SageMaker Canvas також може визначати домінуючу мову тексту за допомогою Amazon Comprehend. Він аналізує текст, щоб визначити основну мову, і надає оцінки достовірності для виявленої домінантної мови, але не вказує розподіл у відсотках для багатомовних документів. Щоб отримати найкращі результати з довгими документами кількома мовами, розділіть текст на менші частини та об’єднайте результати, щоб оцінити відсоток мов. Він найкраще працює з принаймні 20 символами тексту.

Виявлення мови на полотні SageMaker

Виявлення персональної інформації

Ви також можете захистити конфіденційні дані за допомогою виявлення особистої інформації за допомогою SageMaker Canvas. Він може аналізувати текстові документи, щоб автоматично виявляти ідентифікаційну інформацію (PII), дозволяючи знаходити такі конфіденційні дані, як імена, адреси, дати народження, номери телефонів, адреси електронної пошти тощо. Він аналізує документи розміром до 100 КБ і надає оцінку достовірності для кожної виявленої сутності, щоб ви могли переглядати та вибірково редагувати найбільш конфіденційну інформацію. Список виявлених об’єктів див Виявлення ідентифікаційної інформації.

Виявлення ідентифікаційної інформації на полотні SageMaker

Дані зображення

SageMaker Canvas надає візуальний безкодовий інтерфейс, який спрощує використання можливостей комп’ютерного зору завдяки інтеграції з Amazon Rekognition для аналізу зображення. Наприклад, ви можете завантажити набір даних зображень, використовувати Amazon Rekognition для виявлення об’єктів і сцен, а також виконати виявлення тексту для вирішення широкого спектру випадків використання. Візуальний інтерфейс та інтеграція Amazon Rekognition дають змогу не розробникам використовувати передові методи комп’ютерного зору.

Аналіз даних зображення на SageMaker Canvas

Виявлення об'єктів на зображеннях

SageMaker Canvas використовує Amazon Rekognition для виявлення міток (об’єктів) на зображенні. Ви можете завантажити зображення з інтерфейсу користувача SageMaker Canvas або скористатися Пакетне прогнозування вкладку для вибору зображень, що зберігаються у відрі S3. Як показано в наступному прикладі, він може витягувати об’єкти на зображенні, наприклад вежу з годинником, автобус, будівлі тощо. Ви можете використовувати інтерфейс для пошуку результатів передбачення та їх сортування.

Виявлення об’єктів у зображеннях на полотні SageMaker

Виявлення тексту в зображеннях

Вилучення тексту із зображень є дуже поширеним випадком використання. Тепер ви можете легко виконати це завдання на SageMaker Canvas без коду. Текст витягується як рядки, як показано на наступному знімку екрана. Короткі фрази на зображенні класифікуються разом і ідентифікуються як фраза.

Виявлення тексту в зображеннях на полотні SageMaker

Ви можете виконати пакетне прогнозування, завантаживши набір зображень, видобувши всі зображення в одному пакетному завданні та завантаживши результати як файл CSV. Це рішення корисне, коли ви хочете витягти та виявити текст на зображеннях.

Дані документа

SageMaker Canvas пропонує різноманітні готові до використання рішення, які вирішують ваші повсякденні потреби в розумінні документів. Ці рішення працюють на основі Текст Amazon. Щоб переглянути всі доступні параметри документів, виберіть Готові до використання моделі на панелі навігації та фільтруйте за документи, як показано на наступному знімку екрана.

Аналіз даних документа на полотні SageMaker

Аналіз документів

Аналіз документів аналізує документи та форми на наявність зв’язків між виявленим текстом. Операції повертають чотири категорії вилучення документів: необроблений текст, форми, таблиці та підписи. Здатність рішення розуміти структуру документа дає вам додаткову гнучкість у типі даних, які ви хочете отримати з документів. На наступному знімку екрана показано, як виглядає виявлення таблиці.

Аналіз документів на полотні SageMaker

Це рішення здатне розуміти макети складних документів, що корисно, коли вам потрібно отримати певну інформацію у своїх документах.

Аналіз документів, що посвідчують особу

Це рішення призначене для аналізу таких документів, як ідентифікаційні картки, водійські права чи інші подібні форми ідентифікації. Для кожного документа, що посвідчує особу, повертатиметься така інформація, як по батькові, округ і місце народження, а також його індивідуальна оцінка достовірності, як показано на знімку екрана нижче.

Аналіз документів, що посвідчують особу, на полотні SageMaker

Існує можливість пакетного прогнозування, за допомогою якого можна масово завантажувати набори ідентифікаційних документів і обробляти їх як пакетне завдання. Це забезпечує швидкий і бездоганний спосіб трансформувати деталі ідентифікаційного документа в пари ключ-значення, які можна використовувати для подальших процесів, таких як аналіз даних.

Аналіз витрат

Аналіз витрат призначений для аналізу витратних документів, таких як рахунки-фактури та квитанції. На наступному знімку екрана показано, як виглядає отримана інформація.

Аналіз витрат на полотні SageMaker

Результати повертаються як поля зведення та поля позиції. Поля зведення – це пари ключ-значення, отримані з документа, і містять такі ключі, як Загальний підсумок, Термін оплати та Податок. Поля позицій стосуються даних, структурованих у вигляді таблиці в документі. Це корисно для отримання інформації з документа, зберігаючи його макет.

Запити на документи

Запити документів призначені для того, щоб ви ставили запитання щодо своїх документів. Це чудове рішення для використання, якщо у вас є багатосторінкові документи, і ви хочете отримати дуже конкретні відповіді з ваших документів. Нижче наведено приклад типів запитань, які ви можете поставити, і того, як виглядають отримані відповіді.

Запити документів на SageMaker Canvas

Рішення забезпечує простий інтерфейс для взаємодії з документами. Це корисно, коли ви хочете отримати конкретні деталі у великих документах.

Висновок

SageMaker Canvas забезпечує середовище без коду для легкого використання машинного навчання різних типів даних, таких як текст, зображення та документи. Візуальний інтерфейс та інтеграція з такими сервісами AWS, як Amazon Comprehend, Amazon Rekognition і Amazon Texttract, усуває потребу в кодуванні та розробці даних. Ви можете аналізувати текст на настрої, сутності, мови та ідентифікаційну інформацію. Виявлення зображень, об’єктів і тексту дає змогу використовувати комп’ютерний зір. Нарешті, аналіз документів може витягувати текст, зберігаючи його макет для подальших процесів. Готові до використання рішення в SageMaker Canvas дають змогу використовувати передові методи машинного навчання для генерування розуміння на основі структурованих і неструктурованих даних. Якщо вам цікаво використовувати інструменти без коду з готовими моделями ML, спробуйте SageMaker Canvas сьогодні. Для отримання додаткової інформації див Початок роботи з Amazon SageMaker Canvas.


Про авторів

Використовуйте машинне навчання без написання жодного рядка коду за допомогою Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.Джулія Анг є архітектором рішень із Сінгапуру. Вона працювала з клієнтами в різних галузях, від охорони здоров’я та державного сектору до цифрового бізнесу, щоб прийняти рішення відповідно до їхніх бізнес-потреб. Вона також підтримує клієнтів у Південно-Східній Азії та за її межами у використанні штучного інтелекту та машинного навчання в бізнесі. Поза роботою їй подобається пізнавати світ, подорожуючи та займаючись творчістю.

Використовуйте машинне навчання без написання жодного рядка коду за допомогою Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.Локе Джун Кай є спеціалізованим архітектором рішень для AI/ML із Сінгапуру. Він працює з клієнтами в АСЕАН, щоб розробити масштабні рішення машинного навчання в AWS. Джун Кай є прихильником інструментів машинного навчання з низьким кодом і без коду. У вільний час любить бути на природі.

Часова мітка:

Більше від AWS Машинне навчання