У недавньому минулому використання машинного навчання (ML) для прогнозування, особливо для даних у формі тексту та зображень, вимагало глибоких знань ML для створення та налаштування моделей глибокого навчання. Сьогодні ML став більш доступним для будь-якого користувача, який хоче використовувати моделі ML для створення цінності для бізнесу. с Canvas Amazon SageMaker, ви можете створювати прогнози для ряду різних типів даних, окрім даних у вигляді таблиці чи часових рядів, без написання жодного рядка коду. Ці можливості включають попередньо підготовлені моделі для типів даних зображення, тексту та документа.
У цій публікації ми обговорюємо, як можна використовувати попередньо навчені моделі для отримання прогнозів для підтримуваних типів даних, окрім табличних даних.
Текстові дані
SageMaker Canvas надає візуальне середовище без коду для створення, навчання та розгортання моделей ML. Для завдань обробки природної мови (NLP) SageMaker Canvas бездоганно інтегрується з «Амазонка» щоб дозволити вам виконувати такі ключові можливості НЛП, як виявлення мови, розпізнавання сутностей, аналіз настроїв, моделювання теми тощо. Інтеграція усуває необхідність будь-якого кодування чи обробки даних для використання надійних моделей NLP Amazon Comprehend. Ви просто надаєте свої текстові дані та вибираєте одну з чотирьох широко використовуваних можливостей: аналіз настроїв, визначення мови, вилучення об’єктів і виявлення особистої інформації. Для кожного сценарію ви можете використовувати користувальницький інтерфейс для перевірки та використання пакетного прогнозування для вибору даних, які зберігаються в Служба простого зберігання Amazon (Amazon S3).
Аналіз почуттів
Завдяки аналізу настроїв SageMaker Canvas дозволяє аналізувати настрої введеного тексту. Він може визначити, чи є загальний настрій позитивним, негативним, змішаним чи нейтральним, як показано на наступному знімку екрана. Це корисно в таких ситуаціях, як аналіз відгуків про продукт. Наприклад, текст «Мені подобається цей продукт, він чудовий!» буде класифіковано SageMaker Canvas як позитивне, тоді як «Цей продукт жахливий, я шкодую, що купив його» буде позначено як негативне.
Вилучення сутностей
SageMaker Canvas може аналізувати текст і автоматично виявляти згадані в ньому сутності. Коли документ надсилається до SageMaker Canvas для аналізу, він визначає людей, організації, місцезнаходження, дати, кількість та інші сутності в тексті. Ця можливість вилучення об’єктів дає змогу швидко отримати інформацію про ключових людей, місця та деталі, які обговорюються в документах. Список підтримуваних об’єктів див Суб'єкти.
Виявлення мови
SageMaker Canvas також може визначати домінуючу мову тексту за допомогою Amazon Comprehend. Він аналізує текст, щоб визначити основну мову, і надає оцінки достовірності для виявленої домінантної мови, але не вказує розподіл у відсотках для багатомовних документів. Щоб отримати найкращі результати з довгими документами кількома мовами, розділіть текст на менші частини та об’єднайте результати, щоб оцінити відсоток мов. Він найкраще працює з принаймні 20 символами тексту.
Виявлення персональної інформації
Ви також можете захистити конфіденційні дані за допомогою виявлення особистої інформації за допомогою SageMaker Canvas. Він може аналізувати текстові документи, щоб автоматично виявляти ідентифікаційну інформацію (PII), дозволяючи знаходити такі конфіденційні дані, як імена, адреси, дати народження, номери телефонів, адреси електронної пошти тощо. Він аналізує документи розміром до 100 КБ і надає оцінку достовірності для кожної виявленої сутності, щоб ви могли переглядати та вибірково редагувати найбільш конфіденційну інформацію. Список виявлених об’єктів див Виявлення ідентифікаційної інформації.
Дані зображення
SageMaker Canvas надає візуальний безкодовий інтерфейс, який спрощує використання можливостей комп’ютерного зору завдяки інтеграції з Amazon Rekognition для аналізу зображення. Наприклад, ви можете завантажити набір даних зображень, використовувати Amazon Rekognition для виявлення об’єктів і сцен, а також виконати виявлення тексту для вирішення широкого спектру випадків використання. Візуальний інтерфейс та інтеграція Amazon Rekognition дають змогу не розробникам використовувати передові методи комп’ютерного зору.
Виявлення об'єктів на зображеннях
SageMaker Canvas використовує Amazon Rekognition для виявлення міток (об’єктів) на зображенні. Ви можете завантажити зображення з інтерфейсу користувача SageMaker Canvas або скористатися Пакетне прогнозування вкладку для вибору зображень, що зберігаються у відрі S3. Як показано в наступному прикладі, він може витягувати об’єкти на зображенні, наприклад вежу з годинником, автобус, будівлі тощо. Ви можете використовувати інтерфейс для пошуку результатів передбачення та їх сортування.
Виявлення тексту в зображеннях
Вилучення тексту із зображень є дуже поширеним випадком використання. Тепер ви можете легко виконати це завдання на SageMaker Canvas без коду. Текст витягується як рядки, як показано на наступному знімку екрана. Короткі фрази на зображенні класифікуються разом і ідентифікуються як фраза.
Ви можете виконати пакетне прогнозування, завантаживши набір зображень, видобувши всі зображення в одному пакетному завданні та завантаживши результати як файл CSV. Це рішення корисне, коли ви хочете витягти та виявити текст на зображеннях.
Дані документа
SageMaker Canvas пропонує різноманітні готові до використання рішення, які вирішують ваші повсякденні потреби в розумінні документів. Ці рішення працюють на основі Текст Amazon. Щоб переглянути всі доступні параметри документів, виберіть Готові до використання моделі на панелі навігації та фільтруйте за документи, як показано на наступному знімку екрана.
Аналіз документів
Аналіз документів аналізує документи та форми на наявність зв’язків між виявленим текстом. Операції повертають чотири категорії вилучення документів: необроблений текст, форми, таблиці та підписи. Здатність рішення розуміти структуру документа дає вам додаткову гнучкість у типі даних, які ви хочете отримати з документів. На наступному знімку екрана показано, як виглядає виявлення таблиці.
Це рішення здатне розуміти макети складних документів, що корисно, коли вам потрібно отримати певну інформацію у своїх документах.
Аналіз документів, що посвідчують особу
Це рішення призначене для аналізу таких документів, як ідентифікаційні картки, водійські права чи інші подібні форми ідентифікації. Для кожного документа, що посвідчує особу, повертатиметься така інформація, як по батькові, округ і місце народження, а також його індивідуальна оцінка достовірності, як показано на знімку екрана нижче.
Існує можливість пакетного прогнозування, за допомогою якого можна масово завантажувати набори ідентифікаційних документів і обробляти їх як пакетне завдання. Це забезпечує швидкий і бездоганний спосіб трансформувати деталі ідентифікаційного документа в пари ключ-значення, які можна використовувати для подальших процесів, таких як аналіз даних.
Аналіз витрат
Аналіз витрат призначений для аналізу витратних документів, таких як рахунки-фактури та квитанції. На наступному знімку екрана показано, як виглядає отримана інформація.
Результати повертаються як поля зведення та поля позиції. Поля зведення – це пари ключ-значення, отримані з документа, і містять такі ключі, як Загальний підсумок, Термін оплати та Податок. Поля позицій стосуються даних, структурованих у вигляді таблиці в документі. Це корисно для отримання інформації з документа, зберігаючи його макет.
Запити на документи
Запити документів призначені для того, щоб ви ставили запитання щодо своїх документів. Це чудове рішення для використання, якщо у вас є багатосторінкові документи, і ви хочете отримати дуже конкретні відповіді з ваших документів. Нижче наведено приклад типів запитань, які ви можете поставити, і того, як виглядають отримані відповіді.
Рішення забезпечує простий інтерфейс для взаємодії з документами. Це корисно, коли ви хочете отримати конкретні деталі у великих документах.
Висновок
SageMaker Canvas забезпечує середовище без коду для легкого використання машинного навчання різних типів даних, таких як текст, зображення та документи. Візуальний інтерфейс та інтеграція з такими сервісами AWS, як Amazon Comprehend, Amazon Rekognition і Amazon Texttract, усуває потребу в кодуванні та розробці даних. Ви можете аналізувати текст на настрої, сутності, мови та ідентифікаційну інформацію. Виявлення зображень, об’єктів і тексту дає змогу використовувати комп’ютерний зір. Нарешті, аналіз документів може витягувати текст, зберігаючи його макет для подальших процесів. Готові до використання рішення в SageMaker Canvas дають змогу використовувати передові методи машинного навчання для генерування розуміння на основі структурованих і неструктурованих даних. Якщо вам цікаво використовувати інструменти без коду з готовими моделями ML, спробуйте SageMaker Canvas сьогодні. Для отримання додаткової інформації див Початок роботи з Amazon SageMaker Canvas.
Про авторів
Джулія Анг є архітектором рішень із Сінгапуру. Вона працювала з клієнтами в різних галузях, від охорони здоров’я та державного сектору до цифрового бізнесу, щоб прийняти рішення відповідно до їхніх бізнес-потреб. Вона також підтримує клієнтів у Південно-Східній Азії та за її межами у використанні штучного інтелекту та машинного навчання в бізнесі. Поза роботою їй подобається пізнавати світ, подорожуючи та займаючись творчістю.
Локе Джун Кай є спеціалізованим архітектором рішень для AI/ML із Сінгапуру. Він працює з клієнтами в АСЕАН, щоб розробити масштабні рішення машинного навчання в AWS. Джун Кай є прихильником інструментів машинного навчання з низьким кодом і без коду. У вільний час любить бути на природі.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/use-machine-learning-without-writing-a-single-line-of-code-with-amazon-sagemaker-canvas/
- : має
- :є
- $UP
- 100
- 20
- 360
- 385
- 400
- 7
- a
- Здатний
- МЕНЮ
- доступною
- За
- точність
- через
- адреса
- адреси
- прийняти
- просунутий
- адвокат
- сукупність
- AI
- AI / ML
- ВСІ
- дозволяти
- Дозволити
- дозволяє
- Також
- Amazon
- «Амазонка»
- Amazon Rekognition
- Amazon SageMaker
- Canvas Amazon SageMaker
- Текст Amazon
- Amazon Web Services
- серед
- an
- аналіз
- аналізувати
- аналізи
- Аналізуючи
- та
- Відповіді
- будь-який
- ЕСТЬ
- AS
- Асейна
- Азія
- запитати
- At
- автоматично
- доступний
- AWS
- заснований
- BE
- ставати
- було
- буття
- КРАЩЕ
- За
- народження
- обидва
- Створюємо
- будівель
- bus
- бізнес
- підприємства
- але
- Купівля
- by
- CAN
- полотно
- можливості
- можливості
- Cards
- випадок
- випадків
- категорії
- символи
- Вибирати
- класифікований
- годинник
- код
- Кодування
- загальний
- зазвичай
- комплекс
- осягнути
- комп'ютер
- Комп'ютерне бачення
- довіра
- містити
- графство
- створювати
- створення
- Креатив
- клієнт
- Клієнти
- дані
- аналіз даних
- Дати
- з дня на день
- глибокий
- глибоке навчання
- розгортання
- призначений
- деталі
- виявляти
- виявлено
- Виявлення
- Визначати
- різний
- цифровий
- обговорювати
- обговорювалися
- do
- документ
- документація
- Ні
- домінуючий
- скачати
- кожен
- простота
- Усуває
- дозволяє
- залучення
- Машинобудування
- юридичні особи
- суб'єкта
- Навколишнє середовище
- особливо
- оцінити
- приклад
- обширний
- додатково
- витяг
- видобуток
- Поля
- філе
- фільтрувати
- в кінці кінців
- Гнучкість
- після
- для
- форма
- форми
- чотири
- від
- Отримувати
- породжувати
- отримати
- дає
- великий
- збруя
- Мати
- має
- he
- здоров'я
- корисний
- його
- Як
- HTML
- HTTPS
- i
- Ідентифікація
- ідентифікований
- ідентифікувати
- Особистість
- if
- зображення
- зображень
- in
- включати
- вказувати
- індивідуальний
- інформація
- вхід
- розуміння
- Інтеграція
- Інтеграція
- інтеграція
- взаємодіяти
- зацікавлений
- інтерфейс
- в
- рахунки
- IT
- пунктів
- ЙОГО
- робота
- просто
- ключ
- ключі
- знання
- етикетки
- мова
- мови
- великий
- макет
- вивчення
- найменш
- ліцензії
- як
- Лінія
- список
- місць
- Довго
- подивитися
- виглядає як
- ВИГЛЯДИ
- любов
- машина
- навчання за допомогою машини
- головний
- зробити
- РОБОТИ
- згаданий
- Середній
- змішаний
- ML
- моделювання
- Моделі
- більше
- найбільш
- множинний
- ім'я
- Імена
- рідний
- Природний
- Обробка природних мов
- природа
- навігація
- Необхідність
- потреби
- негативний
- Нейтральний
- nlp
- немає
- зараз
- номер
- номера
- об'єкт
- Виявлення об'єктів
- об'єкти
- of
- Пропозиції
- on
- операції
- варіант
- Опції
- or
- організації
- Інше
- з
- поза
- загальний
- пар
- pane
- Минуле
- Люди
- відсоток
- Виконувати
- персонал
- Особисто
- телефон
- фрази
- частин
- місце
- місця
- plato
- Інформація про дані Платона
- PlatoData
- позитивний
- це можливо
- пошта
- Харчування
- прогноз
- Прогнози
- консервування
- процес
- процеси
- обробка
- Product
- Відгуки про товар
- захист
- забезпечувати
- забезпечує
- громадськість
- запити
- питань
- Швидко
- швидко
- діапазон
- Сировина
- надходження
- останній
- визнання
- послатися
- жалкувати
- Відносини
- вимагається
- результати
- утримує
- повертати
- огляд
- Відгуки
- міцний
- мудрець
- шкала
- сценарій
- сцени
- рахунок
- безшовні
- плавно
- Пошук
- сектор
- чутливий
- посланий
- настрій
- Серія
- Послуги
- комплект
- набори
- вона
- Короткий
- показаний
- Signatures
- аналогічний
- простий
- просто
- Сінгапур
- один
- ситуацій
- менше
- So
- рішення
- Рішення
- ВИРІШИТИ
- на південний схід
- Південно-Східна Азія
- спеціаліст
- конкретний
- розкол
- почалася
- зберігання
- зберігати
- просто
- структура
- структурований
- такі
- РЕЗЮМЕ
- Підтриманий
- Підтримуючий
- таблиця
- Завдання
- завдання
- методи
- тест
- текст
- Що
- Команда
- світ
- їх
- Їх
- Ці
- це
- через
- час
- Часовий ряд
- до
- сьогодні
- разом
- інструменти
- тема
- Башта
- Навчання
- Перетворення
- Подорож
- намагатися
- настройка
- тип
- Типи
- ui
- розуміти
- розуміння
- Завантаження
- використання
- використання випадку
- використовуваний
- користувач
- використовує
- використання
- значення
- різноманітність
- різний
- дуже
- вид
- бачення
- хотіти
- хоче
- шлях..
- we
- Web
- веб-сервіси
- Що
- коли
- в той час як
- який
- в той час як
- ВООЗ
- широкий
- Широкий діапазон
- волі
- з
- в
- без
- Work
- працював
- працює
- світ
- б
- лист
- Ти
- вашу
- зефірнет