Извлечение детальных настроений в тексте с помощью Amazon Comprehend Targeted Sentiment

Переиздано Платоном

Читают: 0

Amazon Comprehend — это служба обработки естественного языка (NLP), которая использует машинное обучение (ML) для извлечения информации из текста. Будучи полностью управляемым сервисом, Amazon Comprehend не требует знаний в области машинного обучения и может масштабироваться до больших объемов данных. Amazon Comprehend предоставляет несколько различных API чтобы легко интегрировать NLP в ваши приложения. Вы можете просто вызвать API в своем приложении и указать местоположение исходного документа или текста. API-интерфейсы выводят объекты, ключевые фразы, тональность, классификацию документов и язык в удобном для вашего приложения или бизнеса формате.

API-интерфейсы анализа тональности, предоставляемые Amazon Comprehend, помогают компаниям определить тональность документа. Вы можете оценить общее настроение документа как положительное, отрицательное, нейтральное или смешанное. Однако, чтобы получить детализацию понимания настроений, связанных с конкретными продуктами или брендами, предприятиям приходилось использовать обходные пути, такие как разбиение текста на логические блоки и определение отношения, выраженного к конкретному продукту.

Чтобы упростить этот процесс, с сегодняшнего дня Amazon Comprehend запускает Целевое настроение функция анализа настроений. Это дает возможность идентифицировать группы упоминаний (совместные группы ссылок), соответствующие одному объекту или атрибуту реального мира, определять настроение, связанное с каждым упоминанием объекта, и обеспечивать классификацию объекта реального мира на основе заранее определенный список сущностей.

В этом посте представлен обзор того, как вы можете начать работу с целевыми настроениями Amazon Comprehend, демонстрируется, что вы можете делать с выходными данными, и рассматриваются три распространенных варианта использования целевых настроений.

Обзор решения

Ниже приведен пример целевого настроения:

«Спа» — это основной объект, определяемый как тип facility, и упоминается еще два раза, упоминается как местоимение «это». Targeted Sentiment API предоставляет отношение к каждому объекту. Позитивные настроения отмечены зеленым цветом, негативные — красным, а нейтральные — синим. Мы также можем определить, как отношение к курорту меняется на протяжении всего предложения. Мы углубимся в API позже в посте.

Эта возможность открывает несколько различных возможностей для бизнеса. Команды по маркетингу могут отслеживать отношение людей к своим брендам в социальных сетях с течением времени. Продавцы электронной коммерции могут понять, какие конкретные характеристики их продуктов были лучше и хуже всего восприняты покупателями. Операторы колл-центра могут использовать эту функцию для анализа расшифровок для решения проблем и мониторинга качества обслуживания клиентов. Рестораны, отели и другие организации индустрии гостеприимства могут использовать эту услугу, чтобы превратить широкие категории оценок в подробные описания хорошего и плохого опыта клиентов.

Примеры использования целевых настроений

API Targeted Sentiment в Amazon Comprehend принимает в качестве входных данных текстовые данные, такие как публикации в социальных сетях, обзоры приложений и транскрипции колл-центра. Затем он анализирует входные данные, используя мощь алгоритмов НЛП для автоматического извлечения настроений на уровне объекта. Ан организация — это текстовая ссылка на уникальное имя объекта реального мира, такого как люди, места и коммерческие объекты, в дополнение к точным ссылкам на меры, такие как даты и количества. Полный список поддерживаемых объектов см. Целевые сущности настроений.

Мы используем Targeted Sentiment API, чтобы включить следующие варианты использования:

Бизнес может определить те части опыта сотрудников/клиентов, которые приятны, и те, которые можно улучшить.
Контакт-центры и группы обслуживания клиентов могут анализировать расшифровки разговоров по телефону или журналы чатов, чтобы определить эффективность обучения операторов, а также детали разговора, такие как конкретные реакции клиента, а также фразы или слова, которые использовались для получения такого ответа.
Владельцы продукта и разработчики UI/UX могут определить функции своего продукта, которые нравятся пользователям, и части, требующие улучшения. Это может помочь в обсуждении дорожной карты продукта и определении приоритетов.

Следующая диаграмма иллюстрирует целевой процесс тональности:

В этом посте мы демонстрируем этот процесс, используя следующие три примера обзоров:

Образец 1: Обзор бизнеса и продукта – «Мне очень нравится, насколько толстая куртка. Я ношу большую куртку, потому что у меня широкие плечи, и именно такую я заказала, и она идеально туда подходит. Я почти чувствую, как он раздувается из груди вниз. Я думал, что воспользуюсь завязками в нижней части куртки, чтобы застегнуть ее и затянуть, но они не работают. Куртка кажется очень громоздкой».
Образец 2: транскрипция контакт-центра – «Привет, на моей кредитной карте есть блокировка от мошенничества, не могли бы вы снять ее для меня. Моя кредитная карта постоянно помечается как мошенническая. Это очень раздражает, каждый раз, когда я использую его, мне постоянно отказывают. Я собираюсь аннулировать карту, если это повторится».
Образец 3: Опрос отзывов работодателей – «Я рад, что руководство повышает квалификацию команды. Но инструктор плохо освоил основы. Руководству следует уделять больше должной осмотрительности уровню навыков каждого для будущих сессий».

Подготовьте данные

Для начала загрузите образцы файлов, содержащие текст примера, используя Интерфейс командной строки AWS (AWS CLI), выполнив следующие команды:

aws s3 cp s3://aws-blogs-artifacts-public/artifacts/ML-8148/ts-sample-data.zip .

Создать Простой сервис хранения Amazon (Amazon S3), разархивируйте папку и загрузите папку, содержащую три примера файлов. Убедитесь, что вы используете один и тот же регион.

Теперь вы можете получить доступ к трем примерам текстовых файлов в корзине S3.

Создайте вакансию в Amazon Comprehend

После загрузки файлов в корзину S3 выполните следующие действия:

На консоли Amazon Comprehend выберите Работа по анализу в навигационной панели.
Выберите Создать работу.
Что касается Имя, введите название вашей работы.
Что касается Тип анализа, выберите Целевое настроение.
Под Входные данные, введите местоположение Amazon S3 ts-образец данных папку.
Что касается Формат ввода, выберите Один документ в файле.

Вы можете изменить эту конфигурацию, если ваши данные находятся в одном файле, разделенном строками.

Под Расположение выхода, введите местоположение Amazon S3, в котором вы хотите сохранить выходные данные задания.
Под Права доступа, Для Роль IAM, выберите существующий Управление идентификацией и доступом AWS (IAM) или создайте роль с правами доступа к корзине S3.
Оставьте другие параметры по умолчанию и выберите Создать работу.

После того, как вы приступите к работе, вы можете просмотреть сведения о своей работе. Общее время выполнения задания зависит от размера входных данных.

Когда работа будет завершена, под Результат, выберите ссылку на расположение выходных данных.

Здесь вы можете найти сжатый выходной файл.

Загрузите и распакуйте файл.

Теперь вы можете проверить выходные файлы для каждого примера текста. Откройте файлы в предпочитаемом вами текстовом редакторе, чтобы просмотреть структуру ответа API. Мы опишем это более подробно в следующем разделе.

Структура ответа API

Targeted Sentiment API предоставляет простой способ использования результатов ваших заданий. Он обеспечивает логическую группировку обнаруженных сущностей (групп сущностей) вместе с тональностью для каждой сущности. Ниже приведены некоторые определения полей, которые находятся в ответе:

Юридические лица – Важные части документа. Например, Person, Place, Date, Foodили Taste.
Упоминания – Ссылки или упоминания объекта в документе. Это могут быть местоимения или нарицательные существительные, такие как «это», «его», «книга» и так далее. Они упорядочены по расположению (смещению) в документе.
описательныйуказательупоминания – Индекс в Mentions что дает наилучшее описание группы сущностей. Например, «ABC Hotel» вместо «hotel», «it» или других упоминаний нарицательных существительных.
Групповой балл – Уверенность в том, что все сущности, упомянутые в группе, связаны с одной и той же сущностью (например, «я», «я» и «я сам» относятся к одному человеку).
Текст – Текст в документе, который изображает объект
Тип – Описание того, что изображает сущность.
Счет – Уверенность модели в том, что это релевантная сущность.
УпоминаниеНастроение – Фактическое настроение, найденное для упоминания.
Настроение – Строковое значение positive, neutral, negativeили mixed.
SentimentScore – Уверенность модели для каждого возможного настроения.
Начальное смещение – Смещение в тексте документа, где начинается упоминание.
КонецСмещение – Смещение в тексте документа, где упоминание заканчивается.

Чтобы продемонстрировать это визуально, давайте возьмем выходные данные третьего варианта использования, опроса отзывов работодателей, и пройдемся по группам сущностей, которые представляют сотрудника, заполняющего опрос, руководство и инструктора.

Давайте сначала посмотрим на все упоминания группы со-референтных сущностей, связанных с «Я» (сотрудник, пишущий ответ) и место упоминания в тексте. DescriptiveMentionIndex представляет индексы упоминаний сущности, которые лучше всего отображают группу совпадающих сущностей (в данном случае I):

{ "DescriptiveMentionIndex": [ 0 ], "Mentions": [ { "BeginOffset": 0, "EndOffset": 1, "Score": 0.999997, "GroupScore": 1, "Text": "I", "Type": "PERSON", "MentionSentiment": { "Sentiment": "NEUTRAL", "SentimentScore": { "Mixed": 0, "Negative": 0, "Neutral": 1, "Positive": 0 } } } ] }

Следующая группа сущностей содержит все упоминания группы совпадающих сущностей, связанных с управлением, а также ее местоположение в тексте. DescriptiveMentionIndex представляет индексы упоминаний сущности, которые лучше всего отображают группу совпадающих сущностей (в данном случае management). В этом примере следует наблюдать сдвиг настроений в сторону руководства. Вы можете использовать эти данные, чтобы сделать вывод, какие части действий руководства были восприняты как положительные, а какие — как отрицательные, и поэтому их можно улучшить.

{ "DescriptiveMentionIndex": [ 0, 1 ], "Mentions": [ { "BeginOffset": 9, "EndOffset": 19, "Score": 0.999984, "GroupScore": 1, "Text": "management", "Type": "ORGANIZATION", "MentionSentiment": { "Sentiment": "POSITIVE", "SentimentScore": { "Mixed": 0, "Negative": 0, "Neutral": 0, "Positive": 1 } } }, { "BeginOffset": 103, "EndOffset": 113, "Score": 0.999998, "GroupScore": 0.999896, "Text": "Management", "Type": "ORGANIZATION", "MentionSentiment": { "Sentiment": "NEGATIVE", "SentimentScore": { "Mixed": 0.000149, "Negative": 0.990075, "Neutral": 0.000001, "Positive": 0.009775 } } } ] }

В заключение давайте проследим за всеми упоминаниями инструктора и локации в тексте. DescriptiveMentionIndex представляет индексы упоминаний сущности, которые лучше всего отображают группу совпадающих сущностей (в данном случае instructor):

{ "DescriptiveMentionIndex": [ 0 ], "Mentions": [ { "BeginOffset": 52, "EndOffset": 62, "Score": 0.999996, "GroupScore": 1, "Text": "instructor", "Type": "PERSON", "MentionSentiment": { "Sentiment": "NEGATIVE", "SentimentScore": { "Mixed": 0, "Negative": 0.999997, "Neutral": 0.000001, "Positive": 0.000001 } } } ] }

Эталонная архитектура

Вы можете применить целевое настроение ко многим сценариям и вариантам использования для повышения ценности бизнеса, например:

Определяйте эффективность маркетинговых кампаний и запуска новых функций, определяя объекты и упоминания, которые содержат наибольшее количество положительных или отрицательных отзывов.
Вывод запроса, чтобы определить, какие объекты и упоминания относятся к соответствующему объекту (положительные, отрицательные или нейтральные).
Анализируйте настроения на протяжении всего жизненного цикла взаимодействия с клиентами в контакт-центрах, чтобы продемонстрировать эффективность изменений процессов или обучения.

На следующей диаграмме показан сквозной процесс:

Заключение

Понимание взаимодействий и отзывов, которые организации получают от клиентов об их продуктах и услугах, остается критически важным для разработки более качественных продуктов и клиентского опыта. Таким образом, для получения лучших результатов требуются более подробные сведения.

В этом посте мы представили несколько примеров того, как использование этих подробных сведений может помочь организациям улучшить продукты, качество обслуживания клиентов и обучение, а также стимулировать и подтверждать положительные качества. Существует множество вариантов использования в разных отраслях, где вы можете экспериментировать и получать пользу от целевых настроений.

Мы рекомендуем вам попробовать эту новую функцию в своих сценариях использования. Для получения дополнительной информации и начала работы см. Целевое настроение.

Об авторах

Радж Патхак является архитектором решений и техническим консультантом для клиентов из списка Fortune 50 и среднего размера FSI (банковское дело, страхование, рынки капитала) в Канаде и США. Радж специализируется на машинном обучении с приложениями для извлечения документов, преобразования контакт-центра и компьютерного зрения.

Санджив Пулапака является старшим архитектором решений в команде Fed Civilian SA в Amazon Web Services (AWS). Он тесно сотрудничает с заказчиками в создании и проектировании критически важных решений. Санджив имеет обширный опыт руководства, разработки и внедрения высокоэффективных технологических решений, отвечающих разнообразным потребностям бизнеса в различных секторах, включая коммерческие, федеральные, государственные и местные органы власти. Он имеет степень бакалавра инженерных наук Индийского технологического института и степень магистра делового администрирования Университета Нотр-Дам.

Отметка времени: 9 марта 2022

Отметка времени: Декабрь 4, 2023

Обучайте гигантские модели с почти линейным масштабированием, используя параллелизм сегментированных данных в Amazon SageMaker.

Исходный кластер:

Машинное обучение AWS

Исходный узел: 1734207

Отметка времени: 31 октября, 2022

Переиздано Платоном

Ускорьте реагирование на стихийные бедствия с помощью компьютерного зрения для спутниковых изображений с помощью Amazon SageMaker и Amazon Augmented AI.

Начало работы с встраиванием текста в Amazon Titan | Веб-сервисы Amazon

Поддержка нового расширенного формата данных в Amazon Kendra

Расширьте возможности своего предложения SaaS с помощью рабочей среды для анализа данных на базе Amazon SageMaker Studio.

Повысьте точность поиска с помощью проверки орфографии в Amazon Kendra

Добивайтесь быстрой окупаемости бизнес-результатов благодаря более быстрому обучению модели машинного обучения с помощью Amazon SageMaker Canvas

Как Getir сократила продолжительность обучения модели на 90 % с помощью Amazon SageMaker и AWS Batch | Веб-сервисы Amazon

Обучайте гигантские модели с почти линейным масштабированием, используя параллелизм сегментированных данных в Amazon SageMaker.

О Нас

Вертикальный поиск и AI

Платформа

Оставайтесь на связи

Учетная запись