使用 Amazon SageMaker Canvas 情感分析和文本分析模型,使用无代码机器学习从产品评论中获取见解 | 亚马逊网络服务

使用 Amazon SageMaker Canvas 情感分析和文本分析模型,使用无代码机器学习从产品评论中获取见解 | 亚马逊网络服务

根据 Gartner公司,85% 的软件购买者相信在线评论和个人推荐一样。 客户通过多种渠道提供有关他们购买的产品的反馈和评论,包括评论网站、供应商网站、销售电话、社交媒体等。 跨多个渠道的客户评论量不断增加的问题在于,公司使用传统方法处理数据并从中获得有意义的见解可能具有挑战性。 机器学习 (ML) 可以分析大量产品评论并识别模式、情绪和讨论的主题。 借助这些信息,公司可以更好地了解客户偏好、痛点和满意度。 他们还可以利用这些信息来改进产品和服务、识别趋势并采取推动业务增长的战略行动。 然而,对于机器学习从业者、数据科学家或人工智能 (AI) 开发人员等缺乏资源的公司来说,实施机器学习可能是一个挑战。 随着新 亚马逊 SageMaker 画布 功能,业务分析师现在可以使用 ML 从产品评论中获取见解。

SageMaker Canvas 专为业务分析师使用的功能需求而设计 AWS 无代码 ML 用于表格数据的临时分析。 SageMaker Canvas 是一种可视化的点击式服务,允许业务分析师生成准确的 ML 预测,而无需编写一行代码或不需要 ML 专业知识。 您可以使用模型以交互方式进行预测并对批量数据集进行批量评分。 SageMaker Canvas 提供完全托管的即用型 AI 模型和自定义模型解决方案。 对于常见的 ML 用例,您可以使用现成的 AI 模型根据数据生成预测,而无需进行任何模型训练。 对于特定于您的业务领域的 ML 用例,您可以使用自己的数据训练 ML 模型以进行自定义预测。

在这篇文章中,我们演示如何使用即用型情感分析模型和自定义文本分析模型从产品评论中获取见解。 在此用例中,我们有一组综合的产品评论,我们希望分析这些评论的情绪并按产品类型对评论进行分类,以便轻松绘制模式和趋势,从而帮助业务利益相关者做出更明智的决策。 首先,我们描述使用即用型情感分析模型确定评论情感的步骤。 然后,我们将引导您完成训练文本分析模型以按产品类型对评论进行分类的过程。 接下来,我们解释如何检查训练后的模型的性能。 最后,我们解释如何使用经过训练的模型来执行预测。

情感分析是一种自然语言处理 (NLP) 即用型模型,可分析文本中的情感。 可以针对单行或批量预测运行情感分析。 每行文本的预测情绪可以是积极的、消极的、混合的或中性的。

文本分析允许您使用自定义模型将文本分为两个或多个类别。 在这篇文章中,我们希望根据产品类型对产品评论进行分类。 要训​​练文本分析自定义模型,您只需提供一个由 CSV 文件中的文本和相关类别组成的数据集。 该数据集至少需要两个类别,每个类别需要 125 行文本。 训练模型后,您可以在使用模型进行预测之前检查模型的性能并根据需要重新训练模型。

先决条件

完成以下先决条件:

  1. 有一个 AWS账户.
  2. 成立 SageMaker 画布.
  3. 下载 产品评论数据集示例:
    • sample_product_reviews.csv – 包含 2,000 条综合产品评论,用于情感分析和文本分析预测。
    • sample_product_reviews_training.csv – 包含600条综合产品评论和三个产品类别,用于文本分析模型训练。

情绪分析

首先,您可以通过完成以下步骤,使用情绪分析来确定产品评论的情绪。

  1. 点击 SageMaker 控制台,单击“ 帆布 在导航窗格中,然后单击 打开画布 打开 SageMaker Canvas 应用程序。
  2. 点击 即用型 在导航窗格中,然后单击 情绪分析.
  3. 点击 批量预测,然后点击 创建数据集。
  4. 提供一个 数据集名称 并点击 创建。
  5. 点击 从计算机中选择文件 导入 sample_product_reviews.csv 数据集。
  6. 点击 创建数据集 并查看数据。 第一列包含评论并用于情感分析。 第二列包含评论 ID,仅供参考。
  7. 点击 创建数据集 完成数据上传过程。
  8. 选择用于预测的数据集 查看,选择 sample_product_reviews.csv 依次 生成预测。 
  9. 批量预测完成后,单击 查看 查看预测。

情感分析步骤

情绪和置信度列分别提供情绪和置信度分数。 置信度分数是 0 到 100% 之间的统计值,显示正确预测情绪的概率。

  1. 点击 下载CSV 将结果下载到您的计算机。

文本分析

在本节中,我们将完成使用自定义模型执行文本分析的步骤:导入数据、训练模型,然后进行预测。

导入数据

首先导入训练数据集。 完成以下步骤:

  1. On 即用型 页面中,单击 创建自定义模型
  2. 针对 型号名称,输入名称(例如, Product Reviews Analysis)。 点击 文本分析, 然后点击 创建。
  3. 点击 选择 标签,点击 创建数据集 导入 sample_product_reviews_training.csv 数据集。
  4. 提供一个 数据集名称 并点击 创建。
  5. 点击 创建数据集 并查看数据。 训练数据集包含描述产品类别的第三列,目标列包含三种产品:书籍、视频和音乐。
  6. 点击 创建数据集 完成数据上传过程。
  7. 点击 选择数据集 页面,选择 sample_product_reviews_training.csv 并点击 选择数据集.

分类步骤

训练模型

接下来,您配置模型以开始训练过程。

  1. 点击 建立 选项卡,在 目标列 下拉菜单,点击 product_category 作为训练目标。
  2. 点击 product_review 作为来源。
  3. 点击 快速建立 开始模型训练。

有关快速构建和标准构建之间的差异的更多信息,请参阅 构建自定义模型.

模型训练完成后,您可以在使用模型进行预测之前检查模型的性能。

  1. 点击 分析 选项卡中,将显示模型的置信度得分。 置信度分数表明模型对其预测正确性的确定程度。 上 概述 选项卡,查看每个类别的表现。
  2. 点击 进球 查看模型准确性见解。
  3. 点击 高级指标 审查 混淆矩阵和 F1 分数.

作出预测

要使用自定义模型进行预测,请完成以下步骤:

  1. 点击 预测 标签,点击 批量预测,然后点击 用户手册.
  2. 单击相同的数据集, sample_product_reviews.csv,您之前用于情绪分析的,然后单击 生成预测。
  3. 批量预测完成后,单击 查看 查看预测。

对于自定义模型预测,SageMaker Canvas 需要一些时间来部署模型以供初始使用。 如果闲置 15 分钟,SageMaker Canvas 会自动取消配置模型,以节省成本。

Prediction (类别)和 Confidence 列分别提供预测的产品类别和置信度分数。

  1. 突出显示已完成的作业,选择三个点并单击 下载 将结果下载到您的计算机。

清理

点击 退出 在导航窗格中注销 SageMaker Canvas 应用程序以停止消耗 画布会话时间 并释放所有资源。

结论

在这篇文章中,我们演示了如何使用 亚马逊 SageMaker 画布 无需机器学习专业知识即可从产品评论中获取见解。 首先,您使用现成的情绪分析模型来确定产品评论的情绪。 接下来,您使用文本分析通过快速构建过程来训练自定义模型。 最后,您使用经过训练的模型将产品评论分类为产品类别。 所有这些都无需编写一行代码。 我们建议您使用标准构建过程重复文本分析过程,以比较模型结果和预测置信度。


作者简介

使用 Amazon SageMaker Canvas 情感分析和文本分析模型,使用无代码机器学习从产品评论中获取见解 |亚马逊网络服务柏拉图区块链数据智能。垂直搜索。人工智能。 加文·萨图尔 是 Amazon Web Services 的首席解决方案架构师。 他与企业客户合作构建战略性的、架构良好的解决方案,并对自动化充满热情。 工作之余,他喜欢家庭时光、网球、烹饪和旅行。

使用 Amazon SageMaker Canvas 情感分析和文本分析模型,使用无代码机器学习从产品评论中获取见解 |亚马逊网络服务柏拉图区块链数据智能。垂直搜索。人工智能。陈莱斯 是位于加利福尼亚州欧文市的 Amazon Web Services 的高级解决方案架构师。 Les 热衷于与企业客户合作采用和实施技术解决方案,唯一的重点是推动客户业务成果。 他的专业知识涵盖应用程序架构、DevOps、无服务器和机器学习。

使用 Amazon SageMaker Canvas 情感分析和文本分析模型,使用无代码机器学习从产品评论中获取见解 |亚马逊网络服务柏拉图区块链数据智能。垂直搜索。人工智能。阿奇布·比基亚 是位于南加州的 Amazon Web Services 的解决方案架构师。 他帮助零售领域的企业客户加速项目并实施新技术。 Aaqib 的重点领域包括机器学习、无服务器、分析和通信服务

时间戳记:

更多来自 AWS机器学习