今日のすべてのビジネスでは、顧客の行動を理解することが最優先事項です。 顧客が購入する理由と方法についての洞察を得ることが、収益の増加に役立ちます。 しかし、顧客を失うこと(顧客離れとも呼ばれる)は常にリスクであり、顧客が離れる理由についての洞察は、収益と利益を維持するためにも同様に重要です。 機械学習(ML)は洞察に役立ちますが、これまでは、解約を予測するモデルを構築するためにMLの専門家が必要でした。その欠如は、顧客を維持するための企業による洞察主導の行動を遅らせる可能性があります。
この投稿では、ビジネスアナリストが顧客チャーンMLモデルを構築する方法を紹介します。 Amazon SageMaker キャンバス、コードは必要ありません。 Canvasは、ビジネスアナリストに視覚的なポイントアンドクリックインターフェイスを提供します。これにより、MLの経験やコードをXNUMX行も記述しなくても、モデルを構築して正確なML予測を自分で生成できます。
ソリューションの概要
この投稿では、携帯電話事業者のマーケティング部門でマーケティングアナリストの役割を担っています。 私たちは、解約のリスクがある可能性のある顧客を特定する任務を負っています。 サービスの使用状況やその他の顧客行動データにアクセスできます。このデータが、顧客が離れる理由を説明するのに役立つかどうかを知りたいと考えています。 チャーンを説明する要因を特定できれば、ターゲットを絞った保持キャンペーンを実行するなど、予測される動作を変更するための修正アクションを実行できます。
これを行うには、CSVファイルにあるデータを使用します。このファイルには、顧客の使用状況とチャーンに関する情報が含まれています。 Canvasを使用して、次の手順を実行します。
- チャーンデータセットをからインポートします Amazon シンプル ストレージ サービス (Amazon S3)。
- チャーンモデルをトレーニングして構築します。
- モデルの結果を分析します。
- モデルに対して予測をテストします。
データセットには、 合成データセット 電気通信携帯電話会社から。 このサンプルデータセットには5,000のレコードが含まれており、各レコードは21の属性を使用して顧客プロファイルを記述しています。 属性は次のとおりです。
- 都道府県 – XNUMX文字の略語で示される、顧客が居住する米国の州。 たとえば、OHまたはNJ
- アカウントの長さ –このアカウントがアクティブであった日数
- 市外局番 –顧客の電話番号のXNUMX桁の市外局番
- 電話 –残りのXNUMX桁の電話番号
- 国際計画 –顧客が国際電話プランを持っているかどうか(はい/いいえ)
- VMailプラン –顧客がボイスメール機能を持っているかどうか(はい/いいえ)
- VMailメッセージ –XNUMXか月あたりのボイスメールメッセージの平均数
- 日分 –XNUMX日の間に使用された通話時間の合計数
- デイコール –XNUMX日の間に発信された通話の総数
- 日額 –日中の通話料金
- イブミンズ, イブコール, イブチャージ –イブニングコールの請求コスト
- 夜の分, ナイトコール, 夜間料金 –夜間通話の請求コスト
- 国際分, 国際電話, インターナショナルチャージ –国際電話の請求コスト
- CustServコール –カスタマーサービスにかけられた電話の数
- チャーン? –顧客がサービスを終了したかどうか(true / false)
最後の属性、 Churn?
、は、MLモデルで予測する属性です。 ターゲット属性はバイナリです。つまり、モデルは出力をXNUMXつのカテゴリのいずれかとして予測します(True
or False
).
前提条件
のクラウド管理者 AWSアカウント 次の前提条件を完了するには、適切な権限が必要です。
- を展開する アマゾンセージメーカー 手順については、 AmazonSageMakerドメインにオンボード.
- キャンバスを展開します。 手順については、を参照してください。 Amazon SageMaker Canvasのセットアップと管理(IT管理者向け).
- Canvasのクロスオリジンリソースシェアリング(CORS)ポリシーを構成します。 手順については、を参照してください。 ユーザーがローカルファイルをアップロードできるようにする.
顧客解約モデルを作成する
まず、ダウンロードしましょう チャーンデータセット ファイルを確認して、すべてのデータがそこにあることを確認します。 次に、次の手順を実行します。
- にサインインする AWSマネジメントコンソール、Canvasにアクセスするための適切な権限を持つアカウントを使用します。
- Canvasコンソールにログインします。
ここで、データセットを管理し、モデルを作成できます。
- 選択する インポート.
- 選択する アップロード 選択
churn.csv
ファイルにソフトウェアを指定する必要があります。 - 選択する インポート日 Canvasにアップロードします。
インポートプロセスには約10秒かかります(これはデータセットのサイズによって異なります)。 完了すると、データセットが Ready
状態。
- データセットの最初の100行をプレビューするには、目のアイコンの上にマウスを置きます。
データセットのプレビューが表示されます。 ここで、データが正しいことを確認できます。
インポートしたデータセットの準備ができたことを確認したら、モデルを作成します。
- 選択する 新型.
- churn.csvデータセットを選択し、 データセットを選択.
次に、ビルドモデルプロセスを構成します。
- ターゲット列を選択してください
Churn?
コラム。
モデルタイプ、Canvasはこの場合、モデルタイプを自動的に推奨します 2カテゴリ予測 (データサイエンティストが二項分類と呼ぶもの)。 可能な予測値はXNUMXつしかないため、これはユースケースに適しています。 True
or False
、したがって、Canvasが作成した推奨事項を使用します。
ここで、いくつかの仮定を検証します。 ターゲット列が他の列によって予測できるかどうかをすばやく確認したいと思います。 モデルの推定精度と列への影響(ターゲット列を予測する際の各列の推定重要度)をすばやく確認できます。.
- 21列すべてを選択し、 プレビューモデル.
この機能は、データセットのサブセットとモデリングでの2回のパスのみを使用します。 このユースケースでは、プレビューモデルの構築に約XNUMX分かかります。
次のスクリーンショットに示すように、 Phone
& State
列が予測に与える影響ははるかに少なくなります。 テキスト入力を削除するときは注意が必要です。テキスト入力には、予測に寄与する重要な個別のカテゴリ機能が含まれている可能性があるためです。 ここで、電話番号はアカウント番号と同等であり、他のアカウントの解約の可能性を予測する上で価値がなく、顧客の状態はモデルにあまり影響を与えません。
- これらの列には主要な機能の重要性がないため、これらの列を削除します。
- 削除した後
Phone
&State
列、プレビューをもう一度実行してみましょう。
次のスクリーンショットに示すように、モデルの精度は0.1%向上しました。 プレビューモデルの推定精度は95.9%で、最も影響の大きい列は次のとおりです。 Night Calls
, Eve Mins
, Night Charge
。 これにより、どの列がモデルのパフォーマンスに最も影響を与えるかについての洞察が得られます。 ここでは、特徴選択を行う際に注意する必要があります。これは、単一の特徴がモデルの結果に非常に影響を与える場合、それが ターゲットリーク、およびこの機能は予測時には使用できません。 この場合、非常に類似した影響を示した列はほとんどないため、モデルの作成を続けます。
CanvasにはXNUMXつのビルドオプションがあります。
- 標準ビルド –によって供給される最適化されたプロセスから最高のモデルを構築します AutoML; 速度は最高の精度と交換されます
- クイックビルド –標準のビルドと比較して、わずかな時間でモデルをビルドします。 潜在的な精度は速度と交換されます。
- この投稿では、 標準ビルド 最高のモデルが必要であり、結果を待つために追加の時間を費やすことをいとわないためです。
ビルドプロセスには2〜4時間かかる場合があります。 この間、Canvasは何百もの候補パイプラインをテストし、提示するのに最適なモデルを選択します。 次のスクリーンショットでは、予想されるビルド時間と進行状況を確認できます。
モデルのパフォーマンスを評価する
モデル構築プロセスが完了すると、モデルは97.9%の確率でチャーンを予測しました。 これは問題ないように見えますが、アナリストとして、モデルを信頼してそれに基づいて決定を下せるかどうかをさらに深く掘り下げたいと考えています。 に 得点 タブをクリックすると、結果にマッピングされた予測の視覚的なプロットを確認できます。 これにより、モデルをより深く理解することができます。
Canvasは、データセットをトレーニングセットとテストセットに分割します。 トレーニングデータセットは、Canvasがモデルを構築するために使用するデータです。 テストセットは、モデルが新しいデータで適切に機能するかどうかを確認するために使用されます。 次のスクリーンショットのSankeyダイアグラムは、モデルがテストセットでどのように実行されたかを示しています。 詳細については、を参照してください。 AmazonSageMakerCanvasでのモデルのパフォーマンスの評価.
サンキーダイアグラムに表示されているものを超えてより詳細な洞察を得るために、ビジネスアナリストは 混同行列 彼らのビジネスソリューションの分析。 たとえば、モデルが誤った予測を行う可能性をよりよく理解したいと考えています。 これはサンキーダイアグラムで確認できますが、より多くの洞察が必要なため、 高度な指標。 混同行列が表示されます。これは、ポジティブクラスに固有の次の値を使用して、モデルのパフォーマンスを視覚的な形式で表示します。実際にチャーンするかどうかに基づいて測定しているため、ポジティブクラスは次のようになります。 True
この例では:
- 真陽性(TP) –の数
True
正しく予測された結果True
- トゥルーネガティブ(TN) –の数
False
正しく予測された結果False
- 誤検知(FP) –の数
False
誤って予測された結果True
- フォールスネガティブ(FN) –の数
True
誤って予測された結果False
このマトリックスチャートを使用して、モデルがどれだけ正確であるかだけでなく、モデルが間違っている場合、それがどのくらいの頻度で、どのように間違っているかを判断できます。
高度なメトリックは見栄えがします。 モデルの結果を信頼できます。 誤検知と誤検知は非常に少なくなっています。 これらは、モデルがデータセット内の顧客が解約すると実際には解約しない(誤検知)場合、またはモデルが顧客が解約すると実際に解約する(誤検知)場合です。 どちらかの数値が高いと、モデルを使用して決定を下すことができるかどうかについて、より深く考えるようになる可能性があります。
に戻りましょう 概要 タブ、各列の影響を確認します。 この情報は、マーケティングチームが顧客離れを減らすための行動を取ることにつながる洞察を得るのに役立ちます。 たとえば、低いものと高いものの両方を見ることができます CustServ Calls
解約の可能性を高めます。 マーケティングチームは、これらの学習に基づいて顧客離れを防ぐための行動を取ることができます。 例としては、顧客サービスへの問い合わせを減らすためにWebサイトで詳細なFAQを作成したり、FAQで顧客との教育キャンペーンを実行してエンゲージメントを維持したりすることが含まれます。
私たちのモデルはかなり正確に見えます。 でインタラクティブな予測を直接実行できます 予測する タブ、バッチまたは単一(リアルタイム)予測。 この例では、特定の列の値にいくつかの変更を加え、リアルタイムの予測を実行しました。 Canvasは、信頼水準とともに予測結果を表示します。
次の使用法を持つ既存の顧客がいるとしましょう。 Night Mins
40とは Eve Mins
は40です。予測を実行できます。モデルは、この顧客が解約する93.2%の信頼スコアを返します(True
)。 この顧客を維持するために、プロモーション割引を提供することを選択する場合があります。
次の使用法を持つ既存の顧客がいるとしましょう。 Night Mins
40とは Eve Mins
は40です。予測を実行できます。モデルは、この顧客が解約する93.2%の信頼スコアを返します(True
)。 この顧客を維持するために、プロモーション割引を提供することを選択する場合があります。
XNUMXつの予測を実行することは、個々のwhat-if分析に最適ですが、一度に多くのレコードに対して予測を実行する必要もあります。 キャンバスはすることができます バッチ予測を実行する、これにより、大規模な予測を実行できます。
まとめ
この投稿では、ビジネスアナリストがサンプルデータを使用してSageMakerCanvasで顧客離れモデルを作成する方法を示しました。 Canvasを使用すると、ビジネスアナリストは、コードなし、視覚的なポイントアンドクリックインターフェイスを使用して、正確なMLモデルを作成し、予測を生成できます。 マーケティング分析では、この情報を使用して、ターゲットを絞った保持キャンペーンを実行し、新しいキャンペーン戦略をより迅速にテストできるようになり、顧客離れを減らすことができます。
アナリストは、データサイエンティストの同僚とモデルを共有することで、これを次のレベルに引き上げることができます。 データサイエンティストは、キャンバスモデルを次の場所で表示できます。 Amazon SageMakerスタジオ、Canvas AutoMLが行った選択を調査し、モデルの結果を検証し、数回クリックするだけでモデルを生産化することもできます。 これにより、MLベースの価値創造が加速され、改善された結果をより迅速にスケーリングできます。
Canvasの使用の詳細については、を参照してください。 構築、共有、デプロイ:ビジネスアナリストとデータサイエンティストがノーコードMLとAmazonSageMakerCanvasを使用して市場投入までの時間を短縮する方法。 コードなしのソリューションを使用したMLモデルの作成の詳細については、を参照してください。 Amazon SageMaker Canvasの発表–ビジネスアナリスト向けの視覚的でノーコードの機械学習機能.
著者について
ヘンリー・ロバリノ ニュージャージーを拠点とするAWSのソリューションアーキテクトです。 彼はクラウドと機械学習、そしてそれらが社会で果たすことができる役割に情熱を注いでいます。 彼は、お客様と協力してAWSクラウドを使用してビジネス目標を達成できるようにすることでこれを実現しています。 仕事以外では、ヘンリーが毛皮の娘アーリーと一緒に屋外を旅行したり探索したりしているのを見つけることができます。
チャオラン・ワン は、テキサス州ダラスを拠点とするAWSのソリューションアーキテクトです。 彼は、2016年にテキサス大学ダラス校をコンピューターサイエンスの修士号で卒業して以来、AWSで働いています。 Chaoranは、お客様がスケーラブルで安全で費用効果の高いアプリケーションを構築し、AWSクラウドでのビジネス上の課題を解決するためのソリューションを見つけるのに役立ちます。 仕事以外では、チャオランは家族とXNUMX匹の犬、ビウビウとココと過ごすのが大好きです。
- "
- 000
- 10
- 100
- 11
- 2016
- 7
- 9
- 私たちについて
- 加速する
- アクセス
- 正確な
- 行動
- NEW
- 管理人
- 管理者
- 高度な
- すべて
- Amazon
- 分析
- アナリスト
- 適切な
- 約
- AREA
- 属性
- 利用できます
- 平均
- AWS
- BEST
- 越えて
- 最大の
- 国境
- ビルド
- 建物
- 構築します
- ビジネス
- ビジネス
- 購入
- コール
- キャンペーン
- キャンペーン
- 取得することができます
- 候補者
- キャンバス
- カテゴリー
- 一定
- 課題
- 変化する
- チャージ
- 選択肢
- 選択する
- class
- 分類
- クラウド
- コード
- 同僚
- コラム
- 比べ
- コンピュータ
- コンピュータサイエンス
- 信頼
- 混乱
- 領事
- 含まれています
- 続ける
- コスト効率の良い
- 可能性
- 作ります
- 作成
- 創造
- 顧客
- 顧客サービス
- Customers
- ダラス
- データ
- データサイエンティスト
- より深い
- 遅らせる
- によっては
- 展開します
- 詳細な
- 決定する
- 直接に
- ディスプレイ
- そうではありません
- 教育
- 婚約
- エンジニアリング
- 推定
- 例
- 既存の
- 予想される
- 体験
- 専門家
- 探る
- 目
- 要因
- 家族
- よくある質問
- スピーディー
- 速いです
- 特徴
- 特徴
- 終わり
- 名
- フォロー中
- 形式でアーカイブしたプロジェクトを保存します.
- 生成する
- 目標
- 良い
- 素晴らしい
- 最大
- 成長する
- 持って
- 助けます
- ことができます
- こちら
- ハイ
- 認定条件
- HTTPS
- 何百
- ICON
- 識別する
- 識別
- 影響
- 衝撃的
- 重要性
- 重要
- 改善されました
- include
- 増える
- 増加した
- 個人
- 情報
- 洞察
- 相互作用的
- インタフェース
- 世界全体
- IT
- つながる
- 主要な
- LEARN
- 学習
- コメントを残す
- レベル
- LINE
- ローカル
- 機械
- 機械学習
- 製
- 主要な
- 作成
- 管理します
- 管理
- 管理する
- マーケティング
- マスターの
- マトリックス
- 意味
- メトリック
- マインド
- ML
- モバイル
- 携帯電話
- モデル
- 他には?
- 最も
- 負
- 数
- 番号
- オファー
- 最適化
- オプション
- オプション
- その他
- 屋外で
- 情熱的な
- パフォーマンス
- プレイ
- ポリシー
- 正の
- 可能
- 潜在的な
- 予測する
- 予測
- 予測
- 現在
- かなり
- プレビュー
- 主要な
- プロセス
- プロフィール
- 利益
- プロモーション
- 昇進の
- 提供します
- は、大阪で
- クイック
- への
- お勧めする
- 記録
- 記録
- 減らします
- 残り
- 除去
- の提出が必要です
- リソースを追加する。
- 結果
- 収益
- 収入
- レビュー
- リスク
- ラン
- ランニング
- ド電源のデ
- 規模
- 科学
- 科学者
- 科学者たち
- 秒
- 安全に
- サービス
- セッションに
- シェアする
- シェアリング
- 同様の
- 簡単な拡張で
- サイズ
- So
- 社会
- 固体
- 溶液
- ソリューション
- 解決する
- 一部
- スピード
- 過ごす
- 支出
- 標準
- 都道府県
- Status:
- ストレージ利用料
- 作戦
- 取得
- ターゲット
- チーム
- 電気通信
- test
- テスト
- テキサス州
- 時間
- 今日
- top
- トレーニング
- 旅行
- 信頼
- TX
- わかる
- 大学
- us
- つかいます
- users
- 値
- 確認する
- 詳しく見る
- ボイス
- ウェブサイト
- この試験は
- 何ですか
- かどうか
- 誰
- Wikipedia
- 仕事
- ワーキング
- でしょう