Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

ایمیزون کی اسپیسز کو ڈیٹا سورس کے طور پر استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔

بہت ساری ایپلی کیشنز جن کا مقصد صنعتی آلات کی دیکھ بھال، تجارتی نگرانی، فلیٹ مینجمنٹ، اور روٹ آپٹیمائزیشن کے لیے ہوتا ہے وہ اوپن سورس کیسنڈرا APIs اور ڈرائیورز کا استعمال کرتے ہوئے تیز رفتاری اور کم تاخیر پر ڈیٹا پر کارروائی کرنے کے لیے بنائے جاتے ہیں۔ کیسینڈرا ٹیبلز کا خود انتظام کرنا وقت طلب اور مہنگا ہو سکتا ہے۔ Amazon Keyspaces (Apache Cassandra کے لیے) اضافی انفراسٹرکچر کا انتظام کیے بغیر آپ کو AWS کلاؤڈ میں کیسینڈرا ٹیبلز کو سیٹ اپ، محفوظ اور اسکیل کرنے دیتا ہے۔

اس پوسٹ میں، ہم آپ کو اعلیٰ سطح پر Amazon Keyspaces کا استعمال کرتے ہوئے ٹریننگ مشین لرننگ (ML) ماڈلز سے متعلق AWS سروسز سے آگاہ کریں گے، اور Amazon Keyspaces سے ڈیٹا داخل کرنے کے لیے مرحلہ وار ہدایات فراہم کریں گے۔ ایمیزون سیج میکر اور ایک ایسے ماڈل کی تربیت کریں جس کا استعمال مخصوص کسٹمر سیگمنٹیشن استعمال کیس کے لیے کیا جا سکے۔

AWS کے پاس کاروباروں کو کلاؤڈ میں ML کے عمل کو لاگو کرنے میں مدد کرنے کے لیے متعدد خدمات ہیں۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

AWS ML Stack میں تین پرتیں ہیں۔ درمیانی تہہ ہے۔ سیج میکر۔، جو ڈویلپرز، ڈیٹا سائنسدانوں، اور ML انجینئرز کو ML ماڈلز کو بڑے پیمانے پر بنانے، تربیت دینے اور تعینات کرنے کی صلاحیت فراہم کرتا ہے۔ یہ ML ورک فلو کے ہر قدم سے پیچیدگی کو دور کرتا ہے تاکہ آپ اپنے ML استعمال کے کیسز کو زیادہ آسانی سے تعینات کر سکیں۔ اس میں پیشن گوئی کی دیکھ بھال سے لے کر گاہک کے رویوں کی پیشن گوئی کرنے کے لیے کمپیوٹر ویژن تک کچھ بھی شامل ہے۔ صارفین SageMaker کے ساتھ ڈیٹا سائنسدانوں کی پیداواری صلاحیت میں 10 گنا تک بہتری حاصل کرتے ہیں۔

Apache Cassandra غیر ساختہ یا نیم ساختہ ڈیٹا کے ساتھ پڑھنے والے بھاری استعمال کے معاملات کے لیے ایک مقبول انتخاب ہے۔ مثال کے طور پر، کھانے کی ترسیل کا ایک مشہور کاروبار ڈیلیوری کے وقت کا تخمینہ لگاتا ہے، اور ایک خوردہ گاہک اپاچی کیسینڈرا ڈیٹا بیس میں پروڈکٹ کیٹلاگ کی معلومات کو اکثر استعمال کر سکتا ہے۔ ایمیزون کی اسپیسز ایک قابل توسیع، انتہائی دستیاب اور منظم سرور لیس Apache Cassandra–مطابق ڈیٹا بیس سروس ہے۔ آپ کو سرورز کی فراہمی، پیچ یا انتظام کرنے کی ضرورت نہیں ہے، اور آپ کو سافٹ ویئر کو انسٹال، برقرار رکھنے یا چلانے کی ضرورت نہیں ہے۔ میزیں خود بخود اوپر اور نیچے کی پیمائش کر سکتی ہیں، اور آپ صرف ان وسائل کی ادائیگی کرتے ہیں جو آپ استعمال کرتے ہیں۔ Amazon Keyspaces آپ کو اسی Cassandra ایپلیکیشن کوڈ اور ڈویلپر ٹولز کا استعمال کرتے ہوئے AWS پر اپنے Cassandra کام کے بوجھ چلانے دیتا ہے جو آپ آج استعمال کرتے ہیں۔

سیج میکر کا ایک سوٹ فراہم کرتا ہے۔ بلٹ ان الگورتھم ڈیٹا سائنسدانوں اور ایم ایل پریکٹیشنرز کو ایم ایل ماڈلز کی تیزی سے تربیت اور تعیناتی شروع کرنے میں مدد کرنے کے لیے۔ اس پوسٹ میں، ہم آپ کو دکھائیں گے کہ کس طرح ایک خوردہ گاہک Keyspaces ڈیٹا بیس میں کسٹمر کی خریداری کی تاریخ کا استعمال کر سکتا ہے اور مارکیٹنگ کی مہمات کے لیے مختلف کسٹمر سیگمنٹس کو ہدف بنا سکتا ہے۔

K کا مطلب ہے۔ ایک غیر زیر نگرانی سیکھنے کا الگورتھم ہے۔ یہ اعداد و شمار کے اندر مجرد گروپ بندیوں کو تلاش کرنے کی کوشش کرتا ہے، جہاں ایک گروپ کے ممبران ایک دوسرے سے زیادہ سے زیادہ ملتے جلتے اور دوسرے گروپوں کے ممبروں سے جتنا ممکن ہو مختلف ہوتے ہیں۔ آپ ان صفات کی وضاحت کرتے ہیں جو آپ الگورتھم سے مماثلت کا تعین کرنے کے لیے استعمال کرنا چاہتے ہیں۔ سیج میکر کا ایک ترمیم شدہ ورژن استعمال کرتا ہے۔ ویب اسکیل کے کا مطلب ہے کلسٹرنگ الگورتھم. جیسا کہ الگورتھم کے اصل ورژن کے مقابلے میں، SageMaker کا استعمال کردہ ورژن زیادہ درست ہے۔ تاہم، اصل الگورتھم کی طرح، یہ بڑے پیمانے پر ڈیٹا سیٹس تک پیمانہ کرتا ہے اور تربیت کے وقت میں بہتری فراہم کرتا ہے۔

حل جائزہ

ہدایات یہ فرض کرتی ہیں کہ آپ کوڈ کو چلانے کے لیے SageMaker اسٹوڈیو استعمال کر رہے ہوں گے۔ منسلک کوڈ پر اشتراک کیا گیا ہے AWS نمونہ GitHub. لیب میں دی گئی ہدایات پر عمل کرتے ہوئے، آپ درج ذیل کام کر سکتے ہیں:

  • ضروری انحصار انسٹال کریں۔
  • Amazon Keyspaces سے جڑیں، ایک ٹیبل بنائیں، اور سیمپل ڈیٹا نگسٹ کریں۔
  • Amazon Keyspaces میں ڈیٹا کا استعمال کرتے ہوئے درجہ بندی کا ML ماڈل بنائیں۔
  • ماڈل کے نتائج دریافت کریں۔
  • نئے بنائے گئے وسائل کو صاف کریں۔

ایک بار مکمل ہونے کے بعد، آپ نے سیج میکر کو Amazon Keyspaces کے ساتھ ضم کر لیا ہو گا تاکہ ML ماڈلز کو تربیت دی جا سکے جیسا کہ درج ذیل تصویر میں دکھایا گیا ہے۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

اب آپ اس کی پیروی کرسکتے ہیں مرحلہ وار ہدایات اس پوسٹ میں SageMaker کا استعمال کرتے ہوئے Amazon Keyspaces میں ذخیرہ شدہ خام ڈیٹا اور اس طرح ML پروسیسنگ کے لیے حاصل کردہ ڈیٹا کو ہضم کرنے کے لیے۔

شرائط

پہلے، سیج میکر پر جائیں۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

اگلا، اگر یہ پہلی بار ہے کہ آپ SageMaker استعمال کر رہے ہیں، منتخب کریں۔ شروع کریں.

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

اگلا، منتخب کریں سیج میکر ڈومین سیٹ اپ کریں۔.

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

اگلا، نام کے ساتھ ایک نیا صارف پروفائل بنائیں - sagemakeruser، اور منتخب کریں نیا کردار بنائیں میں ڈیفالٹ ایگزیکیوشن رول ذیلی سیکشن

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

اگلا، پاپ اپ ہونے والی اسکرین میں، کوئی بھی منتخب کریں۔ ایمیزون سادہ اسٹوریج سروس (ایمیزون S3) بالٹی، اور کردار بنائیں کو منتخب کریں۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

اس کردار کو درج ذیل مراحل میں استعمال کیا جائے گا تاکہ SageMaker کو کردار سے عارضی اسناد کا استعمال کرتے ہوئے Keyspaces Table تک رسائی حاصل کر سکے۔ اس سے نوٹ بک میں صارف نام اور پاس ورڈ ذخیرہ کرنے کی ضرورت ختم ہو جاتی ہے۔

اگلا، سے وابستہ کردار کو بازیافت کریں۔ sagemakeruser جو خلاصہ سیکشن سے پچھلے مرحلے میں بنایا گیا تھا۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

پھر، پر جائیں AWS کنسول اور اوپر دیکھو AWS شناخت اور رسائی کا انتظام (IAM)۔ IAM کے اندر، رولز پر جائیں۔ رولز کے اندر، پچھلے مرحلے میں شناخت کیے گئے ایگزیکیوشن رول کی تلاش کریں۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

اگلا، پچھلے مرحلے میں شناخت کردہ کردار کو منتخب کریں اور اجازتیں شامل کریں کو منتخب کریں۔ ظاہر ہونے والے ڈراپ ڈاؤن میں، ان لائن پالیسی بنائیں کو منتخب کریں۔ سیج میکر آپ کو رسائی کی ایک دانے دار سطح فراہم کرنے دیتا ہے جو اس بات پر پابندی لگاتا ہے کہ صارف/ایپلی کیشن کاروباری ضروریات کی بنیاد پر کون سے اعمال انجام دے سکتا ہے۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

پھر، JSON ٹیب کو منتخب کریں اور Github کے نوٹ سیکشن سے پالیسی کاپی کریں۔ صفحہ. یہ پالیسی SageMaker نوٹ بک کو Keyspaces سے منسلک ہونے اور مزید کارروائی کے لیے ڈیٹا بازیافت کرنے کی اجازت دیتی ہے۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

پھر، دوبارہ اور ڈراپ ڈاؤن سے اجازتیں شامل کریں کو منتخب کریں، اور اٹیچ پالیسی کو منتخب کریں۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

AmazonKeyspacesFullAccess پالیسی تلاش کریں، اور مماثل نتائج کے ساتھ والے چیک باکس کو منتخب کریں، اور منسلک پالیسیوں کو منتخب کریں۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

تصدیق کریں کہ اجازت کی پالیسیوں کے سیکشن میں شامل ہے۔ AmazonS3FullAccess, AmazonSageMakerFullAccess, AmazonKeyspacesFullAccessکے ساتھ ساتھ نئی شامل کردہ ان لائن پالیسی۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

اگلا، AWS کنسول کا استعمال کرتے ہوئے سیج میکر اسٹوڈیو پر جائیں اور سیج میکر اسٹوڈیو کو منتخب کریں۔ وہاں پہنچنے کے بعد، لانچ ایپ کو منتخب کریں اور اسٹوڈیو کو منتخب کریں۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

نوٹ بک واک تھرو

SageMaker نوٹ بک سے Keyspaces سے جڑنے کا ترجیحی طریقہ استعمال کرنا ہے۔ AWS دستخطی ورژن 4 عمل (SigV4) کی بنیاد پر عارضی اسناد تصدیق کے لیے اس منظر نامے میں، ہمیں Keyspaces کی اسناد بنانے یا ذخیرہ کرنے کی ضرورت نہیں ہے اور SigV4 پلگ ان کے ساتھ تصدیق کرنے کے لیے اسناد کا استعمال کر سکتے ہیں۔ عارضی حفاظتی اسناد ایک رسائی کلید ID اور ایک خفیہ رسائی کلید پر مشتمل ہوتی ہیں۔ تاہم، ان میں ایک حفاظتی ٹوکن بھی شامل ہے جو اس بات کی نشاندہی کرتا ہے کہ اسناد کی میعاد کب ختم ہوتی ہے۔ اس پوسٹ میں، ہم ایک IAM رول بنائیں گے اور عارضی حفاظتی اسناد تیار کریں گے۔

سب سے پہلے، ہم ایک ڈرائیور (cassandra-sigv4) انسٹال کرتے ہیں۔ یہ ڈرائیور آپ کو AWS Signature Version 4 Process (SigV4) کا استعمال کرتے ہوئے اپنی API درخواستوں میں تصدیقی معلومات شامل کرنے کے قابل بناتا ہے۔ پلگ ان کا استعمال کرتے ہوئے، آپ IAM صارفین اور کرداروں کا استعمال کرتے ہوئے Amazon Keyspaces (Apache Cassandra کے لیے) تک رسائی کے لیے صارفین اور ایپلیکیشنز کو مختصر مدت کے اسناد فراہم کر سکتے ہیں۔ اس کے بعد، آپ اضافی پیکیج پر انحصار کے ساتھ ایک مطلوبہ سرٹیفکیٹ درآمد کریں گے۔ آخر میں، آپ نوٹ بک کو Keyspaces سے بات کرنے کا کردار سنبھالنے کی اجازت دیں گے۔

# Install missing packages and import dependencies
# Installing Cassandra SigV4
%pip install cassandra-sigv4 # Get Security certificate
!curl https://certs.secureserver.net/repository/sf-class2-root.crt -O # Import
from sagemaker import get_execution_role
from cassandra.cluster import Cluster
from ssl import SSLContext, PROTOCOL_TLSv1_2, CERT_REQUIRED
from cassandra_sigv4.auth import SigV4AuthProvider
import boto3 import pandas as pd
from pandas import DataFrame import csv
from cassandra import ConsistencyLevel
from datetime import datetime
import time
from datetime import timedelta import pandas as pd
import datetime as dt
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.preprocessing import MinMaxScaler # Getting credentials from the role
client = boto3.client("sts") # Get notebook Role
role = get_execution_role()
role_info = {"RoleArn": role, "RoleSessionName": "session1"}
print(role_info) credentials = client.assume_role(**role_info)

اس کے بعد، Amazon Keyspaces سے جڑیں اور کنکشن کی توثیق کرنے کے لیے Keyspaces سے Pandas DataFrame میں سسٹم کا ڈیٹا پڑھیں۔

# Connect to Cassandra Database from SageMaker Notebook # using temporary credentials from the Role.
session = boto3.session.Session() ###
### You can also pass specific credentials to the session
###
#session = boto3.session.Session(
# aws_access_key_id=credentials["Credentials"]["AccessKeyId"],
# aws_secret_access_key=credentials["Credentials"]["SecretAccessKey"],
# aws_session_token=credentials["Credentials"]["SessionToken"],
#) region_name = session.region_name # Set Context
ssl_context = SSLContext(PROTOCOL_TLSv1_2)
ssl_context.load_verify_locations("sf-class2-root.crt")
ssl_context.verify_mode = CERT_REQUIRED auth_provider = SigV4AuthProvider(session)
keyspaces_host = "cassandra." + region_name + ".amazonaws.com" cluster = Cluster([keyspaces_host], ssl_context=ssl_context, auth_provider=auth_provider, port=9142)
session = cluster.connect() # Read data from Keyspaces system table. # Keyspaces is serverless DB so you don't have to create Keyspaces DB ahead of time.
r = session.execute("select * from system_schema.keyspaces") # Read Keyspaces row into Panda DataFrame
df = DataFrame(r)
print(df)

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

اگلا، خام ڈیٹا سیٹ پر تربیت کے لیے ڈیٹا تیار کریں۔ اس پوسٹ سے وابستہ python نوٹ بک میں، ڈاؤن لوڈ کردہ ریٹیل ڈیٹا سیٹ استعمال کریں۔ یہاں، اور اس پر کارروائی کریں۔ ڈیٹا سیٹ کے پیش نظر ہمارا کاروباری مقصد مخصوص میٹرک کال RFM استعمال کرنے والے صارفین کو کلسٹر کرنا ہے۔ RFM ماڈل تین مقداری عوامل پر مبنی ہے:

  • Recency: ایک گاہک نے حال ہی میں کتنی خریداری کی ہے۔
  • تعدد: ایک صارف کتنی بار خریداری کرتا ہے۔
  • مانیٹری ویلیو: ایک صارف خریداری پر کتنی رقم خرچ کرتا ہے۔

RFM تجزیہ عددی طور پر ان تینوں زمروں میں سے ہر ایک میں صارف کی درجہ بندی کرتا ہے، عام طور پر 1 سے 5 کے پیمانے پر (جتنا زیادہ نمبر ہوگا، نتیجہ اتنا ہی بہتر ہوگا)۔ "بہترین" کسٹمر کو ہر زمرے میں ٹاپ سکور ملے گا۔ ہم پانڈا کے Quantile-based discretization function (qcut) کا استعمال کریں گے۔ اس سے اقدار کو برابر سائز کی بالٹیوں میں تقسیم کرنے میں مدد ملے گی یا نمونے کی مقدار کی بنیاد پر۔

# Prepare Data
r = session.execute("select * from " + keyspaces_schema + ".online_retail") df = DataFrame(r)
df.head(100) df.count()
df["description"].nunique()
df["totalprice"] = df["quantity"] * df["price"]
df.groupby("invoice").agg({"totalprice": "sum"}).head() df.groupby("description").agg({"price": "max"}).sort_values("price", ascending=False).head()
df.sort_values("price", ascending=False).head()
df["country"].value_counts().head()
df.groupby("country").agg({"totalprice": "sum"}).sort_values("totalprice", ascending=False).head() returned = df[df["invoice"].str.contains("C", na=False)]
returned.sort_values("quantity", ascending=True).head() df.isnull().sum()
df.dropna(inplace=True)
df.isnull().sum()
df.dropna(inplace=True)
df.isnull().sum()
df.describe([0.05, 0.01, 0.25, 0.50, 0.75, 0.80, 0.90, 0.95, 0.99]).T
df.drop(df.loc[df["customer_id"] == ""].index, inplace=True) # Recency Metric
import datetime as dt today_date = dt.date(2011, 12, 9)
df["customer_id"] = df["customer_id"].astype(int) # create get the most recent invoice for each customer
temp_df = df.groupby("customer_id").agg({"invoice_date": "max"})
temp_df["invoice_date"] = temp_df["invoice_date"].astype(str)
temp_df["invoice_date"] = pd.to_datetime(temp_df["invoice_date"]).dt.date
temp_df["Recency"] = (today_date - temp_df["invoice_date"]).dt.days
recency_df = temp_df.drop(columns=["invoice_date"])
recency_df.head() # Frequency Metric
temp_df = df.groupby(["customer_id", "invoice"]).agg({"invoice": "count"})
freq_df = temp_df.groupby("customer_id").agg({"invoice": "count"})
freq_df.rename(columns={"invoice": "Frequency"}, inplace=True) # Monetary Metric
monetary_df = df.groupby("customer_id").agg({"totalprice": "sum"})
monetary_df.rename(columns={"totalprice": "Monetary"}, inplace=True)
rfm = pd.concat([recency_df, freq_df, monetary_df], axis=1) df = rfm
df["RecencyScore"] = pd.qcut(df["Recency"], 5, labels=[5, 4, 3, 2, 1])
df["FrequencyScore"] = pd.qcut(df["Frequency"].rank(method="first"), 5, labels=[1, 2, 3, 4, 5])
df["Monetary"] = df["Monetary"].astype(int)
df["MonetaryScore"] = pd.qcut(df["Monetary"], 5, labels=[1, 2, 3, 4, 5])
df["RFM_SCORE"] = ( df["RecencyScore"].astype(str) + df["FrequencyScore"].astype(str) + df["MonetaryScore"].astype(str)
)
seg_map = { r"[1-2][1-2]": "Hibernating", r"[1-2][3-4]": "At Risk", r"[1-2]5": "Can't Loose", r"3[1-2]": "About to Sleep", r"33": "Need Attention", r"[3-4][4-5]": "Loyal Customers", r"41": "Promising", r"51": "New Customers", r"[4-5][2-3]": "Potential Loyalists", r"5[4-5]": "Champions",
} df["Segment"] = df["RecencyScore"].astype(str) + rfm["FrequencyScore"].astype(str)
df["Segment"] = df["Segment"].replace(seg_map, regex=True)
df.head()
rfm = df.loc[:, "Recency":"Monetary"]
df.groupby("customer_id").agg({"Segment": "sum"}).head()

اس مثال میں، ہم کی اسپیس ٹیبل سے ریکارڈ پڑھنے کے لیے CQL استعمال کرتے ہیں۔ کچھ ایم ایل استعمال کے معاملات میں، آپ کو ایک ہی کی اسپیس ٹیبل سے ایک ہی ڈیٹا کو متعدد بار پڑھنے کی ضرورت پڑسکتی ہے۔ اس صورت میں، ہم تجویز کریں گے کہ آپ اپنے ڈیٹا کو Amazon S3 بالٹی میں محفوظ کریں تاکہ اضافی اخراجات سے بچا جا سکے۔ لاگت آئےایمیزون کی اسپیسز سے پڑھ رہا ہے۔ آپ کے منظر نامے پر منحصر ہے، آپ بھی استعمال کر سکتے ہیں۔ ایمیزون ای ایم آر کرنے کے لئے inges سیج میکر میں ایک بہت بڑی ایمیزون S3 فائل۔

## Optional Code to save Python DataFrame to S3
from io import StringIO # python3 (or BytesIO for python2) smclient = boto3.Session().client('sagemaker')
sess = sagemaker.Session()
bucket = sess.default_bucket() # Set a default S3 bucket
print(bucket) csv_buffer = StringIO()
df.to_csv(csv_buffer)
s3_resource = boto3.resource('s3')
s3_resource.Object(bucket, ‘out/saved_online_retail.csv').put(Body=csv_buffer.getvalue())

اگلا، ہم KMeans الگورتھم کا استعمال کرتے ہوئے ایک ML ماڈل کو تربیت دیتے ہیں اور اس بات کو یقینی بناتے ہیں کہ کلسٹرز بنائے گئے ہیں۔ اس مخصوص منظر نامے میں، آپ دیکھیں گے کہ بنائے گئے کلسٹر پرنٹ کیے گئے ہیں، جو یہ ظاہر کرتے ہیں کہ خام ڈیٹا سیٹ میں موجود صارفین کو ڈیٹا سیٹ میں مختلف خصوصیات کی بنیاد پر ایک ساتھ گروپ کیا گیا ہے۔ اس کلسٹر کی معلومات کو ٹارگٹڈ مارکیٹنگ مہمات کے لیے استعمال کیا جا سکتا ہے۔

# Training sc = MinMaxScaler((0, 1))
df = sc.fit_transform(rfm) # Clustering
kmeans = KMeans(n_clusters=6).fit(df) # Result
segment = kmeans.labels_ # Visualize the clusters
import matplotlib.pyplot as plt final_df = pd.DataFrame({"customer_id": rfm.index, "Segment": segment})
bucket_data = final_df.groupby("Segment").agg({"customer_id": "count"}).head()
index_data = final_df.groupby("Segment").agg({"Segment": "max"}).head()
index_data["Segment"] = index_data["Segment"].astype(int)
dataFrame = pd.DataFrame(data=bucket_data["customer_id"], index=index_data["Segment"])
dataFrame.rename(columns={"customer_id": "Total Customers"}).plot.bar( rot=70, title="RFM clustering"
)
# dataFrame.plot.bar(rot=70, title="RFM clustering");
plt.show(block=True);

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عی

(اختیاری) اس کے بعد، ہم ان کسٹمر سیگمنٹس کو محفوظ کرتے ہیں جن کی شناخت ایم ایل ماڈل کے ذریعے کی گئی ہے ٹارگٹڈ مارکیٹنگ کے لیے Amazon Keyspaces ٹیبل پر۔ بیچ کا کام اس ڈیٹا کو پڑھ سکتا ہے اور مخصوص طبقات میں صارفین کے لیے ہدفی مہم چلا سکتا ہے۔

# Create ml_clustering_results table to store results createTable = """CREATE TABLE IF NOT EXISTS %s.ml_clustering_results ( run_id text, segment int, total_customers int, run_date date, PRIMARY KEY (run_id, segment)); """
cr = session.execute(createTable % keyspaces_schema)
time.sleep(20)
print("Table 'ml_clustering_results' created") insert_ml = ( "INSERT INTO " + keyspaces_schema + '.ml_clustering_results' + '("run_id","segment","total_customers","run_date") ' + 'VALUES (?,?,?,?); '
) prepared = session.prepare(insert_ml)
prepared.consistency_level = ConsistencyLevel.LOCAL_QUORUM run_id = "101"
dt = datetime.now() for ind in dataFrame.index: print(ind, dataFrame['customer_id'][ind]) r = session.execute( prepared, ( run_id, ind, dataFrame['customer_id'][ind], dt, ), )

آخر میں، ہم وسائل کو صاف کریں اضافی چارجز سے بچنے کے لیے اس ٹیوٹوریل کے دوران بنایا گیا۔

# Delete blog keyspace and tables
deleteKeyspace = "DROP KEYSPACE IF EXISTS blog"
dr = session.execute(deleteKeyspace) time.sleep(5)
print("Dropping %s keyspace. It may take a few seconds to a minute to complete deletion keyspace and table." % keyspaces_schema )

کی اسپیس اور ٹیبلز کو حذف کرنے میں چند سیکنڈ سے ایک منٹ کا وقت لگ سکتا ہے۔ جب آپ کسی کی اسپیس کو ڈیلیٹ کرتے ہیں تو کی اسپیس اور اس کے تمام ٹیبلز ڈیلیٹ ہوجاتے ہیں اور آپ ان سے چارجز وصول کرنا بند کردیتے ہیں۔

نتیجہ

اس پوسٹ نے آپ کو دکھایا کہ کس طرح ایمیزون کی اسپیسز سے کسٹمر ڈیٹا کو سیج میکر میں داخل کیا جائے اور ایک کلسٹرنگ ماڈل کو تربیت دی جائے جس سے آپ کو صارفین کو تقسیم کرنے کی اجازت ملتی ہے۔ آپ اس معلومات کو ٹارگٹڈ مارکیٹنگ کے لیے استعمال کر سکتے ہیں، اس طرح آپ کے کاروبار کے KPI کو بہت بہتر بنایا جا سکتا ہے۔ Amazon Keyspaces کے بارے میں مزید جاننے کے لیے، درج ذیل وسائل کا جائزہ لیں:


مصنفین کے بارے میں

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عیوادیم لیاخووچ سان فرانسسکو بے ایریا میں AWS میں ایک سینئر سولیوشن آرکیٹیکٹ ہے جو صارفین کو AWS میں منتقل ہونے میں مدد کرتا ہے۔ وہ بڑے اداروں سے لے کر چھوٹے سٹارٹ اپس تک کی تنظیموں کے ساتھ کام کر رہا ہے تاکہ ان کی اختراعات کی حمایت کی جا سکے۔ وہ صارفین کو AWS پر اسکیل ایبل، محفوظ، اور لاگت سے موثر حل تیار کرنے میں بھی مدد کر رہا ہے۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عیپارتھ پٹیل سان فرانسسکو بے ایریا میں AWS میں ایک حل آرکیٹیکٹ ہے۔ پارتھ گاہکوں کی رہنمائی کرتا ہے کہ وہ کلاؤڈ تک اپنے سفر کو تیز کریں اور AWS کلاؤڈ کو کامیابی سے اپنانے میں ان کی مدد کریں۔ وہ ایم ایل اور ایپلیکیشن ماڈرنائزیشن پر توجہ مرکوز کرتا ہے۔

Amazon Keyspaces کو ڈیٹا سورس PlatoBlockchain Data Intelligence کے بطور استعمال کرتے ہوئے مشین لرننگ ماڈلز کو تربیت دیں۔ عمودی تلاش۔ عیرام پٹھانگی سان فرانسسکو بے ایریا میں AWS میں ایک حل آرکیٹیکٹ ہے۔ اس نے AWS کلاؤڈ پر اپنے کاروبار کو کامیابی سے چلانے کے لیے ایگریکلچر، انشورنس، بینکنگ، ریٹیل، ہیلتھ کیئر اینڈ لائف سائنسز، ہاسپیٹلٹی، اور ہائی ٹیک ورٹیکلز میں صارفین کی مدد کی ہے۔ وہ ڈیٹا بیس، تجزیات اور ایم ایل میں مہارت رکھتا ہے۔

ٹائم اسٹیمپ:

سے زیادہ AWS مشین لرننگ