ایمیزون سیج میکر کا استعمال کرتے ہوئے زیادہ سے زیادہ منافع کے لیے بہترین قیمتوں کا تعین

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

یہ ایڈسپرٹ کے سینئر مشین لرننگ انجینئر وکٹر اینریکو جینی کی ایک مہمان پوسٹ ہے۔

اشتہار دینے والا برلن میں مقیم ISV ہے جس نے بولی کے انتظام کا ایک آلہ تیار کیا ہے جو کارکردگی کی مارکیٹنگ اور اشتہاری مہمات کو خود بخود بہتر بنانے کے لیے ڈیزائن کیا گیا ہے۔ کمپنی کا بنیادی اصول مصنوعی ذہانت کی مدد سے ای کامرس اشتہارات کے زیادہ سے زیادہ منافع کو خودکار بنانا ہے۔ ایڈورٹائزنگ پلیٹ فارمز کی مسلسل ترقی نئے مواقع کے لیے راہ ہموار کرتی ہے، جنہیں ایڈسپرٹ اپنے صارفین کی کامیابی کے لیے مہارت سے استعمال کرتا ہے۔

Adspert کا بنیادی مقصد مختلف پلیٹ فارمز پر اشتہاری مہمات کو بہتر بناتے ہوئے صارفین کے لیے عمل کو آسان بنانا ہے۔ اس میں مختلف پلیٹ فارمز پر جمع کی گئی معلومات کا استعمال شامل ہے جو ہر پلیٹ فارم سے اوپر کی سطح پر مقرر کردہ بہترین بجٹ کے خلاف متوازن ہے۔ Adspert کی توجہ گاہک کے ہدف کے حصول کو بہتر بنانا ہے، قطع نظر اس کے کہ کون سا پلیٹ فارم استعمال کیا جاتا ہے۔ Adspert ہمارے صارفین کو اہم فوائد دینے کے لیے ضروری طور پر پلیٹ فارمز کو شامل کرنا جاری رکھے ہوئے ہے۔

اس پوسٹ میں، ہم اس بات کا اشتراک کرتے ہیں کہ Adspert نے مختلف AWS سروسز کا استعمال کرتے ہوئے شروع سے قیمتوں کا تعین کرنے والا ٹول کیسے بنایا ایمیزون سیج میکر اور کس طرح Adspert کے ساتھ تعاون کیا۔ AWS ڈیٹا لیب اس پروجیکٹ کو ڈیزائن سے لے کر ریکارڈ وقت میں تعمیر تک تیز کرنے کے لیے۔

قیمتوں کا تعین کرنے والا ٹول ایک ای کامرس مارکیٹ پلیس پر فروخت کنندہ کے منتخب کردہ پروڈکٹ کی مرئیت اور منافع کے مارجن کی بنیاد پر دوبارہ قیمت لگاتا ہے تاکہ پروڈکٹ کی سطح پر زیادہ سے زیادہ منافع حاصل کیا جا سکے۔

ایک بیچنے والے کے طور پر، یہ ضروری ہے کہ آپ کی مصنوعات ہمیشہ نظر آئیں کیونکہ اس سے فروخت میں اضافہ ہوگا۔ ای کامرس کی فروخت میں سب سے اہم عنصر صرف اس صورت میں ہے جب آپ کی پیشکش کسی مدمقابل کی پیشکش کے بجائے صارفین کو دکھائی دیتی ہے۔

اگرچہ یہ یقینی طور پر مخصوص ای کامرس پلیٹ فارم پر منحصر ہے، ہم نے پایا ہے کہ پروڈکٹ کی قیمت سب سے اہم کلیدی اعداد و شمار میں سے ایک ہے جو مرئیت کو متاثر کر سکتی ہے۔ تاہم، قیمتیں اکثر اور تیزی سے تبدیل ہوتی ہیں۔ اس وجہ سے قیمتوں کا تعین کرنے والے ٹول کو مرئیت کو بڑھانے کے لیے قریب حقیقی وقت میں کام کرنے کی ضرورت ہے۔

حل کا جائزہ

مندرجہ ذیل خاکہ حل کے فن تعمیر کی وضاحت کرتا ہے۔

حل مندرجہ ذیل اجزاء پر مشتمل ہے:

Amazon Relational Database Service (Amazon RDS) PostgreSQL کے لیے ڈیٹا کا بنیادی ذریعہ ہے، جس میں مصنوعات کی معلومات ہوتی ہیں جو پوسٹگریس ڈیٹا بیس کے لیے RDS میں محفوظ ہوتی ہیں۔
مصنوعات کی فہرست میں تبدیلی کی معلومات حقیقی وقت میں ایک میں پہنچ جاتی ہے۔ ایمیزون سادہ قطار سروس (ایمیزون SQS) قطار۔
ایمیزون آر ڈی ایس میں ذخیرہ شدہ پروڈکٹ کی معلومات کو حقیقی وقت میں خام پرت میں داخل کیا جاتا ہے جس میں ڈیٹا کیپچر (سی ڈی سی) پیٹرن دستیاب ہے۔ AWS ڈیٹا بیس مائیگریشن سروس (AWS DMS)۔
ایمیزون ایس کیو ایس سے آنے والی پروڈکٹ لسٹنگ کی اطلاعات تقریباً حقیقی وقت میں خام پرت میں داخل کی جاتی ہیں او ڈبلیو ایس لامبڈا۔ تقریب.
اصل ماخذ ڈیٹا میں محفوظ کیا جاتا ہے ایمیزون سادہ اسٹوریج سروس (ایمیزون S3) پارکیٹ ڈیٹا فارمیٹ کا استعمال کرتے ہوئے خام پرت کی بالٹی۔ یہ پرت ڈیٹا لیک کے لیے سچائی کا واحد ذریعہ ہے۔ اس سٹوریج پر استعمال ہونے والی تقسیم ڈیٹا کی بڑھتی ہوئی پروسیسنگ کی حمایت کرتی ہے۔
AWS گلو ایکسٹریکٹ، ٹرانسفارم، اور لوڈ (ETL) جابز پروڈکٹ ڈیٹا کو صاف کرتی ہیں، ڈپلیکیٹس کو ہٹاتی ہیں، اور ڈیٹا کنسولیڈیشن اور عام تبدیلیوں کو لاگو کرتی ہیں جو کسی مخصوص کاروباری معاملے سے منسلک نہیں ہیں۔
Amazon S3 اسٹیج پرت تیار کردہ ڈیٹا حاصل کرتی ہے جو مزید پروسیسنگ کے لیے اپاچی پارکیٹ فارمیٹ میں محفوظ ہے۔ اسٹیج اسٹور پر استعمال ہونے والی تقسیم ڈیٹا کی بڑھتی ہوئی پروسیسنگ کی حمایت کرتی ہے۔
اس پرت میں تخلیق کردہ AWS Glue جابز Amazon S3 اسٹیج پرت میں دستیاب ڈیٹا کا استعمال کرتی ہیں۔ اس میں استعمال کے معاملے سے متعلق کاروباری قواعد اور حسابات کا اطلاق شامل ہے۔ ان ملازمتوں کے نتائج کا ڈیٹا Amazon S3 تجزیاتی پرت میں محفوظ کیا جاتا ہے۔
ایمیزون S3 تجزیاتی پرت کا استعمال ڈیٹا کو ذخیرہ کرنے کے لیے کیا جاتا ہے جو ایم ایل ماڈلز کے ذریعے تربیتی مقاصد کے لیے استعمال کیا جاتا ہے۔ کیوریٹڈ اسٹور پر استعمال ہونے والی تقسیم متوقع ڈیٹا کے استعمال پر مبنی ہے۔ یہ اسٹیج پرت پر استعمال ہونے والی تقسیم سے مختلف ہو سکتا ہے۔
ری پرائسنگ ML ماڈل SageMaker اسکرپٹ موڈ میں Scikit-Learn Random Forest کا نفاذ ہے، جسے S3 بالٹی (تجزیاتی پرت) میں دستیاب ڈیٹا کا استعمال کرتے ہوئے تربیت دی جاتی ہے۔
AWS Glue ڈیٹا پروسیسنگ کا کام اصل وقت کے تخمینے کے لیے ڈیٹا تیار کرتا ہے۔ جاب S3 بالٹی (اسٹیج لیئر) میں داخل کردہ ڈیٹا پر کارروائی کرتی ہے اور SageMaker انفرنس اینڈ پوائنٹ کو طلب کرتی ہے۔ ڈیٹا کو سیج میکر ری پرائسنگ ماڈل کے ذریعے استعمال کرنے کے لیے تیار کیا گیا ہے۔ AWS Glue کو Lambda پر ترجیح دی گئی، کیونکہ انفرنس کے لیے مختلف پیچیدہ ڈیٹا پروسیسنگ آپریشنز کی ضرورت ہوتی ہے جیسے کہ جوائنز اور ونڈو فنکشنز ڈیٹا کی زیادہ مقدار پر (روزانہ کے اربوں لین دین)۔ ری پرائسنگ ماڈل کی درخواستوں کا نتیجہ S3 بالٹی (انفرنس لیئر) میں محفوظ کیا جاتا ہے۔
سیج میکر ٹریننگ کا کام سیج میکر اینڈ پوائنٹ کا استعمال کرتے ہوئے لگایا گیا ہے۔ اس اختتامی نقطہ کو AWS Glue inference پروسیسر کے ذریعے طلب کیا گیا ہے، جو مصنوعات کی مرئیت کو بڑھانے کے لیے قریب قریب حقیقی وقت کی قیمت کی سفارشات تیار کرتا ہے۔
سیج میکر انفرنس اینڈ پوائنٹ کے ذریعہ تیار کردہ پیشین گوئیاں Amazon S3 انفرنس لیئر میں محفوظ ہیں۔
Lambda predictions optimizer فنکشن SageMaker انفرنس اینڈ پوائنٹ کی طرف سے تیار کردہ سفارشات پر کارروائی کرتا ہے اور قیمت کی ایک نئی سفارش تیار کرتا ہے جو فروخت کنندہ کے منافع کو زیادہ سے زیادہ کرنے پر توجہ مرکوز کرتا ہے، سیلز والیوم اور سیلز مارجن کے درمیان ٹریڈ آف کا اطلاق کرتا ہے۔
Lambda predictions optimizer کی طرف سے تیار کردہ قیمت کی سفارشات کو دوبارہ قیمت لگانے والے API کو جمع کرایا جاتا ہے، جو مارکیٹ پلیس پر پروڈکٹ کی قیمت کو اپ ڈیٹ کرتا ہے۔
Lambda predictions optimizer کے ذریعے تیار کردہ تازہ ترین قیمت کی سفارشات Amazon S3 آپٹیمائزیشن پرت میں محفوظ ہیں۔
AWS Glue پریڈیکشن لوڈر جاب پوسٹگریس ایس کیو ایل ڈیٹا بیس کے لیے ماخذ RDS میں دوبارہ لوڈ کرتا ہے جو ML ماڈل کے ذریعے آڈیٹنگ اور رپورٹنگ کے مقاصد کے لیے تیار کیا جاتا ہے۔ اس جزو کو نافذ کرنے کے لیے AWS Glue Studio کا استعمال کیا گیا تھا۔ یہ ایک گرافیکل انٹرفیس ہے جو AWS Glue میں ETL جابز بنانا، چلانا اور مانیٹر کرنا آسان بناتا ہے۔

ڈیٹا کی تیاری

ایڈسپرٹ کے مرئیت کے ماڈل کے لیے ڈیٹاسیٹ ایک SQS قطار سے بنایا گیا ہے اور Lambda کے ساتھ حقیقی وقت میں ہماری ڈیٹا لیک کی خام تہہ میں داخل کیا جاتا ہے۔ اس کے بعد، خام ڈیٹا کو سادہ تبدیلیوں کے ذریعے صاف کیا جاتا ہے، جیسے ڈپلیکیٹس کو ہٹانا۔ یہ عمل AWS Glue میں لاگو ہوتا ہے۔ نتیجہ ہماری ڈیٹا لیک کی اسٹیجنگ پرت میں محفوظ ہے۔ نوٹیفکیشنز حریفوں کو کسی دیے گئے پروڈکٹ کے لیے، ان کی قیمتوں، تکمیل کے چینلز، ترسیل کے اوقات، اور بہت سے متغیرات کے ساتھ فراہم کرتی ہیں۔ وہ پلیٹ فارم پر منحصر مرئیت کا پیمانہ بھی فراہم کرتے ہیں، جس کا اظہار بولین متغیر (مرئی یا نظر نہیں آتا) کے طور پر کیا جا سکتا ہے۔ جب بھی پیشکش میں تبدیلی ہوتی ہے تو ہمیں ایک اطلاع موصول ہوتی ہے، جو ہمارے تمام صارفین کی مصنوعات پر ہر ماہ کئی ملین واقعات کا اضافہ کرتی ہے۔

اس ڈیٹاسیٹ سے، ہم تربیتی ڈیٹا کو اس طرح نکالتے ہیں: ہر اطلاع کے لیے، ہم مرئی پیشکشوں کو ہر غیر مرئی پیشکش کے ساتھ جوڑتے ہیں، اور اس کے برعکس۔ ہر ڈیٹا پوائنٹ دو فروخت کنندگان کے درمیان مقابلے کی نمائندگی کرتا ہے، جس میں واضح فاتح اور ہارنے والا ہوتا ہے۔ یہ پروسیسنگ جاب اسپارک کے ساتھ AWS Glue جاب میں لاگو ہوتا ہے۔ تیار کردہ تربیتی ڈیٹاسیٹ کو SageMaker کے استعمال کے لیے analytics S3 بالٹی میں ڈال دیا جاتا ہے۔

ماڈل کو تربیت دیں۔

ہمارا ماڈل پیشکشوں کے ہر جوڑے کے لیے درجہ بندی کرتا ہے، اگر کوئی پیشکش نظر آئے گی۔ یہ ماڈل ہمیں اپنے صارفین کے لیے بہترین قیمت کا حساب لگانے، مسابقت کی بنیاد پر مرئیت کو بڑھانے اور ان کے منافع کو زیادہ سے زیادہ کرنے کے قابل بناتا ہے۔ اس کے علاوہ، یہ درجہ بندی کا ماڈل ہمیں ہماری فہرستوں کے مرئی ہونے یا نہ دکھائی دینے کی وجوہات کے بارے میں گہری بصیرت فراہم کر سکتا ہے۔ ہم مندرجہ ذیل خصوصیات کا استعمال کرتے ہیں:

ہماری قیمت اور حریف کی قیمتوں کا تناسب
تکمیلی چینلز میں فرق
ہر بیچنے والے کے تاثرات کی مقدار
ہر بیچنے والے کی رائے کی درجہ بندی
کم از کم ترسیل کے اوقات میں فرق
زیادہ سے زیادہ شپنگ کے اوقات میں فرق
ہر بیچنے والے کی مصنوعات کی دستیابی

Adspert ماڈل کی تربیت اور میزبانی کے لیے SageMaker کا استعمال کرتا ہے۔ ہم Scikit-Learn Random Forest کے نفاذ میں استعمال کرتے ہیں۔ سیج میکر اسکرپٹ موڈ. ہم ٹریننگ اسکرپٹ میں اسکِٹ-لرن پائپ لائن میں براہ راست کچھ فیچر پری پروسیسنگ بھی شامل کرتے ہیں۔ درج ذیل کوڈ دیکھیں:

import numpy as np

def transform_price(X):
    X = X.to_numpy()
    return np.log(
        X[:, 0] / np.nanmin([X[:, 1], X[:, 2]], axis=0),
    ).reshape(-1, 1)

def difference(X):
    X = X.to_numpy()
    return (X[:, 0] - X[:, 1]).reshape(-1, 1)

def fulfillment_difference(X):
    X = X.astype(int)
    return difference(X)

سب سے اہم پری پروسیسنگ افعال میں سے ایک ہے۔ transform_priceجو قیمت کو کم از کم مسابقتی قیمت اور بیرونی قیمت کے کالم سے تقسیم کرتا ہے۔ ہم نے پایا ہے کہ یہ خصوصیت ماڈل کی درستگی پر متعلقہ اثر رکھتی ہے۔ ہم لوگارتھم کو بھی لاگو کرتے ہیں تاکہ ماڈل کو قیمت کے متعلقہ فرق کی بنیاد پر فیصلہ کرنے دیا جائے، نہ کہ مطلق قیمت کے فرق کی بنیاد پر۔

میں training_script.py اسکرپٹ، ہم سب سے پہلے وضاحت کرتے ہیں کہ اسکِٹ-لرن کو کیسے بنایا جائے۔ ColumnTransformer ڈیٹا فریم کے کالموں پر مخصوص ٹرانسفارمرز کو لاگو کرنے کے لیے:

import argparse
import os
from io import StringIO

import joblib
import numpy as np
import pandas as pd
from custom_transformers import difference
from custom_transformers import fulfillment_difference
from custom_transformers import transform_price
from sklearn.compose import ColumnTransformer
from sklearn.ensemble import RandomForestClassifier
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import FunctionTransformer
from sklearn.preprocessing import OneHotEncoder

def make_preprocessor():
    return ColumnTransformer([
        ('price_by_smallest_cp', FunctionTransformer(transform_price),
         ['price', 'competitor_price', 'external_price']),
        (fulfillment_difference, FunctionTransformer(fulfillment_difference),
         ['fulfillment', 'competitor_'fulfillment']),
        ('feedback_count', 'passthrough',
         ['feedback_count', 'competitor_feedback_count']),
        ('feedback_rating', 'passthrough',
         ['feedback_rating', 'competitor_feedback_rating']),
        (
            'availability_type',
            OneHotEncoder(categories=[['NOW'], ['NOW']],
                          handle_unknown='ignore'),
            ['availability_type', 'competitor_availability_type'],
        ),
        ('min_shipping', FunctionTransformer(difference),
         ['minimum_shipping_hours', 'competitor_min_shipping_hours']),
        ('max_shipping', FunctionTransformer(difference),
         ['maximum_shipping_hours', 'competitor_max_shipping_hours']),
    ], remainder='drop')

ٹریننگ اسکرپٹ میں، ہم پارکیٹ سے ڈیٹا کو پانڈاس ڈیٹا فریم میں لوڈ کرتے ہیں، اس کی پائپ لائن کی وضاحت کرتے ہیں۔ ColumnTranformer اور RandomForestClassifier، اور ماڈل کو تربیت دیں۔ اس کے بعد، ماڈل کا استعمال کرتے ہوئے سیریلائز کیا جاتا ہے joblib:

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('--output-data-dir', type=str,
                        default=os.environ['SM_OUTPUT_DATA_DIR'])
    parser.add_argument('--model-dir', type=str,
                        default=os.environ['SM_MODEL_DIR'])
    parser.add_argument('--train', type=str,
                        default=os.environ['SM_CHANNEL_TRAIN'])

    args = parser.parse_args()

    # load training data
    input_files = [os.path.join(args.train, file)
                   for file in os.listdir(args.train)]
    if len(input_files) == 0:
        raise ValueError
    raw_data = [pd.read_parquet(file) for file in input_files]
    train_data = pd.concat(raw_data)

    # split data set into x and y values
    train_y = train_data.loc[:, 'is_visible']

    if train_y.dtype != 'bool':
        raise ValueError(f'Label 'is_visible' has to be dtype bool but is'
                         f' {train_y.dtype}')

    train_X = train_data.drop('is_visible', axis=1)

    # fit the classifier pipeline and store the fitted model
    clf = Pipeline([
        ('preprocessor', make_preprocessor()),
        ('classifier', RandomForestClassifier(random_state=1)),
    ])
    clf.fit(train_X, train_y)
    joblib.dump(clf, os.path.join(args.model_dir, 'model.joblib'))

تربیتی اسکرپٹ میں، ہمیں تخمینہ کے لیے افعال کو بھی نافذ کرنا ہوگا:

input_fn - پے لوڈ کی درخواست کے باڈی سے ڈیٹا کو پارس کرنے کا ذمہ دار ہے۔
ماڈل_ ایف این - اسکرپٹ کے ٹریننگ سیکشن میں ڈالے گئے ماڈل کو لوڈ اور واپس کرتا ہے۔
predict_fn - پے لوڈ سے ڈیٹا کا استعمال کرتے ہوئے ماڈل سے پیشین گوئی کی درخواست کرنے کے لیے ہمارے نفاذ پر مشتمل ہے۔
predict_proba - پیشین گوئی شدہ مرئیت کے منحنی خطوط کو اپنی طرف متوجہ کرنے کے لیے، ہم کلاس کا امکان استعمال کرتے ہوئے واپس کرتے ہیں۔ predict_proba فنکشن، درجہ بندی کرنے والے کی بائنری پیشین گوئی کے بجائے

درج ذیل کوڈ دیکھیں:

def input_fn(request_body, request_content_type):
    """Parse input data payload"""
    if request_content_type == 'text/csv':
        df = pd.read_csv(StringIO(request_body))
        return df
    else:
        raise ValueError(f'{request_content_type} not supported by script!')


def predict_fn(input_data, model):
    """Predict the visibilities"""
    classes = model.classes_

    if len(classes) != 2:
        raise ValueError('Model has more than 2 classes!')

    # get the index of the winning class
    class_index = np.where(model.classes_ == 1)[0][0]

    output = model.predict_proba(input_data)
    return output[:, class_index]


def model_fn(model_dir):
    """Deserialized and return fitted model

    Note that this should have the same name as the serialized model in the
    main method
    """
    clf = joblib.load(os.path.join(model_dir, 'model.joblib'))
    return clf

مندرجہ ذیل اعداد و شمار ناپاکی پر مبنی خصوصیت کی اہمیت کو ظاہر کرتا ہے۔ رینڈم فارسٹ کلاسیفائر.

SageMaker کے ساتھ، ہم اپنے موجودہ مثالوں پر بوجھ ڈالے بغیر یا کافی وسائل کے ساتھ ایک الگ مشین قائم کیے بغیر ماڈل کو بڑی مقدار میں ڈیٹا (14 بلین یومیہ لین دین) پر تربیت دینے کے قابل تھے۔ مزید برآں، چونکہ ٹریننگ جاب کے بعد مثالیں فوری طور پر بند ہو جاتی ہیں، اس لیے سیج میکر کے ساتھ تربیت انتہائی سستی تھی۔ SageMaker کے ساتھ ماڈل کی تعیناتی نے بغیر کسی اضافی کام کے بوجھ کے کام کیا۔ Python SDK میں ایک واحد فنکشن کال ہمارے ماڈل کو ایک انفرنس اینڈ پوائنٹ کے طور پر میزبانی کرنے کے لیے کافی ہے، اور SageMaker Python SDK کا استعمال کرتے ہوئے دیگر سروسز سے بھی آسانی سے درخواست کی جا سکتی ہے۔ درج ذیل کوڈ دیکھیں:

from sagemaker.sklearn.estimator import SKLearn

FRAMEWORK_VERSION = "0.23-1"
script_path = 'training_script.py'
output_location = f's3://{bucket}/{folder}/output'
source_dir = 'source_dir'

sklearn = SKLearn(
    entry_point=script_path,
    source_dir=source_dir,
    framework_version=FRAMEWORK_VERSION,
    instance_type='ml.m5.large',
    role=role,
    sagemaker_session=sagemaker_session,
    output_path=output_location)

sklearn.fit({'train': training_path})

ماڈل آرٹ فیکٹ کو ایمیزون S3 میں فٹ فنکشن کے ذریعے محفوظ کیا گیا ہے۔ جیسا کہ درج ذیل کوڈ میں دیکھا گیا ہے، ماڈل کو بطور لوڈ کیا جا سکتا ہے۔ SKLearnModel ماڈل آرٹ فیکٹ، اسکرپٹ پاتھ، اور کچھ دوسرے پیرامیٹرز کا استعمال کرتے ہوئے آبجیکٹ۔ اس کے بعد، اسے مطلوبہ مثال کی قسم اور مثالوں کی تعداد میں تعینات کیا جا سکتا ہے۔

model = sagemaker.sklearn.model.SKLearnModel(
    model_data=f'{output_location}/sagemaker-scikit-learn-2021-02-23-11-13-30-036/output/model.tar.gz',
    source_dir=source_dir,
    entry_point=script_path,
    framework_version=FRAMEWORK_VERSION,
    sagemaker_session=sagemaker_session,
    role=role
)
ENDPOINT_NAME = 'visibility-model-v1'
model.deploy(
    initial_instance_count=1,
    instance_type='ml.m5.large',
    endpoint_name=ENDPOINT_NAME
)

اصل وقت میں ماڈل کا اندازہ کریں۔

جب بھی ہماری مصنوعات میں سے کسی کے لیے کوئی نیا نوٹیفکیشن بھیجا جاتا ہے، ہم زیادہ سے زیادہ قیمت کا حساب لگا کر جمع کرنا چاہتے ہیں۔ زیادہ سے زیادہ قیمتوں کا حساب لگانے کے لیے، ہم ایک پیشین گوئی ڈیٹاسیٹ بناتے ہیں جس میں ہم اپنی پیشکش کا موازنہ ممکنہ قیمتوں کی ایک حد کے لیے ہر حریف کی پیشکش سے کرتے ہیں۔ یہ ڈیٹا پوائنٹس SageMaker اینڈ پوائنٹ پر منتقل کیے جاتے ہیں، جو ہر دی گئی قیمت کے لیے ہر مدمقابل کے سامنے نظر آنے کی پیشین گوئی کا امکان واپس کرتا ہے۔ ہم مرئی ہونے کے امکان کو کہتے ہیں۔ پیش گوئی کی نمائش. نتیجہ کو ہر ایک مدمقابل کے لیے ایک وکر کے طور پر دیکھا جا سکتا ہے، جو ہماری قیمت اور مرئیت کے درمیان تعلق کو پیش کرتا ہے، جیسا کہ مندرجہ ذیل تصویر میں دکھایا گیا ہے۔

اس مثال میں، مدمقابل 1 کے خلاف مرئیت تقریباً ایک ٹکڑا وار مستقل فعل ہے، جو تجویز کرتا ہے کہ ظاہر ہونے کے لیے ہمیں بنیادی طور پر ایک مخصوص حد سے نیچے قیمت، تقریباً مدمقابل کی قیمت کو کم کرنا ہوگا۔ تاہم، مدمقابل 2 کے خلاف مرئیت اتنی تیزی سے کم نہیں ہوتی ہے۔ اس کے اوپری حصے میں، ہمارے پاس بہت زیادہ قیمت کے باوجود بھی نظر آنے کا 50% امکان ہے۔ ان پٹ ڈیٹا کا تجزیہ کرنے سے یہ بات سامنے آئی کہ مدمقابل کے پاس ریٹنگ کی مقدار کم ہے، جو کہ بہت خراب ہوتی ہے۔ ہمارے ماڈل نے سیکھا کہ یہ مخصوص ای کامرس پلیٹ فارم کمزور فیڈ بیک ریٹنگ والے بیچنے والوں کو نقصان پہنچاتا ہے۔ ہم نے دیگر خصوصیات کے لیے اسی طرح کے اثرات دریافت کیے، جیسے تکمیلی چینل اور ترسیل کے اوقات۔

SageMaker اینڈ پوائنٹ کے خلاف ضروری ڈیٹا ٹرانسفارمیشنز اور انفرنسز کو AWS Glue میں لاگو کیا جاتا ہے۔ AWS Glue جاب لیمبڈا سے حاصل کردہ ریئل ٹائم ڈیٹا پر مائیکرو بیچوں میں کام کرتا ہے۔

آخر میں، ہم مجموعی مرئیت وکر کا حساب لگانا چاہتے ہیں، جو کہ ہر ممکنہ قیمت کے لیے پیش گوئی کی گئی مرئیت ہے۔ ہماری پیشکش نظر آتی ہے اگر یہ دیگر تمام فروخت کنندگان کی پیشکشوں سے بہتر ہو۔ ہماری قیمت کے پیش نظر ہر بیچنے والے کے خلاف نظر آنے کے امکانات کے درمیان آزادی فرض کرتے ہوئے، تمام فروخت کنندگان کے خلاف ظاہر ہونے کا امکان متعلقہ احتمالات کا نتیجہ ہے۔ اس کا مطلب ہے کہ مجموعی مرئیت وکر کو تمام منحنی خطوط کو ضرب دے کر شمار کیا جا سکتا ہے۔

مندرجہ ذیل اعداد و شمار سیج میکر کے اختتامی نقطہ سے واپس آنے والی پیشین گوئی کی نمائش کو ظاہر کرتے ہیں۔

مندرجہ ذیل اعداد و شمار مجموعی مرئیت وکر کو ظاہر کرتا ہے۔

زیادہ سے زیادہ قیمت کا حساب لگانے کے لیے، مرئیت کے منحنی خطوط کو پہلے ہموار کیا جاتا ہے اور پھر مارجن سے ضرب دیا جاتا ہے۔ مارجن کا حساب لگانے کے لیے، ہم سامان کی لاگت اور فیس استعمال کرتے ہیں۔ فروخت شدہ سامان کی قیمت اور فیس AWS DMS کے ذریعے مطابقت پذیر مصنوعات کی جامد معلومات ہیں۔ منافع کے فنکشن کی بنیاد پر، Adspert بہترین قیمت کا حساب لگاتا ہے اور اسے پلیٹ فارم کے API کے ذریعے ای کامرس پلیٹ فارم پر جمع کراتا ہے۔

یہ AWS Lambda prediction optimizer میں لاگو ہوتا ہے۔

مندرجہ ذیل اعداد و شمار پیش گوئی کی مرئیت اور قیمت کے درمیان تعلق کو ظاہر کرتا ہے۔

درج ذیل اعداد و شمار قیمت اور منافع کے درمیان تعلق کو ظاہر کرتا ہے۔

نتیجہ

منافع کو زیادہ سے زیادہ کرنے کے لیے Adspert کا موجودہ نقطہ نظر اشتہارات سے حاصل ہونے والے منافع کو بڑھانے کے لیے بولی کے انتظام پر مرکوز ہے۔ ای کامرس بازاروں پر اعلیٰ کارکردگی حاصل کرنے کے لیے، تاہم، بیچنے والوں کو اپنی مصنوعات کی تشہیر اور مسابقتی قیمت دونوں پر غور کرنا ہوگا۔ مرئیت کی پیشین گوئی کے لیے اس نئے ML ماڈل کے ساتھ، ہم گاہک کی قیمتوں کو ایڈجسٹ کرنے کے لیے اپنی فعالیت کو بڑھا سکتے ہیں۔

قیمتوں کا تعین کرنے والے نئے ٹول کو ڈیٹا کی ایک بڑی مقدار پر ML ماڈل کی خودکار تربیت کے ساتھ ساتھ حقیقی وقت میں ڈیٹا کی تبدیلیوں، پیشین گوئیوں، اور قیمت کی اصلاح کے قابل ہونا چاہیے۔ اس پوسٹ میں، ہم نے اپنے پرائس آپٹیمائزیشن انجن کے اہم مراحل سے گزرے، اور AWS فن تعمیر کو ہم نے AWS ڈیٹا لیب کے تعاون سے ان مقاصد کو حاصل کرنے کے لیے نافذ کیا۔

ML ماڈلز کو تصور سے پیداوار تک لے جانا عام طور پر پیچیدہ اور وقت طلب ہوتا ہے۔ آپ کو ماڈل کو تربیت دینے کے لیے بڑی مقدار میں ڈیٹا کا انتظام کرنا ہوگا، اس کی تربیت کے لیے بہترین الگورتھم کا انتخاب کرنا ہوگا، اس کی تربیت کے دوران کمپیوٹ کی صلاحیت کا انتظام کرنا ہوگا، اور پھر ماڈل کو پیداواری ماحول میں تعینات کرنا ہوگا۔ سیج میکر نے ایم ایل ماڈل کی تعمیر اور تعیناتی کو زیادہ سیدھا بنا کر اس پیچیدگی کو کم کیا۔ دستیاب انتخاب کی وسیع رینج میں سے صحیح الگورتھم اور فریم ورک کا انتخاب کرنے کے بعد، SageMaker نے ہمارے ماڈل کو تربیت دینے اور اسے پروڈکشن میں تعینات کرنے کے لیے تمام بنیادی ڈھانچے کا انتظام کیا۔

اگر آپ سیج میکر سے اپنے آپ کو واقف کرنا شروع کرنا چاہتے ہیں، تو وسرجن ڈے ورکشاپ فیچر انجینئرنگ سے ایم ایل کے استعمال کے کیسز، مختلف ان بلٹ الگورتھم، اور پروڈکشن جیسے منظر نامے میں ایم ایل ماڈل کو کس طرح تربیت، ٹیون، اور ڈیپلائی کرنا ہے اس بارے میں آپ کو آخر سے آخر تک سمجھنے میں مدد مل سکتی ہے۔ یہ آپ کو اپنا ماڈل لانے اور SageMaker پلیٹ فارم پر ML ورک لوڈ لفٹ اور شفٹ کرنے کے لیے رہنمائی کرتا ہے۔ یہ ماڈل ڈیبگنگ، ماڈل مانیٹرنگ، اور آٹو ایم ایل جیسے جدید تصورات کو مزید ظاہر کرتا ہے، اور آپ کو AWS ML Well-architected lens کے ذریعے اپنے ML ورک بوجھ کا اندازہ کرنے میں مدد کرتا ہے۔

اگر آپ ڈیٹا، اینالیٹکس، اے آئی اور ایم ایل، سرور لیس، اور کنٹینر ماڈرنائزیشن کے استعمال کے کیسز کے نفاذ کو تیز کرنے میں مدد چاہتے ہیں، تو براہ کرم رابطہ کریں AWS ڈیٹا لیب.

مصنفین کے بارے میں

وکٹر اینریکو جینی۔ برلن، جرمنی میں واقع ایڈسپرٹ میں ایک سینئر مشین لرننگ انجینئر ہے۔ وہ پیشن گوئی اور اصلاح کے مسائل کے حل پیدا کرتا ہے تاکہ صارفین کے منافع میں اضافہ ہو سکے۔ وکٹر کا اطلاق ریاضی کا پس منظر ہے اور وہ ڈیٹا کے ساتھ کام کرنا پسند کرتا ہے۔ اپنے فارغ وقت میں، وہ ہنگری سیکھنے، مارشل آرٹس کی مشق کرنے، اور گٹار بجانے سے لطف اندوز ہوتے ہیں۔

اینیو پاستور AWS ڈیٹا لیب ٹیم میں ڈیٹا آرکیٹیکٹ ہے۔ وہ نئی ٹیکنالوجیز سے متعلق ہر چیز کا پرجوش ہے جس کا کاروبار اور عام معاش پر مثبت اثر پڑتا ہے۔ Ennio ڈیٹا اینالیٹکس میں 9 سال سے زیادہ کا تجربہ رکھتا ہے۔ وہ کمپنیوں کو تمام صنعتوں جیسے ٹیلی کمیونیکیشن، بینکنگ، گیمنگ، ریٹیل اور انشورنس میں ڈیٹا پلیٹ فارم کی وضاحت اور ان پر عمل درآمد کرنے میں مدد کرتا ہے۔

ٹائم اسٹیمپ: اگست 4، 2022اگست 4، 2022

ٹائم اسٹیمپ: جنوری 29، 2024

Amazon SageMaker کا استعمال کرتے ہوئے زیادہ سے زیادہ منافع کے لیے بہترین قیمتوں کا تعین

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

حل کا جائزہ

ڈیٹا کی تیاری

ماڈل کو تربیت دیں۔

اصل وقت میں ماڈل کا اندازہ کریں۔

نتیجہ

مصنفین کے بارے میں

سے زیادہ AWS مشین لرننگ

Amazon QuickSight کے ساتھ میٹرکس کے بے ضابطگی کے نتائج کے لیے اپنے Amazon Lookout کا تصور کریں۔

Amazon SageMaker کے ساتھ صحت کی دیکھ بھال کے لیے خلاصہ کے اختیارات کی تلاش | ایمیزون ویب سروسز

Amazon EKS کا استعمال کرتے ہوئے اوپن فولڈ، PyTorch پر مبنی پروٹین فولڈنگ ML ماڈل کے لیے پیمانے پر اندازہ لگائیں

Amazon SageMaker جغرافیائی صلاحیتوں کا استعمال کرتے ہوئے Arup میں لچکدار شہروں کو ڈیزائن کرنا | ایمیزون ویب سروسز

اپنے Amazon Recognition Custom Labels ماڈل کو بہتر بنانے کے لیے تجاویز

ہمارے متعلق

عمودی تلاش اور Ai

پلیٹ فارم

مربوط رہو

اکاؤنٹ