Amazon SageMaker का उपयोग करके अधिकतम लाभ के लिए इष्टतम मूल्य निर्धारण

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

यह विज्ञापन पर वरिष्ठ मशीन लर्निंग इंजीनियर विक्टर एनरिको जेनी द्वारा अतिथि पोस्ट है।

विज्ञापनदाता एक बर्लिन स्थित ISV है जिसने प्रदर्शन विपणन और विज्ञापन अभियानों को स्वचालित रूप से अनुकूलित करने के लिए डिज़ाइन किया गया एक बोली प्रबंधन उपकरण विकसित किया है। कंपनी का मूल सिद्धांत आर्टिफिशियल इंटेलिजेंस की मदद से ईकॉमर्स विज्ञापन के अधिकतम लाभ को स्वचालित करना है। विज्ञापन प्लेटफ़ॉर्म का निरंतर विकास नए अवसरों का मार्ग प्रशस्त करता है, जिसका उपयोग Adspert अपने ग्राहकों की सफलता के लिए विशेषज्ञ रूप से करता है।

Adspert का प्राथमिक लक्ष्य विभिन्न प्लेटफार्मों पर विज्ञापन अभियानों को अनुकूलित करते हुए उपयोगकर्ताओं के लिए प्रक्रिया को सरल बनाना है। इसमें प्रत्येक प्लेटफ़ॉर्म के ऊपर के स्तर पर निर्धारित इष्टतम बजट के विरुद्ध संतुलित विभिन्न प्लेटफ़ॉर्म पर एकत्रित जानकारी का उपयोग शामिल है। Adspert का फोकस ग्राहक की लक्ष्य प्राप्ति को अनुकूलित करना है, भले ही किसी भी प्लेटफॉर्म का उपयोग किया गया हो। Adspert हमारे ग्राहकों को महत्वपूर्ण लाभ देने के लिए आवश्यकतानुसार प्लेटफ़ॉर्म जोड़ना जारी रखता है।

इस पोस्ट में, हम साझा करते हैं कि कैसे Adspert ने विभिन्न AWS सेवाओं का उपयोग करके शुरू से मूल्य निर्धारण उपकरण बनाया जैसे अमेज़न SageMaker और कैसे Adspert ने के साथ सहयोग किया AWS डेटा लैब रिकॉर्ड समय में इस परियोजना को डिजाइन से निर्माण में तेजी लाने के लिए।

मूल्य निर्धारण उपकरण उत्पाद स्तर पर लाभ को अधिकतम करने के लिए दृश्यता और लाभ मार्जिन के आधार पर एक ईकॉमर्स मार्केटप्लेस पर विक्रेता द्वारा चुने गए उत्पाद का पुनर्मूल्यांकन करता है।

एक विक्रेता के रूप में, यह आवश्यक है कि आपके उत्पाद हमेशा दिखाई दें क्योंकि इससे बिक्री बढ़ेगी। ईकॉमर्स बिक्री में सबसे महत्वपूर्ण कारक यह है कि यदि आपका ऑफ़र किसी प्रतिस्पर्धी ऑफ़र के बजाय ग्राहकों को दिखाई देता है।

हालांकि यह निश्चित रूप से विशिष्ट ईकॉमर्स प्लेटफॉर्म पर निर्भर करता है, हमने पाया है कि उत्पाद की कीमत सबसे महत्वपूर्ण महत्वपूर्ण आंकड़ों में से एक है जो दृश्यता को प्रभावित कर सकती है। हालांकि, कीमतें अक्सर और तेजी से बदलती हैं; इस कारण से मूल्य निर्धारण उपकरण को दृश्यता बढ़ाने के लिए निकट-वास्तविक समय में कार्य करने की आवश्यकता है।

समाधान का अवलोकन

निम्नलिखित चित्र समाधान वास्तुकला को दर्शाता है।

समाधान में निम्नलिखित घटक होते हैं:

PostgreSQL के लिए Amazon रिलेशनल डेटाबेस सर्विस (Amazon RDS) डेटा का मुख्य स्रोत है, जिसमें उत्पाद जानकारी होती है जो पोस्टग्रेस डेटाबेस के लिए आरडीएस में संग्रहीत होती है।
उत्पाद प्रविष्टि में परिवर्तन की जानकारी वास्तविक समय में आती है अमेज़ॅन सरल कतार सेवा (अमेज़न SQS) कतार।
अमेज़ॅन आरडीएस में संग्रहीत उत्पाद जानकारी को उपलब्ध परिवर्तन डेटा कैप्चर (सीडीसी) पैटर्न का उपयोग करके लगभग वास्तविक समय में कच्ची परत में डाला जाता है एडब्ल्यूएस डेटाबेस प्रवासन सेवा (एडब्ल्यूएस डीएमएस)।
Amazon SQS से आने वाली उत्पाद प्रविष्टि सूचनाएं लगभग वास्तविक समय में एक . का उपयोग करके कच्ची परत में अंतर्ग्रहण की जाती हैं AWS लाम्बा समारोह.
मूल स्रोत डेटा में संग्रहीत किया जाता है अमेज़न सरल भंडारण सेवा (अमेज़ॅन S3) रॉ लेयर बकेट, Parquet डेटा फ़ॉर्मेट का उपयोग करते हुए। यह परत डेटा लेक के लिए सत्य का एकमात्र स्रोत है। इस भंडारण पर प्रयुक्त विभाजन डेटा की वृद्धिशील प्रसंस्करण का समर्थन करता है।
एडब्ल्यूएस गोंद एक्सट्रैक्ट, ट्रांसफॉर्म और लोड (ETL) जॉब्स उत्पाद डेटा को साफ करते हैं, डुप्लिकेट को हटाते हैं, और डेटा समेकन और जेनेरिक ट्रांसफॉर्मेशन लागू करते हैं जो किसी विशिष्ट व्यावसायिक मामले से बंधे नहीं होते हैं।
Amazon S3 चरण परत तैयार डेटा प्राप्त करता है जो आगे की प्रक्रिया के लिए Apache Parquet प्रारूप में संग्रहीत होता है। स्टेज स्टोर पर उपयोग किया जाने वाला विभाजन डेटा की वृद्धिशील प्रसंस्करण का समर्थन करता है।
इस लेयर में बनाए गए AWS ग्लू जॉब्स Amazon S3 स्टेज लेयर में उपलब्ध डेटा का उपयोग करते हैं। इसमें उपयोग केस-विशिष्ट व्यावसायिक नियमों और आवश्यक गणनाओं का उपयोग शामिल है। इन नौकरियों के परिणाम डेटा Amazon S3 विश्लेषिकी परत में संग्रहीत किए जाते हैं।
Amazon S3 एनालिटिक्स लेयर का उपयोग प्रशिक्षण उद्देश्यों के लिए ML मॉडल द्वारा उपयोग किए जाने वाले डेटा को संग्रहीत करने के लिए किया जाता है। क्यूरेटेड स्टोर पर उपयोग किया जाने वाला विभाजन अपेक्षित डेटा उपयोग पर आधारित है। यह मंच परत पर प्रयुक्त विभाजन से भिन्न हो सकता है।
रीप्रिसिंग एमएल मॉडल सेजमेकर स्क्रिप्ट मोड में एक स्किकिट-लर्न रैंडम फ़ॉरेस्ट कार्यान्वयन है, जिसे S3 बकेट (एनालिटिक्स लेयर) में उपलब्ध डेटा का उपयोग करके प्रशिक्षित किया जाता है।
AWS ग्लू डेटा प्रोसेसिंग जॉब वास्तविक समय के अनुमान के लिए डेटा तैयार करता है। जॉब S3 बकेट (स्टेज लेयर) में डाले गए डेटा को प्रोसेस करता है और सेजमेकर इंट्रेंस एंडपॉइंट को इनवाइट करता है। डेटा को सेजमेकर रीप्राइसिंग मॉडल द्वारा उपयोग करने के लिए तैयार किया गया है। लैम्ब्डा के लिए एडब्ल्यूएस गोंद को प्राथमिकता दी गई थी, क्योंकि अनुमान के लिए अलग-अलग जटिल डेटा प्रोसेसिंग ऑपरेशन की आवश्यकता होती है जैसे कि उच्च मात्रा में डेटा (अरबों दैनिक लेनदेन) पर जुड़ना और विंडो फ़ंक्शन। पुनर्मूल्यांकन मॉडल इनवोकेशन के परिणाम S3 बकेट (अनुमान परत) में संग्रहीत किए जाते हैं।
सेजमेकर प्रशिक्षण कार्य को सेजमेकर एंडपॉइंट का उपयोग करके तैनात किया जाता है। इस एंडपॉइंट को एडब्ल्यूएस ग्लू इंट्रेंस प्रोसेसर द्वारा लागू किया जाता है, जो उत्पाद की दृश्यता बढ़ाने के लिए निकट-वास्तविक समय मूल्य अनुशंसाएं उत्पन्न करता है।
सेजमेकर इंट्रेंस एंडपॉइंट द्वारा उत्पन्न भविष्यवाणियां Amazon S3 इंवेंशन लेयर में स्टोर की जाती हैं।
लैम्ब्डा प्रेडिक्शन ऑप्टिमाइज़र फ़ंक्शन, सेजमेकर इंफ़ेक्शन एंडपॉइंट द्वारा उत्पन्न सिफारिशों को संसाधित करता है और एक नई मूल्य अनुशंसा उत्पन्न करता है जो बिक्री की मात्रा और बिक्री मार्जिन के बीच व्यापार-बंद को लागू करते हुए विक्रेता के लाभ को अधिकतम करने पर केंद्रित होता है।
लैम्ब्डा प्रेडिक्शन ऑप्टिमाइज़र द्वारा उत्पन्न मूल्य अनुशंसाओं को पुनर्मूल्यांकन एपीआई को प्रस्तुत किया जाता है, जो बाजार पर उत्पाद की कीमत को अपडेट करता है।
लैम्ब्डा प्रेडिक्शन ऑप्टिमाइज़र द्वारा उत्पन्न अद्यतन मूल्य अनुशंसाएँ अमेज़न S3 अनुकूलन परत में संग्रहीत की जाती हैं।
AWS ग्लू प्रेडिक्शन लोडर जॉब पोस्टग्रेज SQL डेटाबेस के लिए स्रोत RDS में पुनः लोड करता है, जो ऑडिटिंग और रिपोर्टिंग उद्देश्यों के लिए ML मॉडल द्वारा उत्पन्न भविष्यवाणियां करता है। इस घटक को लागू करने के लिए AWS Glue Studio का उपयोग किया गया था; यह एक ग्राफिकल इंटरफ़ेस है जो एडब्ल्यूएस ग्लू में ईटीएल नौकरियों को बनाना, चलाना और मॉनिटर करना आसान बनाता है।

डेटा तैयारी

Adspert के दृश्यता मॉडल के लिए डेटासेट एक SQS कतार से बनाया गया है और लैम्ब्डा के साथ वास्तविक समय में हमारे डेटा लेक की कच्ची परत में डाला जाता है। बाद में, डुप्लिकेट को हटाने जैसे सरल परिवर्तन करके कच्चे डेटा को साफ किया जाता है। यह प्रक्रिया AWS Glue में क्रियान्वित की जाती है। परिणाम हमारे डेटा लेक की स्टेजिंग परत में संग्रहीत है। सूचनाएं किसी दिए गए उत्पाद के लिए प्रतियोगियों को उनकी कीमतें, पूर्ति चैनल, शिपिंग समय और कई अन्य चर प्रदान करती हैं। वे एक प्लेटफ़ॉर्म-निर्भर दृश्यता माप भी प्रदान करते हैं, जिसे एक बूलियन चर (दृश्यमान या दृश्यमान) के रूप में व्यक्त किया जा सकता है। जब भी कोई ऑफ़र परिवर्तन होता है, तो हमें एक सूचना प्राप्त होती है, जो हमारे सभी ग्राहकों के उत्पादों पर प्रति माह कई मिलियन ईवेंट जोड़ता है।

इस डेटासेट से, हम प्रशिक्षण डेटा को निम्नानुसार निकालते हैं: प्रत्येक अधिसूचना के लिए, हम दृश्यमान ऑफ़र को प्रत्येक गैर-दृश्यमान ऑफ़र के साथ जोड़ते हैं, और इसके विपरीत। प्रत्येक डेटा बिंदु दो विक्रेताओं के बीच एक प्रतियोगिता का प्रतिनिधित्व करता है, जिसमें एक स्पष्ट विजेता और हारने वाला होता है। यह प्रसंस्करण कार्य स्पार्क के साथ एडब्ल्यूएस गोंद नौकरी में लागू किया गया है। तैयार प्रशिक्षण डेटासेट को सेजमेकर द्वारा उपयोग किए जाने वाले एनालिटिक्स S3 बकेट में धकेल दिया जाता है।

मॉडल को प्रशिक्षित करें

हमारा मॉडल ऑफ़र की प्रत्येक जोड़ी के लिए वर्गीकृत करता है, यदि कोई ऑफ़र दिखाई देगा। यह मॉडल हमें अपने ग्राहकों के लिए सर्वोत्तम मूल्य की गणना करने, प्रतिस्पर्धा के आधार पर दृश्यता बढ़ाने और उनके लाभ को अधिकतम करने में सक्षम बनाता है। इसके अलावा, यह वर्गीकरण मॉडल हमें हमारी लिस्टिंग के दिखाई देने या न दिखने के कारणों के बारे में गहन जानकारी दे सकता है। हम निम्नलिखित सुविधाओं का उपयोग करते हैं:

प्रतिस्पर्धियों की कीमतों से हमारी कीमत का अनुपात
पूर्ति चैनलों में अंतर
प्रत्येक विक्रेता के लिए प्रतिक्रिया की मात्रा
प्रत्येक विक्रेता की प्रतिक्रिया रेटिंग
न्यूनतम शिपिंग समय में अंतर
अधिकतम शिपिंग समय में अंतर
प्रत्येक विक्रेता के उत्पाद की उपलब्धता

Adpert मॉडल को प्रशिक्षित और होस्ट करने के लिए SageMaker का उपयोग करता है। हम स्किकिट-लर्न रैंडम फ़ॉरेस्ट कार्यान्वयन का उपयोग करते हैं सेजमेकर स्क्रिप्ट मोड. हम प्रशिक्षण स्क्रिप्ट में सीधे स्किकिट-लर्न पाइपलाइन में कुछ फीचर प्रीप्रोसेसिंग भी शामिल करते हैं। निम्नलिखित कोड देखें:

import numpy as np

def transform_price(X):
    X = X.to_numpy()
    return np.log(
        X[:, 0] / np.nanmin([X[:, 1], X[:, 2]], axis=0),
    ).reshape(-1, 1)

def difference(X):
    X = X.to_numpy()
    return (X[:, 0] - X[:, 1]).reshape(-1, 1)

def fulfillment_difference(X):
    X = X.astype(int)
    return difference(X)

सबसे महत्वपूर्ण प्रीप्रोसेसिंग कार्यों में से एक है transform_price, जो कीमत को प्रतिस्पर्धी मूल्य के न्यूनतम और बाहरी मूल्य कॉलम से विभाजित करता है। हमने पाया है कि यह सुविधा मॉडल सटीकता पर प्रासंगिक प्रभाव डालती है। हम मॉडल को सापेक्ष मूल्य अंतर के आधार पर तय करने देने के लिए लघुगणक भी लागू करते हैं, न कि पूर्ण मूल्य अंतर के आधार पर।

में training_script.py स्क्रिप्ट, हम पहले परिभाषित करते हैं कि स्किकिट-लर्न का निर्माण कैसे करें ColumnTransformer डेटाफ़्रेम के कॉलम में निर्दिष्ट ट्रांसफ़ॉर्मर लागू करने के लिए:

import argparse
import os
from io import StringIO

import joblib
import numpy as np
import pandas as pd
from custom_transformers import difference
from custom_transformers import fulfillment_difference
from custom_transformers import transform_price
from sklearn.compose import ColumnTransformer
from sklearn.ensemble import RandomForestClassifier
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import FunctionTransformer
from sklearn.preprocessing import OneHotEncoder

def make_preprocessor():
    return ColumnTransformer([
        ('price_by_smallest_cp', FunctionTransformer(transform_price),
         ['price', 'competitor_price', 'external_price']),
        (fulfillment_difference, FunctionTransformer(fulfillment_difference),
         ['fulfillment', 'competitor_'fulfillment']),
        ('feedback_count', 'passthrough',
         ['feedback_count', 'competitor_feedback_count']),
        ('feedback_rating', 'passthrough',
         ['feedback_rating', 'competitor_feedback_rating']),
        (
            'availability_type',
            OneHotEncoder(categories=[['NOW'], ['NOW']],
                          handle_unknown='ignore'),
            ['availability_type', 'competitor_availability_type'],
        ),
        ('min_shipping', FunctionTransformer(difference),
         ['minimum_shipping_hours', 'competitor_min_shipping_hours']),
        ('max_shipping', FunctionTransformer(difference),
         ['maximum_shipping_hours', 'competitor_max_shipping_hours']),
    ], remainder='drop')

प्रशिक्षण स्क्रिप्ट में, हम Parquet से डेटा को पंडों के डेटाफ़्रेम में लोड करते हैं, और की पाइपलाइन को परिभाषित करते हैं ColumnTranformer और RandomForestClassifier, और मॉडल को प्रशिक्षित करें। बाद में, मॉडल का उपयोग करके क्रमबद्ध किया जाता है joblib:

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('--output-data-dir', type=str,
                        default=os.environ['SM_OUTPUT_DATA_DIR'])
    parser.add_argument('--model-dir', type=str,
                        default=os.environ['SM_MODEL_DIR'])
    parser.add_argument('--train', type=str,
                        default=os.environ['SM_CHANNEL_TRAIN'])

    args = parser.parse_args()

    # load training data
    input_files = [os.path.join(args.train, file)
                   for file in os.listdir(args.train)]
    if len(input_files) == 0:
        raise ValueError
    raw_data = [pd.read_parquet(file) for file in input_files]
    train_data = pd.concat(raw_data)

    # split data set into x and y values
    train_y = train_data.loc[:, 'is_visible']

    if train_y.dtype != 'bool':
        raise ValueError(f'Label 'is_visible' has to be dtype bool but is'
                         f' {train_y.dtype}')

    train_X = train_data.drop('is_visible', axis=1)

    # fit the classifier pipeline and store the fitted model
    clf = Pipeline([
        ('preprocessor', make_preprocessor()),
        ('classifier', RandomForestClassifier(random_state=1)),
    ])
    clf.fit(train_X, train_y)
    joblib.dump(clf, os.path.join(args.model_dir, 'model.joblib'))

प्रशिक्षण स्क्रिप्ट में, हमें अनुमान के लिए कार्यों को भी लागू करना होगा:

इनपुट_एफएन - पेलोड के अनुरोध निकाय से डेटा को पार्स करने के लिए जिम्मेदार है
मॉडल_एफएन - स्क्रिप्ट के प्रशिक्षण अनुभाग में डंप किए गए मॉडल को लोड और लौटाता है
भविष्यवाणी_fn - पेलोड से डेटा का उपयोग करके मॉडल से भविष्यवाणी का अनुरोध करने के लिए हमारे कार्यान्वयन को शामिल करता है
भविष्यवाणी_प्रोबा - अनुमानित दृश्यता वक्रों को आकर्षित करने के लिए, हम का उपयोग करके वर्ग संभाव्यता लौटाते हैं predict_proba फ़ंक्शन, क्लासिफायरियर की बाइनरी भविष्यवाणी के बजाय

निम्नलिखित कोड देखें:

def input_fn(request_body, request_content_type):
    """Parse input data payload"""
    if request_content_type == 'text/csv':
        df = pd.read_csv(StringIO(request_body))
        return df
    else:
        raise ValueError(f'{request_content_type} not supported by script!')


def predict_fn(input_data, model):
    """Predict the visibilities"""
    classes = model.classes_

    if len(classes) != 2:
        raise ValueError('Model has more than 2 classes!')

    # get the index of the winning class
    class_index = np.where(model.classes_ == 1)[0][0]

    output = model.predict_proba(input_data)
    return output[:, class_index]


def model_fn(model_dir):
    """Deserialized and return fitted model

    Note that this should have the same name as the serialized model in the
    main method
    """
    clf = joblib.load(os.path.join(model_dir, 'model.joblib'))
    return clf

निम्नलिखित आंकड़ा अशुद्धता-आधारित विशेषता महत्व को दर्शाता है जो द्वारा लौटाया गया है यादृच्छिक वन वर्गीकरण.

सेजमेकर के साथ, हम अपने मौजूदा उदाहरणों पर भार डाले बिना या पर्याप्त संसाधनों के साथ एक अलग मशीन स्थापित किए बिना बड़ी मात्रा में डेटा (14 बिलियन दैनिक लेनदेन तक) पर मॉडल को प्रशिक्षित करने में सक्षम थे। इसके अलावा, क्योंकि प्रशिक्षण कार्य के तुरंत बाद इंस्टेंस बंद हो जाते हैं, सेजमेकर के साथ प्रशिक्षण बेहद लागत प्रभावी था। सेजमेकर के साथ मॉडल परिनियोजन ने बिना किसी अतिरिक्त कार्यभार के काम किया। पायथन एसडीके में एक एकल फ़ंक्शन कॉल हमारे मॉडल को एक अनुमान समापन बिंदु के रूप में होस्ट करने के लिए पर्याप्त है, और इसे सेजमेकर पायथन एसडीके का उपयोग करके अन्य सेवाओं से भी आसानी से अनुरोध किया जा सकता है। निम्नलिखित कोड देखें:

from sagemaker.sklearn.estimator import SKLearn

FRAMEWORK_VERSION = "0.23-1"
script_path = 'training_script.py'
output_location = f's3://{bucket}/{folder}/output'
source_dir = 'source_dir'

sklearn = SKLearn(
    entry_point=script_path,
    source_dir=source_dir,
    framework_version=FRAMEWORK_VERSION,
    instance_type='ml.m5.large',
    role=role,
    sagemaker_session=sagemaker_session,
    output_path=output_location)

sklearn.fit({'train': training_path})

मॉडल आर्टिफैक्ट को Amazon S3 में फिट फ़ंक्शन द्वारा संग्रहीत किया जाता है। जैसा कि निम्नलिखित कोड में देखा गया है, मॉडल को a . के रूप में लोड किया जा सकता है SKLearnModel मॉडल आर्टिफैक्ट, स्क्रिप्ट पथ, और कुछ अन्य पैरामीटर का उपयोग करके ऑब्जेक्ट। बाद में, इसे वांछित इंस्टेंस प्रकार और इंस्टेंस की संख्या में तैनात किया जा सकता है।

model = sagemaker.sklearn.model.SKLearnModel(
    model_data=f'{output_location}/sagemaker-scikit-learn-2021-02-23-11-13-30-036/output/model.tar.gz',
    source_dir=source_dir,
    entry_point=script_path,
    framework_version=FRAMEWORK_VERSION,
    sagemaker_session=sagemaker_session,
    role=role
)
ENDPOINT_NAME = 'visibility-model-v1'
model.deploy(
    initial_instance_count=1,
    instance_type='ml.m5.large',
    endpoint_name=ENDPOINT_NAME
)

वास्तविक समय में मॉडल का मूल्यांकन करें

जब भी हमारे किसी उत्पाद के लिए कोई नई सूचना भेजी जाती है, तो हम इष्टतम मूल्य की गणना और सबमिट करना चाहते हैं। इष्टतम कीमतों की गणना करने के लिए, हम एक भविष्यवाणी डेटासेट बनाते हैं जिसमें हम संभावित कीमतों की एक श्रृंखला के लिए प्रत्येक प्रतियोगी के प्रस्ताव के साथ अपने स्वयं के प्रस्ताव की तुलना करते हैं। ये डेटा बिंदु सेजमेकर एंडपॉइंट को पास कर दिए जाते हैं, जो प्रत्येक दिए गए मूल्य के लिए प्रत्येक प्रतियोगी के खिलाफ दृश्यमान होने की अनुमानित संभावना देता है। हम दिखाई देने की प्रायिकता को कहते हैं अनुमानित दृश्यता. परिणाम को प्रत्येक प्रतियोगी के लिए एक वक्र के रूप में देखा जा सकता है, जो हमारी कीमत और दृश्यता के बीच के संबंध को दर्शाता है, जैसा कि निम्नलिखित आकृति में दिखाया गया है।

इस उदाहरण में, प्रतियोगी 1 के खिलाफ दृश्यता लगभग एक टुकड़े-टुकड़े स्थिर कार्य है, यह सुझाव देता है कि हमें मुख्य रूप से एक निश्चित सीमा से नीचे की कीमत कम करनी होगी, मोटे तौर पर प्रतिस्पर्धी की कीमत, दृश्यमान होने के लिए। हालाँकि, प्रतियोगी 2 के खिलाफ दृश्यता उतनी तेजी से कम नहीं होती है। उसके ऊपर, हमारे पास अभी भी बहुत अधिक कीमत के साथ भी दिखाई देने की 50% संभावना है। इनपुट डेटा का विश्लेषण करने से पता चला कि प्रतियोगी की रेटिंग कम है, जो बहुत खराब होती है। हमारे मॉडल ने सीखा कि यह विशिष्ट ईकॉमर्स प्लेटफॉर्म खराब फीडबैक रेटिंग वाले विक्रेताओं को नुकसान पहुंचाता है। हमने फ़ुलफ़िलमेंट चैनल और शिपिंग समय जैसी अन्य सुविधाओं के लिए समान प्रभाव खोजे हैं।

सेजमेकर एंडपॉइंट के खिलाफ आवश्यक डेटा परिवर्तन और निष्कर्ष एडब्ल्यूएस गोंद में लागू किए जाते हैं। एडब्ल्यूएस ग्लू जॉब लैम्ब्डा से प्राप्त रीयल-टाइम डेटा पर माइक्रो-बैच में काम करता है।

अंत में, हम समग्र दृश्यता वक्र की गणना करना चाहते हैं, जो कि प्रत्येक संभावित मूल्य के लिए अनुमानित दृश्यता है। हमारा ऑफ़र तब दिखाई देता है जब यह अन्य सभी विक्रेताओं के ऑफ़र से बेहतर हो। हमारी कीमत को देखते हुए प्रत्येक विक्रेता के खिलाफ दिखाई देने की संभावनाओं के बीच स्वतंत्रता मानते हुए, सभी विक्रेताओं के खिलाफ दिखाई देने की संभावना संबंधित संभावनाओं का उत्पाद है। इसका मतलब है कि समग्र दृश्यता वक्र की गणना सभी वक्रों को गुणा करके की जा सकती है।

निम्नलिखित आंकड़े सेजमेकर एंडपॉइंट से लौटाए गए अनुमानित दृश्यता दिखाते हैं।

निम्नलिखित आंकड़ा समग्र दृश्यता वक्र दिखाता है।

इष्टतम मूल्य की गणना करने के लिए, दृश्यता वक्र को पहले चिकना किया जाता है और फिर मार्जिन से गुणा किया जाता है। मार्जिन की गणना करने के लिए, हम माल की लागत और शुल्क का उपयोग करते हैं। बेचे गए माल की लागत और शुल्क एडब्ल्यूएस डीएमएस के माध्यम से समन्वयित स्थिर उत्पाद जानकारी है। लाभ फ़ंक्शन के आधार पर, Adspert इष्टतम मूल्य की गणना करता है और इसे प्लेटफ़ॉर्म के API के माध्यम से ईकॉमर्स प्लेटफ़ॉर्म पर सबमिट करता है।

यह एडब्ल्यूएस लैम्ब्डा भविष्यवाणी अनुकूलक में लागू किया गया है।

निम्नलिखित आंकड़ा अनुमानित दृश्यता और कीमत के बीच संबंध को दर्शाता है।

निम्नलिखित आंकड़ा मूल्य और लाभ के बीच संबंध को दर्शाता है।

निष्कर्ष

विज्ञापन से लाभ बढ़ाने के लिए विज्ञापनदाता का लाभ अधिकतमकरण का मौजूदा दृष्टिकोण बोली प्रबंधन पर केंद्रित है। ईकॉमर्स मार्केटप्लेस पर बेहतर प्रदर्शन हासिल करने के लिए, हालांकि, विक्रेताओं को अपने उत्पादों के विज्ञापन और प्रतिस्पर्धी मूल्य निर्धारण दोनों पर विचार करना होगा। दृश्यता की भविष्यवाणी करने के लिए इस नए एमएल मॉडल के साथ, हम ग्राहक की कीमतों को समायोजित करने के लिए अपनी कार्यक्षमता का विस्तार कर सकते हैं।

नए मूल्य निर्धारण उपकरण को बड़ी मात्रा में डेटा के साथ-साथ वास्तविक समय डेटा परिवर्तन, पूर्वानुमान और मूल्य अनुकूलन पर एमएल मॉडल के स्वचालित प्रशिक्षण में सक्षम होना चाहिए। इस पोस्ट में, हम अपने मूल्य अनुकूलन इंजन के मुख्य चरणों और उन लक्ष्यों को प्राप्त करने के लिए AWS डेटा लैब के सहयोग से लागू किए गए AWS आर्किटेक्चर के माध्यम से चले।

एमएल मॉडल को अवधारणा से उत्पादन तक ले जाना आम तौर पर जटिल और समय लेने वाला होता है। आपको मॉडल को प्रशिक्षित करने के लिए बड़ी मात्रा में डेटा का प्रबंधन करना होगा, इसे प्रशिक्षित करने के लिए सबसे अच्छा एल्गोरिदम चुनना होगा, प्रशिक्षण के दौरान गणना क्षमता का प्रबंधन करना होगा, और फिर मॉडल को उत्पादन वातावरण में तैनात करना होगा। सेजमेकर ने एमएल मॉडल के निर्माण और परिनियोजन के लिए इसे और अधिक सरल बनाकर इस जटिलता को कम किया। उपलब्ध विकल्पों की विस्तृत श्रृंखला में से सही एल्गोरिदम और ढांचे को चुनने के बाद, सेजमेकर ने हमारे मॉडल को प्रशिक्षित करने और इसे उत्पादन के लिए तैनात करने के लिए सभी अंतर्निहित बुनियादी ढांचे का प्रबंधन किया।

यदि आप सेजमेकर के साथ खुद को परिचित करना शुरू करना चाहते हैं, तो विसर्जन दिवस कार्यशाला फीचर इंजीनियरिंग, विभिन्न इन-बिल्ट एल्गोरिदम से एमएल उपयोग के मामलों का निर्माण कैसे करें, और उत्पादन जैसे परिदृश्य में एमएल मॉडल को कैसे प्रशिक्षित, ट्यून और तैनात करें, इसकी पूरी समझ हासिल करने में आपकी मदद कर सकता है। यह आपको अपना खुद का मॉडल लाने और सेजमेकर प्लेटफॉर्म पर ऑन-प्रिमाइसेस एमएल वर्कलोड लिफ्ट-एंड-शिफ्ट करने के लिए मार्गदर्शन करता है। यह आगे मॉडल डिबगिंग, मॉडल मॉनिटरिंग और ऑटोएमएल जैसी उन्नत अवधारणाओं को प्रदर्शित करता है, और एडब्ल्यूएस एमएल वेल-आर्किटेक्टेड लेंस के माध्यम से आपके एमएल वर्कलोड का मूल्यांकन करने में आपकी सहायता करता है।

यदि आप डेटा, एनालिटिक्स, एआई और एमएल, सर्वर रहित और कंटेनर आधुनिकीकरण से जुड़े उपयोग के मामलों के कार्यान्वयन में तेजी लाने में मदद चाहते हैं, तो कृपया संपर्क करें AWS डेटा लैब.

लेखक के बारे में

विक्टर एनरिको जेनी बर्लिन, जर्मनी में स्थित Adspert में एक वरिष्ठ मशीन लर्निंग इंजीनियर हैं। वह ग्राहकों के मुनाफे को बढ़ाने के लिए भविष्यवाणी और अनुकूलन समस्याओं के समाधान बनाता है। विक्टर की लागू गणित में पृष्ठभूमि है और डेटा के साथ काम करना पसंद करता है। अपने खाली समय में, उन्हें हंगेरियन सीखना, मार्शल आर्ट का अभ्यास करना और गिटार बजाना पसंद है।

एन्नियो पास्टर AWS डेटा लैब टीम में डेटा आर्किटेक्ट है। वह नई तकनीकों से संबंधित हर चीज के प्रति उत्साही हैं जिनका व्यवसायों और सामान्य आजीविका पर सकारात्मक प्रभाव पड़ता है। Ennio को डेटा एनालिटिक्स में 9 साल से अधिक का अनुभव है। वह कंपनियों को दूरसंचार, बैंकिंग, गेमिंग, खुदरा और बीमा जैसे उद्योगों में डेटा प्लेटफॉर्म को परिभाषित और कार्यान्वित करने में मदद करता है।

समय टिकट: अगस्त 4, 2022अगस्त 4, 2022

समय टिकट: नवम्बर 22, 2022

Amazon SageMaker का उपयोग करके अधिकतम लाभ के लिए इष्टतम मूल्य निर्धारण

प्लेटो द्वारा पुनर्प्रकाशित

समाधान का अवलोकन

डेटा तैयारी

मॉडल को प्रशिक्षित करें

वास्तविक समय में मॉडल का मूल्यांकन करें

निष्कर्ष

लेखक के बारे में

से अधिक AWS मशीन लर्निंग

पीजीए टूर के साथ क्लाउड में बॉल पोजीशन ट्रैकिंग | अमेज़न वेब सेवाएँ

अमेज़ॅन सेजमेकर भू-स्थानिक क्षमताओं का उपयोग करके अरुप में लचीले शहरों को डिजाइन करना | अमेज़न वेब सेवाएँ

अमेज़ॅन केंद्र के अक्सर पूछे जाने वाले प्रश्नों के लिए संस्करण नियंत्रण को स्वचालित और कार्यान्वित करें

Amazon SageMaker Studio द्वारा संचालित डेटा साइंस वर्कबेंच के साथ अपनी SaaS पेशकश को बेहतर बनाएं

Amazon Kendra के लिए Exchange कनेक्टर का उपयोग करके अपनी Microsoft Exchange सामग्री को अनुक्रमित करें

AWS का उपयोग करके ग्राहक भावना का वास्तविक समय विश्लेषण

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा