تم إنشاء العديد من التطبيقات المخصصة لصيانة المعدات الصناعية ، ومراقبة التجارة ، وإدارة الأسطول ، وتحسين المسار باستخدام واجهات برمجة تطبيقات Cassandra API مفتوحة المصدر وبرامج التشغيل لمعالجة البيانات بسرعات عالية وزمن انتقال منخفض. قد تكون إدارة طاولات Cassandra بنفسك مضيعة للوقت ومكلفة. Amazon Keyspaces (لـ Apache Cassandra) يتيح لك إعداد جداول Cassandra وتأمينها وتوسيع نطاقها في سحابة AWS دون إدارة البنية التحتية الإضافية.
في هذا المنشور ، سنوجهك عبر خدمات AWS المتعلقة بتدريب نماذج التعلم الآلي (ML) باستخدام Amazon Keyspaces على مستوى عالٍ ، ونقدم إرشادات خطوة بخطوة لاستيعاب البيانات من Amazon Keyspaces في الأمازون SageMaker وتدريب نموذج يمكن استخدامه لحالة استخدام محددة لتجزئة العملاء.
لدى AWS خدمات متعددة لمساعدة الشركات على تنفيذ عمليات ML في السحابة.
يحتوي AWS ML Stack على ثلاث طبقات. في الطبقة الوسطى SageMaker، والتي توفر للمطورين وعلماء البيانات ومهندسي تعلم الآلة القدرة على بناء نماذج تعلم الآلة وتدريبها ونشرها على نطاق واسع. إنه يزيل التعقيد من كل خطوة من خطوات سير عمل ML بحيث يمكنك بسهولة نشر حالات استخدام ML الخاصة بك. يتضمن ذلك أي شيء من الصيانة التنبؤية إلى رؤية الكمبيوتر للتنبؤ بسلوكيات العملاء. يحقق العملاء تحسنًا يصل إلى 10 أضعاف في إنتاجية علماء البيانات باستخدام SageMaker.
يعد Apache Cassandra خيارًا شائعًا لحالات الاستخدام الكثيفة القراءة مع البيانات غير المنظمة أو شبه المنظمة. على سبيل المثال ، تقدر شركة توصيل طعام شهيرة وقت التسليم ، ويمكن لعميل التجزئة الاستمرار في استخدام معلومات كتالوج المنتجات في قاعدة بيانات Apache Cassandra بشكل متكرر. أمازون كيزبيس هي خدمة قاعدة بيانات متوافقة مع Apache Cassandra قابلة للتطوير ومتاحة للغاية ومدارة بدون خوادم. لا تحتاج إلى توفير الخوادم أو تصحيحها أو إدارتها ، ولا تحتاج إلى تثبيت البرامج أو صيانتها أو تشغيلها. يمكن زيادة حجم الجداول وتصغيرها تلقائيًا ، ولا تدفع إلا مقابل الموارد التي تستخدمها. تتيح لك Amazon Keyspaces تشغيل أحمال عمل Cassandra الخاصة بك على AWS باستخدام نفس كود تطبيق Cassandra وأدوات المطور التي تستخدمها اليوم.
يوفر SageMaker مجموعة من ملفات خوارزميات مدمجة لمساعدة علماء البيانات وممارسي تعلم الآلة على البدء في التدريب ونشر نماذج تعلم الآلة بسرعة. في هذا المنشور ، سنوضح لك كيف يمكن لعميل التجزئة استخدام سجل شراء العميل في قاعدة بيانات Keyspaces واستهداف شرائح عملاء مختلفة للحملات التسويقية.
يعني K هي خوارزمية تعلم غير خاضعة للإشراف. يحاول العثور على مجموعات منفصلة داخل البيانات ، حيث يكون أعضاء المجموعة متشابهين قدر الإمكان مع بعضهم البعض ومختلفين قدر الإمكان عن أعضاء المجموعات الأخرى. أنت تحدد السمات التي تريد أن تستخدمها الخوارزمية لتحديد التشابه. يستخدم SageMaker نسخة معدلة من مقياس الويب k- يعني خوارزمية التجميع. بالمقارنة مع الإصدار الأصلي من الخوارزمية ، فإن الإصدار المستخدم بواسطة SageMaker أكثر دقة. ومع ذلك ، مثل الخوارزمية الأصلية ، فإنها تتسع لمجموعات بيانات ضخمة وتقدم تحسينات في وقت التدريب.
حل نظرة عامة
تفترض التعليمات أنك ستستخدم SageMaker Studio لتشغيل الكود. تمت مشاركة الكود المرتبط على نموذج GitHub من AWS. باتباع الإرشادات الموجودة في المعمل ، يمكنك القيام بما يلي:
- تثبيت التبعيات اللازمة.
- اتصل بـ Amazon Keyspaces ، وأنشئ جدولًا ، واستوعب بيانات نموذجية.
- قم ببناء نموذج ML للتصنيف باستخدام البيانات الموجودة في Amazon Keyspaces.
- اكتشف نتائج النموذج.
- تنظيف الموارد التي تم إنشاؤها حديثًا.
بمجرد الانتهاء ، ستقوم بدمج SageMaker مع Amazon Keyspaces لتدريب نماذج ML كما هو موضح في الصورة التالية.
الآن يمكنك متابعة تعليمات خطوه بخطوه في هذا المنشور لاستيعاب البيانات الأولية المخزنة في Amazon Keyspaces باستخدام SageMaker وبالتالي استرداد البيانات لمعالجة ML.
المتطلبات الأساسية المسبقة
أولاً ، انتقل إلى SageMaker.
بعد ذلك ، إذا كانت هذه هي المرة الأولى التي تستخدم فيها SageMaker ، فحدد البدء.
المقبل ، حدد قم بإعداد مجال SageMaker.
بعد ذلك ، قم بإنشاء ملف تعريف مستخدم جديد بالاسم - com.sagemakeruserوحدد إنشاء دور جديد في ال دور التنفيذ الافتراضي قسم فرعي.
بعد ذلك ، في الشاشة المنبثقة ، حدد أيًا منها خدمة Amazon Simple Storage (Amazon S3) دلو ، وحدد إنشاء دور.
سيتم استخدام هذا الدور في الخطوات التالية للسماح لـ SageMaker بالوصول إلى Keyspaces Table باستخدام بيانات اعتماد مؤقتة من الدور. هذا يلغي الحاجة إلى تخزين اسم مستخدم وكلمة مرور في الكمبيوتر المحمول.
بعد ذلك ، استرجع الدور المرتبط بامتداد com.sagemakeruser الذي تم إنشاؤه في الخطوة السابقة من قسم الملخص.
ثم انتقل إلى ملف وحدة تحكم AWS وابحث AWS لإدارة الهوية والوصول (IAM). داخل IAM ، انتقل إلى الأدوار. ضمن الأدوار ، ابحث عن دور التنفيذ المحدد في الخطوة السابقة.
بعد ذلك ، حدد الدور المحدد في الخطوة السابقة وحدد إضافة أذونات. في القائمة المنسدلة التي تظهر ، حدد إنشاء سياسة مضمنة. يتيح لك SageMaker توفير مستوى وصول دقيق يقيد الإجراءات التي يمكن للمستخدم / التطبيق تنفيذها بناءً على متطلبات العمل.
بعد ذلك ، حدد علامة التبويب JSON وانسخ السياسة من قسم الملاحظات في Github صفحة. تسمح هذه السياسة لجهاز الكمبيوتر المحمول SageMaker بالاتصال بالمفاتيح واسترداد البيانات لمزيد من المعالجة.
بعد ذلك ، حدد إضافة أذونات مرة أخرى ومن القائمة المنسدلة ، وحدد إرفاق السياسة.
ابحث عن سياسة AmazonKeyspacesFullAccess ، وحدد مربع الاختيار بجوار النتيجة المطابقة ، وحدد إرفاق السياسات.
تحقق من أن قسم سياسات الأذونات يتضمن AmazonS3FullAccess
, AmazonSageMakerFullAccess
, AmazonKeyspacesFullAccess
، بالإضافة إلى السياسة المضمنة المضافة حديثًا.
بعد ذلك ، انتقل إلى SageMaker Studio باستخدام وحدة تحكم AWS وحدد SageMaker Studio. بمجرد الوصول إلى هناك ، حدد Launch App وحدد Studio.
تجول دفتر الملاحظات
الطريقة المفضلة للاتصال بـ Keyspaces من SageMaker Notebook هي باستخدام عملية الإصدار 4 من AWS Signature (SigV4) على أساس أوراق اعتماد مؤقتة للمصادقة. في هذا السيناريو ، لا نحتاج إلى إنشاء بيانات اعتماد Keyspaces أو تخزينها ويمكننا استخدام بيانات الاعتماد للمصادقة مع المكون الإضافي SigV4. تتكون بيانات اعتماد الأمان المؤقتة من معرف مفتاح الوصول ومفتاح الوصول السري. ومع ذلك ، فإنها تتضمن أيضًا رمز أمان يشير إلى وقت انتهاء صلاحية بيانات الاعتماد. في هذا المنشور ، سننشئ دور IAM وننشئ بيانات اعتماد أمنية مؤقتة.
أولاً ، نقوم بتثبيت برنامج تشغيل (cassandra-sigv4). يمكّنك برنامج التشغيل هذا من إضافة معلومات المصادقة إلى طلبات واجهة برمجة التطبيقات الخاصة بك باستخدام عملية الإصدار 4 من AWS Signature (SigV4). باستخدام المكون الإضافي ، يمكنك تزويد المستخدمين والتطبيقات ببيانات اعتماد قصيرة المدى للوصول إلى Amazon Keyspaces (لـ Apache Cassandra) باستخدام مستخدمي IAM وأدوارهم. بعد ذلك ، ستقوم باستيراد الشهادة المطلوبة مع تبعيات الحزمة الإضافية. في النهاية ، ستسمح للمفكرة بتولي دور التحدث إلى Keyspaces.
بعد ذلك ، اتصل بـ Amazon Keyspaces واقرأ بيانات الأنظمة من Keyspaces إلى Pandas DataFrame للتحقق من صحة الاتصال.
بعد ذلك ، قم بإعداد البيانات للتدريب على مجموعة البيانات الأولية. في دفتر ملاحظات python المرتبط بهذا المنشور ، استخدم مجموعة بيانات البيع بالتجزئة التي تم تنزيلها من هنا، ومعالجتها. يتمثل هدف أعمالنا في ضوء مجموعة البيانات في تجميع العملاء باستخدام مقياس معين لإجراء مكالمة RFM. يعتمد نموذج RFM على ثلاثة عوامل كمية:
- مدى الحداثة: كيف أجرى العميل عملية شراء مؤخرًا.
- التكرار: عدد المرات التي يقوم فيها العميل بإجراء عملية شراء.
- القيمة النقدية: مقدار الأموال التي ينفقها العميل على المشتريات.
يصنف تحليل RFM العميل عدديًا في كل فئة من هذه الفئات الثلاث ، بشكل عام على مقياس من 1 إلى 5 (كلما زاد الرقم ، كانت النتيجة أفضل). سيحصل العميل "الأفضل" على أعلى الدرجات في كل فئة. سنستخدم وظيفة التقدير الكمي للباندا (qcut). سيساعد على تحديد القيم في دلاء متساوية الحجم بناءً على مقادير العينة أو بناءً على عيناتها.
في هذا المثال ، نستخدم CQL لقراءة السجلات من جدول Keyspace. في بعض حالات استخدام ML ، قد تحتاج إلى قراءة نفس البيانات من نفس جدول Keyspaces عدة مرات. في هذه الحالة ، نوصي بحفظ بياناتك في حاوية Amazon S3 لتجنب تكبد المزيد كلفقراءة من Amazon Keyspaces. اعتمادًا على السيناريو الخاص بك ، يمكنك أيضًا استخدام أمازون EMR إلى ابتلاع ملف Amazon S3 كبير جدًا في SageMaker.
بعد ذلك ، نقوم بتدريب نموذج ML باستخدام خوارزمية KMeans ونتأكد من إنشاء المجموعات. في هذا السيناريو المحدد ، سترى أن المجموعات التي تم إنشاؤها مطبوعة ، مما يوضح أن العملاء في مجموعة البيانات الأولية قد تم تجميعهم معًا بناءً على سمات مختلفة في مجموعة البيانات. يمكن استخدام معلومات المجموعة هذه للحملات التسويقية المستهدفة.
(اختياري) بعد ذلك ، نحفظ شرائح العملاء التي تم تحديدها بواسطة نموذج ML مرة أخرى إلى جدول Amazon Keyspaces للتسويق المستهدف. يمكن لوظيفة مجمعة قراءة هذه البيانات وتشغيل حملات مستهدفة للعملاء في قطاعات محددة.
أخيرا نحن تنظيف الموارد تم إنشاؤه أثناء هذا البرنامج التعليمي لتجنب تكبد رسوم إضافية.
قد يستغرق الأمر من بضع ثوانٍ إلى دقيقة لإكمال حذف مسافة المفاتيح والجداول. عندما تحذف مسافة مفتاح ، تُحذف مسافة المفاتيح وجميع جداولها وتتوقف عن تحصيل الرسوم منها.
وفي الختام
أوضح لك هذا المنشور كيفية استيعاب بيانات العملاء من Amazon Keyspaces إلى SageMaker وتدريب نموذج التجميع الذي سمح لك بتقسيم العملاء. يمكنك استخدام هذه المعلومات للتسويق المستهدف ، وبالتالي تحسين KPI عملك بشكل كبير. لمعرفة المزيد حول Amazon Keyspaces ، راجع الموارد التالية:
- تدريب نماذج التعلم الآلي باستخدام Amazon Keyspaces كمصدر للبيانات (دفتر ملاحظات SageMaker)
- اتصل بـ Amazon Keyspaces من سطح المكتب لديك باستخدام IntelliJ أو PyCharm أو DataGrip IDEs
- مرجع لغة CQL لـ Amazon Keyspaces (لـ Apache Cassandra)
- كيفية إعداد الوصول إلى سطر الأوامر إلى Amazon Keyspaces (لـ Apache Cassandra) باستخدام مجموعة أدوات المطور الجديدة Docker image
- إدارة الهوية والوصول إلى Amazon Keyspaces (لـ Apache Cassandra)
- الاتصال بـ Amazon Keyspaces من SageMaker باستخدام بيانات الاعتماد الخاصة بالخدمة
- الحداثة والتكرار والقيمة النقدية (RFM)
- مرجع رمز Kaggle
حول المؤلف
فاديم لياكوفيتش هو كبير مهندسي الحلول في AWS في منطقة خليج سان فرانسيسكو لمساعدة العملاء على الانتقال إلى AWS. يعمل مع منظمات تتراوح من الشركات الكبيرة إلى الشركات الصغيرة الناشئة لدعم ابتكاراتها. كما أنه يساعد العملاء على تصميم حلول قابلة للتطوير وآمنة وفعالة من حيث التكلفة على AWS.
بارث باتيل مهندس حلول في AWS في منطقة خليج سان فرانسيسكو. يوجه Parth العملاء لتسريع رحلتهم إلى السحابة ومساعدتهم على تبني سحابة AWS بنجاح. يركز على ML وتحديث التطبيقات.
رام باتانجي مهندس حلول في AWS في منطقة خليج سان فرانسيسكو. لقد ساعد العملاء في قطاعات الزراعة والتأمين والمصارف وتجارة التجزئة والرعاية الصحية وعلوم الحياة والضيافة والتكنولوجيا الفائقة لإدارة أعمالهم بنجاح على سحابة AWS. وهو متخصص في قواعد البيانات والتحليلات وتعلم الآلة.
- '
- "
- &
- 10
- 100
- 9
- القدرة
- من نحن
- تسريع
- الوصول
- دقيق
- التأهيل
- الإجراءات
- إضافي
- زراعة
- قدما
- خوارزمية
- الكل
- أمازون
- تحليل
- تحليلات
- آخر
- API
- واجهات برمجة التطبيقات
- التطبيق
- تطبيق
- التطبيقات
- المنطقة
- اهتمام
- سمات
- التحقّق من المُستخدم
- تلقائيا
- متاح
- AWS
- البنوك والمصارف
- خليج
- المدونة
- الحدود
- نساعدك في بناء
- الأعمال
- الأعمال
- دعوة
- الحملات
- يهمني
- الحالات
- الفئة
- شهادة
- اسعارنا محددة من قبل وزارة العمل
- خيار
- تصنيف
- سحابة
- الكود
- مقارنة
- الكمبيوتر
- التواصل
- صلة
- كنسولات
- فعاله من حيث التكلفه
- استطاع
- البلد
- خلق
- خلق
- أوراق اعتماد
- زبون
- العملاء
- البيانات
- مجموعة البيانات
- قاعدة البيانات
- قواعد البيانات
- يسلم
- التوصيل
- اعتمادا
- نشر
- نشر
- سطح المكتب
- حدد
- المطور
- المطورين
- مختلف
- عامل في حوض السفن
- إلى أسفل
- سائق
- قطرة
- أثناء
- بسهولة
- المهندسين
- الشركات
- معدات
- تقديرات
- مثال
- العوامل
- الاسم الأول
- لأول مرة
- سريع
- ويركز
- اتباع
- متابعيك
- طعام
- فرانسيسكو
- وظيفة
- إضافي
- على العموم
- توليد
- الحصول على
- GitHub جيثب:
- جدا
- تجمع
- مجموعات
- دليل
- صحة الإنسان
- الرعاية الصحية
- مساعدة
- مساعدة
- مرتفع
- أعلى
- جدا
- تاريخ
- كيفية
- كيفية
- لكن
- HTTPS
- هوية
- صورة
- تنفيذ
- تحسين
- تحسين
- تتضمن
- يشمل
- مؤشر
- صناعي
- معلومات
- البنية التحتية
- الابتكارات
- تثبيت
- التأمين
- المتكاملة
- IT
- وظيفة
- رحلة
- القفل
- مختبر
- لغة
- كبير
- إطلاق
- طبقة
- تعلم
- تعلم
- مستوى
- علوم الحياة
- لينكدين:
- بحث
- مخلص
- آلة
- آلة التعلم
- صنع
- المحافظة
- يصنع
- إدارة
- تمكن
- إدارة
- إدارة
- التسويق
- هائل
- مطابقة
- الأعضاء
- ML
- نموذج
- عارضات ازياء
- نقدي
- مال
- مراقبة
- الأكثر من ذلك
- أكثر
- متعدد
- ضروري
- مفكرة
- عدد
- طريقة التوسع
- التحسين
- المنظمات
- أخرى
- صفقة
- خاص
- كلمة المرور
- بقعة
- المساعد
- سياسات الخصوصية والبيع
- سياسة
- أكثر الاستفسارات
- ممكن
- محتمل
- تنبأ
- إعداد
- سابق
- السعر
- ابتدائي
- عملية المعالجة
- العمليات
- معالجة
- منتج
- إنتاجية
- ملفي الشخصي
- واعد
- تزود
- ويوفر
- شراء
- مشتريات
- كمي
- بسرعة
- تتراوح
- الخام
- نادي القراءة
- تسلم
- مؤخرا
- نوصي
- تسجيل
- طلبات
- مطلوب
- المتطلبات الأساسية
- الموارد
- النتائج
- بيع بالتجزئة
- مراجعة
- المخاطرة
- النوع
- طريق
- يجري
- سان
- سان فرانسيسكو
- SC
- تحجيم
- حجم
- علوم
- العلماء
- شاشة
- بحث
- ثواني
- تأمين
- أمن
- رمز الأمان
- قطعة
- تقسيم
- شرائح
- Serverless
- الخدمة
- خدمات
- طقم
- شاركت
- المدى القصير
- أظهرت
- مماثل
- الاشارات
- النوم
- صغير
- So
- تطبيقات الكمبيوتر
- الصلبة
- الحلول
- بعض
- تتخصص
- كومة
- بدأت
- البدء
- تخزين
- متجر
- ستوديو
- بنجاح
- الدعم
- نظام
- أنظمة
- حديث
- الهدف
- المستهدفة
- مؤقت
- •
- عبر
- الوقت
- مرات
- اليوم
- سويا
- رمز
- أدوات
- أدوات
- تيشرت
- تجارة
- قادة الإيمان
- تستخدم
- استخدم حالات
- المستخدمين
- قيمنا
- مختلف
- الإصدار
- القطاعات
- رؤيتنا
- ابحث عن
- في غضون
- بدون
- عامل
- سوف
- حل متجر العقارات الشامل الخاص بك في جورجيا