יישומים רבים המיועדים לתחזוקת ציוד תעשייתי, ניטור סחר, ניהול צי ואופטימיזציה של מסלולים בנויים באמצעות קוד פתוח Cassandra APIs ומנהלי התקנים לעיבוד נתונים במהירויות גבוהות והשהייה נמוכה. ניהול טבלאות קסנדרה בעצמך עשוי להיות גוזל זמן ויקר. אמזון מפתחות (עבור Apache Cassandra) מאפשר לך להגדיר, לאבטח ולהתאים טבלאות Cassandra בענן AWS מבלי לנהל תשתית נוספת.
בפוסט זה, נדריך אותך דרך שירותי AWS הקשורים לאימון מודלים של למידת מכונה (ML) באמצעות Amazon Keyspaces ברמה גבוהה, ונספק הוראות שלב אחר שלב להטמעת נתונים מ-Amazon Keyspaces לתוך אמזון SageMaker והכשרת מודל שיכול לשמש למקרה שימוש ספציפי לפילוח לקוחות.
ל-AWS יש מספר שירותים כדי לעזור לעסקים ליישם תהליכי ML בענן.
ל-AWS ML Stack יש שלוש שכבות. בשכבה האמצעית נמצא SageMaker, המספקת למפתחים, מדעני נתונים ומהנדסי ML את היכולת לבנות, לאמן ולפרוס מודלים של ML בקנה מידה. זה מסיר את המורכבות מכל שלב בזרימת העבודה של ML, כך שתוכל לפרוס בקלות רבה יותר את מקרי השימוש שלך ב-ML. זה כולל כל דבר מתחזוקה חזויה ועד ראייה ממוחשבת לחיזוי התנהגויות לקוחות. לקוחות משיגים שיפור של עד פי 10 בפרודוקטיביות של מדעני נתונים עם SageMaker.
Apache Cassandra היא בחירה פופולרית עבור מקרי שימוש כבדים בקריאה עם נתונים לא מובנים או מובנים למחצה. לדוגמה, עסק פופולרי למשלוח מזון מעריך את זמן האספקה, ולקוח קמעונאי יכול להתמיד בשימוש תכוף במידע על קטלוג מוצרים במסד הנתונים של Apache Cassandra. אמזון מפתחות הוא שירות מסד נתונים תואם Apache Cassandra ללא שרתים שניתן להרחבה, זמין מאוד ומנוהל. אינך צריך להקצות, לתקן או לנהל שרתים, ואין צורך להתקין, לתחזק או להפעיל תוכנה. טבלאות יכולות להגדיל ולהקטין באופן אוטומטי, ואתה משלם רק עבור המשאבים שבהם אתה משתמש. Amazon Keyspaces מאפשרת לך להפעיל את עומסי העבודה של Cassandra ב-AWS באמצעות אותם קוד יישום Cassandra וכלי מפתח שבהם אתה משתמש היום.
SageMaker מספקת חבילה של אלגוריתמים מובנים לעזור למדעני נתונים ולעוסקים ב-ML להתחיל בהדרכה ובפריסה של מודלים של ML במהירות. בפוסט זה, נראה לך כיצד לקוח קמעונאי יכול להשתמש בהיסטוריית רכישות של לקוחות במסד הנתונים של Keyspaces ולמקד לפלחי לקוחות שונים לקמפיינים שיווקיים.
אמצעי K הוא אלגוריתם למידה ללא פיקוח. הוא מנסה למצוא קבוצות דיסקרטיות בתוך נתונים, כאשר חברי קבוצה דומים זה לזה ככל האפשר ושונים ככל האפשר מחברי קבוצות אחרות. אתה מגדיר את התכונות שבהן אתה רוצה שהאלגוריתם ישתמש כדי לקבוע דמיון. SageMaker משתמש בגרסה שונה של אלגוריתם צבירת קבצים בקנה מידה אינטרנט. בהשוואה לגרסה המקורית של האלגוריתם, הגרסה שבה משתמש SageMaker מדויקת יותר. עם זאת, כמו האלגוריתם המקורי, הוא מתרחב למערכי נתונים מסיביים ומספק שיפורים בזמן האימון.
סקירת פתרונות
ההוראות מניחות שתשתמש ב- SageMaker Studio כדי להפעיל את הקוד. הקוד המשויך שותף ב- AWS לדוגמה GitHub. לפי ההוראות במעבדה, אתה יכול לעשות את הפעולות הבאות:
- התקן תלות נחוצה.
- התחבר ל-Amazon Keyspaces, צור טבלה והטמע נתונים לדוגמה.
- בנו מודל ML לסיווג באמצעות הנתונים ב-Amazon Keyspaces.
- חקור את תוצאות המודל.
- נקה משאבים חדשים שנוצרו.
לאחר השלמתו, תשלב את SageMaker עם Amazon Keyspaces כדי לאמן דגמי ML כפי שמוצג בתמונה הבאה.
עכשיו אתה יכול לעקוב אחר ה- הוראות שלב אחר שלב בפוסט זה כדי להטמיע נתונים גולמיים המאוחסנים באמזון Keyspaces באמצעות SageMaker והנתונים שנשלפו כך לעיבוד ML.
תנאים מוקדמים
ראשית, נווט אל SageMaker.
לאחר מכן, אם זו הפעם הראשונה שאתה משתמש ב- SageMaker, בחר למלונות.
לאחר מכן, בחר הגדר את SageMaker Domain.
לאחר מכן, צור פרופיל משתמש חדש עם שם - saemakeruser, ובחר צור תפקיד חדש ב תפקיד ביצוע ברירת מחדל סעיף משנה.
לאחר מכן, במסך שצץ, בחר כל אחד שירות אחסון פשוט של אמזון (Amazon S3) דלי, ובחר צור תפקיד.
תפקיד זה ישמש בשלבים הבאים כדי לאפשר ל-SageMaker לגשת ל- Keyspaces Table באמצעות אישורים זמניים מהתפקיד. זה מבטל את הצורך לשמור שם משתמש וסיסמה במחברת.
לאחר מכן, אחזר את התפקיד המשויך ל- saemakeruser שנוצרה בשלב הקודם מקטע הסיכום.
לאחר מכן, נווט אל קונסולת AWS ותסתכל למעלה AWS ניהול זהות וגישה (IAM). בתוך IAM, נווט אל תפקידים. בתוך תפקידים, חפש את תפקיד הביצוע שזוהה בשלב הקודם.
לאחר מכן, בחר את התפקיד שזוהה בשלב הקודם ובחר הוסף הרשאות. בתפריט הנפתח שמופיע, בחר צור מדיניות מוטבעת. SageMaker מאפשר לך לספק רמת גישה מפורטת המגבילה את הפעולות שמשתמש/אפליקציה יכולים לבצע בהתבסס על הדרישות העסקיות.
לאחר מכן, בחר בכרטיסייה JSON והעתק את המדיניות מקטע הערה של Github עמוד. מדיניות זו מאפשרת למחברת SageMaker להתחבר למרווחי מפתח ולאחזר נתונים לעיבוד נוסף.
לאחר מכן, בחר הוסף הרשאות שוב ומהתפריט הנפתח, ובחר צרף מדיניות.
חפש את מדיניות AmazonKeyspacesFullAccess, וסמן את תיבת הסימון שליד התוצאה המתאימה, ובחר צרף מדיניות.
ודא שסעיף מדיניות ההרשאות כולל AmazonS3FullAccess
, AmazonSageMakerFullAccess
, AmazonKeyspacesFullAccess
, כמו גם המדיניות המוטבעת החדשה שנוספה.
לאחר מכן, נווט אל SageMaker Studio באמצעות קונסולת AWS ובחר את SageMaker Studio. כששם, בחר הפעל אפליקציה ובחר סטודיו.
הדרכת מחברת
הדרך המועדפת להתחבר ל-Keyspaces מ-SageMaker Notebook היא באמצעות תהליך AWS Signature גרסה 4 (SigV4) מבוסס אישורים זמניים לצורך אימות. בתרחיש זה, איננו צריכים ליצור או לאחסן אישורים של Keyspaces ויכולים להשתמש באישורים כדי לאמת עם הפלאגין SigV4. אישורי אבטחה זמניים מורכבים ממפתח גישה ומפתח גישה סודי. עם זאת, הם כוללים גם אסימון אבטחה המציין מתי יפוג האישורים. בפוסט זה, ניצור תפקיד IAM וניצור אישורי אבטחה זמניים.
ראשית, אנו מתקינים מנהל התקן (cassandra-sigv4). מנהל התקן זה מאפשר לך להוסיף מידע אימות לבקשות ה-API שלך באמצעות תהליך ה-AWS Signature Version 4 (SigV4). באמצעות התוסף, אתה יכול לספק למשתמשים ולאפליקציות אישורים לטווח קצר כדי לגשת ל-Amazon Keyspaces (עבור Apache Cassandra) באמצעות משתמשי IAM ותפקידים. לאחר מכן, תייבא אישור נדרש יחד עם תלות נוספת בחבילה. בסופו של דבר, אתה תאפשר למחברת לקבל את התפקיד לדבר עם Keyspaces.
לאחר מכן, התחבר לאמזון Keyspaces וקרא נתוני מערכות מ-Keyspaces לתוך Pandas DataFrame כדי לאמת את החיבור.
לאחר מכן, הכינו את הנתונים לאימון על מערך הנתונים הגולמי. במחברת python המשויכת לפוסט זה, השתמש בערכת נתונים קמעונאית שהורדה ממנה כאן, ולעבד אותו. המטרה העסקית שלנו בהתחשב במערך הנתונים היא לאסוף את הלקוחות באמצעות קריאה מטרית ספציפית RFM. מודל ה-RFM מבוסס על שלושה גורמים כמותיים:
- לאחרונה: כמה לאחרונה לקוח ביצע רכישה.
- תדירות: באיזו תדירות לקוח מבצע רכישה.
- ערך כספי: כמה כסף מוציא לקוח על רכישות.
ניתוח RFM מדרג מספרית לקוח בכל אחת משלוש הקטגוריות הללו, בדרך כלל בסולם של 1 עד 5 (ככל שהמספר גבוה יותר, כך התוצאה טובה יותר). הלקוח "הטוב ביותר" יקבל ציון עליון בכל קטגוריה. נשתמש בפונקציית הדיסקרטיזציה מבוססת ה-Quantile (qcut). זה יעזור להבדיל בין ערכים לדליים שווים בגודלם המבוססים או על סמך כמות דגימה.
בדוגמה זו, אנו משתמשים ב-CQL כדי לקרוא רשומות מטבלת Keyspace. במקרים מסוימים של שימוש ב-ML, ייתכן שיהיה עליך לקרוא את אותם נתונים מאותה טבלת Keyspaces מספר פעמים. במקרה זה, אנו ממליצים לשמור את הנתונים שלך בדלי של אמזון S3 כדי להימנע מצריכה נוספת עלותקריאה מאמזון Keyspaces. בהתאם לתרחיש שלך, אתה יכול גם להשתמש אמזון EMR ל לבלוע קובץ Amazon S3 גדול מאוד לתוך SageMaker.
לאחר מכן, אנו מאמנים מודל ML באמצעות אלגוריתם KMeans ומוודאים שהאשכולות נוצרו. בתרחיש הספציפי הזה, תראה שהאשכולות שנוצרו מודפסים, מה שמראה שהלקוחות במערך הנתונים הגולמי קובצו יחד על סמך תכונות שונות במערך הנתונים. ניתן להשתמש במידע על אשכול זה לקמפיינים שיווקיים ממוקדים.
(אופציונלי) לאחר מכן, אנו שומרים את מקטעי הלקוחות שזוהו על ידי מודל ה-ML בחזרה לטבלה של Amazon Keyspaces לשיווק ממוקד. עבודת אצווה יכולה לקרוא את הנתונים האלה ולהריץ מסעות פרסום ממוקדים ללקוחות בפלחים ספציפיים.
לבסוף, אנחנו לנקות את המשאבים נוצר במהלך הדרכה זו כדי למנוע חיוב נוסף.
ייתכן שיחלפו מספר שניות עד דקה כדי להשלים את המחיקה של מרחב המקשים והטבלאות. כאשר אתה מוחק מרחב מקשים, מרחב המקשים וכל הטבלאות שלו נמחקים ואתה מפסיק לצבור חיובים מהם.
סיכום
פוסט זה הראה לך כיצד להטמיע נתוני לקוחות מאמזון Keyspaces לתוך SageMaker ולהכשיר מודל אשכולות שאפשר לך לפלח לקוחות. אתה יכול להשתמש במידע זה לשיווק ממוקד, ובכך לשפר מאוד את ה-KPI העסקי שלך. למידע נוסף על Amazon Keyspaces, עיין במשאבים הבאים:
- אימון מודלים של למידת מכונה באמצעות רווחי מפתחות של אמזון כמקור נתונים (מחברת SageMaker)
- התחבר ל-Amazon Keyspaces משולחן העבודה שלך באמצעות IntelliJ, PyCharm או DataGrip IDEs
- עזר לשפת CQL עבור רווחי מפתחות של אמזון (עבור Apache Cassandra)
- כיצד להגדיר גישת שורת פקודה ל-Amazon Keyspaces (עבור Apache Cassandra) באמצעות ערכת הכלים החדשה למפתחים Docker image
- ניהול זהות וגישה עבור מרחבי מפתחות של אמזון (עבור Apache Cassandra)
- מתחבר לאמזון Keyspaces מ- SageMaker עם אישורים ספציפיים לשירות
- עדכניות, תדירות, ערך כספי (RFM)
- הפניה לקוד Kaggle
על הכותבים
ואדים ליאכוביץ' הוא אדריכל פתרונות בכיר ב-AWS באזור מפרץ סן פרנסיסקו ועוזר ללקוחות לעבור ל-AWS. הוא עובד עם ארגונים החל מארגונים גדולים ועד סטארטאפים קטנים כדי לתמוך בחידושים שלהם. הוא גם עוזר ללקוחות לבנות פתרונות מדרגיים, מאובטחים וחסכוניים ב-AWS.
פרת 'פאטל הוא אדריכל פתרונות ב-AWS באזור מפרץ סן פרנסיסקו. Parth מנחה לקוחות להאיץ את המסע שלהם לענן ולעזור להם לאמץ את הענן של AWS בהצלחה. הוא מתמקד ב-ML ומודרניזציה של יישומים.
רם פאתנגי הוא אדריכל פתרונות ב-AWS באזור מפרץ סן פרנסיסקו. הוא עזר ללקוחות בענפי החקלאות, הביטוח, הבנקאות, הקמעונאות, הבריאות ומדעי החיים, האירוח וההיי-טק לנהל את העסק שלהם בהצלחה בענן AWS. הוא מתמחה בבסיסי נתונים, אנליטיקס ו-ML.
- '
- "
- &
- 10
- 100
- 9
- יכולת
- אודות
- להאיץ
- גישה
- מדויק
- להשיג
- פעולות
- נוסף
- חקלאות
- קדימה
- אַלגוֹרִיתְם
- תעשיות
- אמזון בעברית
- אנליזה
- ניתוח
- אחר
- API
- ממשקי API
- האפליקציה
- בקשה
- יישומים
- AREA
- תשומת לב
- תכונות
- אימות
- באופן אוטומטי
- זמין
- AWS
- בנקאות
- מִפרָץ
- בלוג
- גבול
- לִבנוֹת
- עסקים
- עסקים
- שיחה
- קמפיינים
- אשר
- מקרים
- קטגוריה
- תעודה
- חיובים
- בחירה
- מיון
- ענן
- קוד
- לעומת
- המחשב
- לְחַבֵּר
- הקשר
- קונסול
- עלות תועלת
- יכול
- מדינה
- לִיצוֹר
- נוצר
- אישורים
- לקוח
- לקוחות
- נתונים
- מערך נתונים
- מסד נתונים
- מאגרי מידע
- מספק
- מסירה
- תלוי
- לפרוס
- פריסה
- שולחן העבודה
- לקבוע
- מפתח
- מפתחים
- אחר
- סַוָר
- מטה
- נהג
- ירידה
- בְּמַהֲלָך
- בקלות
- מהנדסים
- חברות
- ציוד
- הערכות
- דוגמה
- הוצאת להורג
- גורמים
- ראשון
- firsttime
- צי
- מתמקד
- לעקוב
- הבא
- מזון
- פרנסיסקו
- פונקציה
- נוסף
- בדרך כלל
- ליצור
- מקבל
- GitHub
- מאוד
- קְבוּצָה
- קבוצה
- מדריך
- בְּרִיאוּת
- בריאות הציבור
- לעזור
- עזרה
- גָבוֹהַ
- גבוה יותר
- מאוד
- היסטוריה
- איך
- איך
- אולם
- HTTPS
- זהות
- תמונה
- ליישם
- השבחה
- שיפור
- לכלול
- כולל
- מדד
- התעשייה
- מידע
- תשתית
- חידושים
- להתקין
- ביטוח
- משולב
- IT
- עבודה
- מסע
- מפתח
- מעבדה
- שפה
- גָדוֹל
- לשגר
- שכבה
- לִלמוֹד
- למידה
- רמה
- מדעי חיים
- לינקדין
- נראה
- נֶאֱמָן
- מכונה
- למידת מכונה
- עשוי
- לתחזק
- עושה
- לנהל
- הצליח
- ניהול
- ניהול
- שיווק
- מסיבי
- תואם
- להרשם/להתחבר
- ML
- מודל
- מודלים
- מוניטרית
- כסף
- ניטור
- יותר
- רוב
- מספר
- הכרחי
- מחברה
- מספר
- להפעיל
- אופטימיזציה
- ארגונים
- אחר
- חבילה
- מסוים
- סיסמה
- תיקון
- תשלום
- חיבור
- מדיניות
- מדיניות
- פופולרי
- אפשרי
- פוטנציאל
- לחזות
- להכין
- קודם
- מחיר
- יְסוֹדִי
- תהליך
- תהליכים
- תהליך
- המוצר
- פִּריוֹן
- פּרוֹפִיל
- מבטיח
- לספק
- מספק
- לִרְכּוֹשׁ
- רכישות
- כמותי
- מהירות
- טִוּוּחַ
- חי
- קריאה
- לקבל
- לאחרונה
- להמליץ
- רשום
- בקשות
- נדרש
- דרישות
- משאבים
- תוצאות
- קמעוני
- סקירה
- הסיכון
- תפקיד
- מסלול
- הפעלה
- סן
- סן פרנסיסקו
- SC
- להרחבה
- סולם
- מדעים
- מדענים
- מסך
- חיפוש
- שניות
- לבטח
- אבטחה
- בטח
- קטע
- פילוח
- מגזרים
- ללא שרת
- שרות
- שירותים
- סט
- משותף
- טווח קצר
- הראה
- דומה
- פָּשׁוּט
- לִישׁוֹן
- קטן
- So
- תוכנה
- מוצק
- פתרונות
- כמה
- מתמחה
- לערום
- החל
- חברות סטארט
- אחסון
- חנות
- סטודיו
- בהצלחה
- תמיכה
- מערכת
- מערכות
- לדבר
- יעד
- ממוקד
- זמני
- השמיים
- דרך
- זמן
- פִּי
- היום
- יַחַד
- אסימון
- ארגז כלים
- כלים
- חלק עליון
- סחר
- הדרכה
- להשתמש
- מקרים לשימוש
- משתמשים
- ערך
- שונים
- גרסה
- אנכיות
- חזון
- מה
- בתוך
- לְלֹא
- עובד
- היה