הבנת למידה עמוקה באמצעות דוגמאות ויזואליות
למידה עמוקה היא אחת מטכניקות הבינה המלאכותית החזקות ביותר, עם זאת, זה יכול להיות קשה להבנה. בבלוג זה, אנסה להסביר למידה עמוקה באמצעות חזותיים ודוגמאות.
ארכיטקטורת למידה עמוקה שואבת השראה מהאופן שבו המוח שלנו פועל. זה חיבור של נוירונים. למודלים של למידה עמוקה יכולים להיות פרמטרים רבים. מספר הפרמטרים מבוסס על מספר השכבות והנוירונים, שיכולים לגדול באופן אקספוננציאלי עבור ארכיטקטורה מתוחכמת.
בבלוג זה, אקח מקרה שימוש עסקי של גילוי הונאה פיננסית. אחד האתגרים הגדולים ביותר בזיהוי הונאה הוא בעיית חוסר האיזון בכיתה, מה שאומר שבנתונים המשמשים לאימון מודלים של למידת מכונה יש מעט מאוד מקרים של הונאה.
זה כמו לאמן מודל למידת מכונה למצוא מחט בערימת שחת. גילוי הונאה הוא בעיה מיוחדת המצדיקה גישה מתוחכמת כגון ארכיטקטורת למידה עמוקה.
בדוגמה אקח נתונים ממערכת העסקאות הבנקאיות. הנתונים נראים כפי שמוצג כאן. לנתונים יש את סוג העסקה הפיננסית, הסכום, כמו גם היתרה הישנה והמקור והיעד, ויתרה חדשה. יש גם דגל שמציין אם העסקה הייתה הונאה או לא.
הציטוט עבור מערך הנתונים זמין בסוף הבלוג.
הנתונים מחולקים לנתוני אימון ומבחן. מודל הלמידה העמוקה פותח על מערך ההדרכה ולאחר מכן הוא עובר תוקף על נתוני המבחן. אז ניתן להשתמש במודל הזה כדי לחזות הונאה על נתונים בלתי נראים.
מודל הלמידה העמוקה לחיזוי הונאה מוצג כאן. נוירוני הקלט תואמים לנתוני העסקה. כל נוירון מתאים לעמודה בנתוני הקלט כגון סוג העסקה, הסכום ומידע היתרה במקור וביעד.
יש שכבת ביניים אחת ואחר כך השכבה הסופית שיש בה שני נוירונים, האחד מנבא אי-הונאה והשני שמנבא אי-הונאה.
הקווים הם אותות המועברים בין השכבות השונות. קו ירוק מציין אות חיובי וקו אדום מציין אות שלילי
אנו רואים שנוירון 1_0 מעביר אות חיובי להונאה של נוירונים.
זה אומר שהיא למדה לעומק איך נראית עסקת הונאה! זה מרגש !
תן לנו להציץ בתוך נוירון 1_0!
תרשים המכ"ם הוא ייצוג של מה שהנוירון למד על הנתונים. קו כחול מציין ערך גבוה, וקו אדום מציין ערך נמוך. תרשים המכ"ם מצביע על מאזן ישן וחדש גבוה, אך כמעט דומה במקור. עם זאת, יש הבדל גדול מאוד בין היתרה הישנה לחדשה ביעד.
מצב כזה מעיד על הונאה. מצב זה יכול להיות מוצג חזותית להלן.
מוצג כאן הדיוק של מודל הלמידה העמוקה באמצעות מטריצת בלבול.
בסך הכל מדובר בכ-95000 עסקאות, מתוכן 62 עסקאות הונאה, שזה פחות באופן קיצוני מסך העסקה. עם זאת, מודל הלמידה העמוקה עושה טוב מכיוון שהוא מסוגל לזהות 52 בצורה נכונה כהונאה, מה שנקרא גם חיובי אמיתי (tp)
יש 1 חיובי שגוי (fp), כלומר, זו לא הונאה, אבל המודל סימן אותה בטעות כהונאה. אז הדיוק, שהוא tp / (tp +fp), שווה ל-98%.
כמו כן, יש 10 שליליות שגויות (fn), מה שאומר שהן עסקאות הונאה, אבל המודל שלנו לא מסוגל לחזות אותן. אז המדד לזכרון שהוא tp / (tp +fn) שהוא 83%
ארכיטקטורת למידה עמוקה היא חזקה מאוד מכיוון שהיא עוזרת לפתור בעיות מורכבות כגון זיהוי הונאה. דרך ויזואלית לנתח ארכיטקטורת למידה עמוקה שימושית בהבנת הארכיטקטורה כמו גם כיצד היא פותרת את הבעיה
ציטוט מקור נתונים עבור מערכי נתונים פיננסיים סינתטיים לגילוי הונאה
הנתונים הפיננסיים הסינתטיים לזיהוי הונאה זמינים כאן: https://www.kaggle.com/competitions/spaceship-titanic/overview
כמפורט בסעיף רישיון, יש לו רישיון CC BY-SA 4.0.
- שיתוף - העתק והפצה מחדש של החומר בכל מדיום או פורמט
- התאם - לערבב מחדש, להפוך ולבנות את החומר לכל מטרה, אפילו מסחרית.
אנא הצטרף לבינוני עם קישור ההפניה שלי.
אנא הירשמו להישאר מעודכן בכל פעם שאני משחרר סיפור חדש.
אתה יכול לבקר באתר שלי כדי לעשות ניתוח עם אפס קידוד. https://experiencedatascience.com
באתר תוכלו גם להשתתף בסדנאות בינה מלאכותית הקרובות להתנסות במדעי נתונים ובינה מלאכותית מעניינת וחדשנית.
הנה קישור לערוץ היוטיוב שלי
https://www.youtube.com/c/DataScienceDemonstrated
למידה עמוקה מוסברת חזותית פורסם מחדש מהמקור https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 דרך https://towardsdatascience.com/feed
<!–
->