סטיית תקן לעומת שגיאת תקן: מה ההבדל?

תאומים מיקומים שונים

תמונה על ידי מרטין סאנצ'ס on Unsplash

Sסטיית טנדרד ושגיאת תקן הם שני מושגים סטטיסטיים שגורמים לרוב לבלבול. האם יש להם אותן פרשנויות או שהם נועדו לייצג משהו אחר לגמרי? נדון יותר בפוסט זה.

מהי סטיית תקן (SD)?

אל האני סטיית תקן מודד את הִשׁתַנוּת (כלומר, ה התפשטות) של נקודות נתונים סביב אומר במערך נתונים נתון. במילים אחרות, זה אומר לנו, בממוצע, כמה רחוקה כל נקודת נתונים מהממוצע.

סטיית תקן אוכלוסייה

בעולם האמיתי, אנו מעוניינים להעריך מאפיין מסוים ב-a אוכלוסייה. סטיית תקן היא דוגמה למאפיינים אלו.

כשיש לך הכל את נקודות הנתונים מאוכלוסיה, אתה יכול לחשב את נכון ערך סטיית התקן של האוכלוסייה באמצעות הנוסחה הבאה.

תמונה מאת המחבר

סטיית תקן לדוגמא

לעתים קרובות, קשה לאסוף את כל נקודות הנתונים מהאוכלוסייה עקב מגבלות זמן, כספיות או טכניות. לדוגמה, אם נרצה לחשב את נכון סטיית תקן של הכנסת משק הבית בלוס אנג'לס, נצטרך לקבל הכנסה מכל משקי הבית בלוס אנג'לס, דבר שכמעט בלתי אפשרי לעשות.

במקום זאת, אנו יכולים לאסוף מדגמים אקראיים מהאוכלוסייה ולהסיק מסקנות לגבי סטיית התקן של האוכלוסייה באמצעות סטיית תקן לדוגמה. הנוסחה לסטיית תקן מדגם היא

תמונה מאת המחבר

מדוע להשתמש ב-N-1 עבור סטיית תקן לדוגמה?

תבחין שאנו משתמשים בממוצע המדגם (x̄) במקום בממוצע האוכלוסייה (μ) עבור סטיית התקן של המדגם מכיוון שאיננו יודעים דבר על ממוצע האוכלוסייה. x̄ הוא הערכה סבירה עבור μ.

לכן, כל ערך X במערך הנתונים לדוגמה יהיה קרוב יותר ל-x מאשר ל-μ. המונה בסטיית התקן המדגם יצטמצם באופן מלאכותי ממה שהוא אמור להיות. כתוצאה מכך, סטיית התקן המדגם תהיה לזלזל.

כדי לתקן זאת הטיה בסטיית התקן לדוגמה, היינו משתמשים "N-1" במקום "N" (כלומר, התיקון של בסל) עבור סטיית תקן לדוגמה.

שימוש ב-N-1 יגרום לסטיית התקן של המדגם להיות גדולה יותר מאשר אחרת באמצעות N. לכן, יש לנו אומדן פחות מוטה של ​​סטיית התקן של האוכלוסייה, מה שנותן לנו אומדן שמרני של השונות.

מהי שגיאה רגילה (SE)?

לפני שנדון בשגיאת התקן, בואו נכיר תחילה את המושגים של הפצת דוגמאות ו התפלגות דגימה.

חלוקת דגימה מול חלוקת דגימה

אל האני התפלגות מדגם הוא פשוט ה הפצת נתונים מהמדגם שנלקח באקראי מהאוכלוסייה.

לדוגמה, אנו שואלים 100 אנשים אקראיים בלוס אנג'לס מה ההכנסה שלהם. התפלגות המדגם מתארת ​​את מַמָשִׁי חלוקת ההכנסה ב-100 האנשים הללו.

אבל מהי הפצת דגימה?

אל האני התפלגות דגימה האם ה התפלגות הנתון המדגם (למשל, ממוצע המדגם, שונות המדגם, סטיית התקן של המדגם ושיעור המדגם) על פני מדגמים רבים שנלקחו מאותה אוכלוסייה (כלומר, דגימה חוזרת).

לדוגמה, אנו שואלים 100 אנשים אקראיים בלוס אנג'לס מה ההכנסה שלהם. לאחר מכן מחשב את ההכנסה הממוצעת. אנחנו חוזרים על זה 1000 פעמים, ואז יש לנו 1000 הכנסות ממוצעות שונות. ההתפלגות של 1000 ההכנסות הממוצעות הללו נקראת התפלגות הדגימה.

לכן, התפלגות מדגם היא התפלגות של נתונים לדוגמא בזמן התפלגות דגימה היא התפלגות של סטטיסטיקה לדוגמה.

הקונספט הוא שגיאת תקן רלוונטי להתפלגות הדגימה, לא להתפלגות המדגם.

אל האני שגיאה סטנדרטית הוא מדד המתאר את שונות של סטטיסטיקה ב התפלגות דגימה.

כיצד לפרש שגיאה סטנדרטית (SE)?

השגיאה הסטנדרטית מודדת עד כמה ה- נתון מדגם (למשל, ממוצע מדגם) עשוי להיות מה- נתון אוכלוסין אמיתי (למשל, ממוצע האוכלוסייה).

למה אנחנו צריכים שגיאה רגילה (SE)?

בדרך כלל אולי תרצה לבנות רווחי סמך כאשר אנו מנסים להסיק מסקנות סטטיסטיות, וזה יותר אינפורמטיבי להקצות הסתברות לבניית רווח סמך המכיל את הממוצע.

  • אם הנתונים הבסיסיים מחולקים נורמלית, אז גם התפלגות הדגימה מתפלגת בצורה נורמלית. אז אנחנו יכולים לומר שאנחנו בטוחים ב-68% שממוצע האוכלוסייה נמצא בטווח של שגיאת תקן אחת או ש-1% יהיו בתוך 95 שגיאות תקן וכו'.
  • אם הנתונים הבסיסיים אינם מופצים באופן נורמלי, אך גודל המדגם גדול מספיק, אנו יכולים לסמוך עליהם משפט הגבול המרכזי (CLT) אם לומר שהתפלגות הדגימה מתפלגת נורמלית בערך, אז נוכל להצהיר הצהרות דומות לגבי רווחי סמך.

כיצד לחשב שגיאה רגילה (SE)?

בדרך כלל אנו משתמשים בנוסחה הבאה כדי לחשב את השגיאה הסטנדרטית. אדון כיצד לגזור נוסחה זו בסעיפים הבאים.

תמונה מאת המחבר

מהן הדוגמאות לשגיאה סטנדרטית?

ניתן להחיל שגיאת תקן על סוגים שונים של סטָטִיסטִיקָה. כמה דוגמאות פופולריות הן

  • השגיאה הסטנדרטית של ממוצע המדגם (שגיאה סטנדרטית של הממוצע, SEM)
  • השגיאה הסטנדרטית של פרופורציית המדגם (הידועה גם היא, השגיאה הסטנדרטית של הפרופורציה, SEP)

מהי השגיאה הסטנדרטית של הממוצע (SEM)?

שגיאת התקן של הממוצע (או פשוט שגיאת תקן), מציינת עד כמה שונה ה- ממוצע מדגם סביר להניח שהוא מה ממוצע האוכלוסייה.

מבחינה טכנית, שגיאת התקן של הממוצע מחושבת כסטיית התקן של ממוצע המדגם.

תמונה מאת המחבר

באופן היפותטי, אנו יכולים לחשב את השגיאה הסטנדרטית תחת דגימות חוזרות ונשנות באמצעות השלבים הבאים:

  1. צייר מדגם חדש מהאוכלוסייה.
  2. חשב את ממוצע המדגם של המדגם שצויר בשלב 1
  3. חזור על שלבים 1 ו-2 מספר פעמים.
  4. שגיאת התקן מתקבלת על ידי חישוב סטיית התקן של אמצעי המדגם של השלבים הקודמים.

תודה משפט הגבול המרכזי (CLT), איננו צריכים לשקול את התפלגות הדגימה תחת דגימות חוזרות ונשנות. במקום זאת, ניתן להעריך את התפלגות הדגימה של אמצעי המדגם ממדגם אקראי אחד בלבד.

משפט הגבול המרכזי קובע שלממוצע המדגם יש התפלגות נורמלית בקירוב עם a ממוצע של μ וכן סטיית תקן (או שגיאת תקן) של σ/√n.

כיצד לגזור את הנוסחה עבור SEM?

תמונה מאת המחבר

לכן,

תמונה מאת המחבר

ברוב המקרים, סטיית התקן של נתוני האוכלוסייה אינה ידועה. נאמוד אותו באמצעות סטיית התקן של נתוני המדגם (סטיית תקן מדגם).

לכן,

תמונה מאת המחבר

מהי השגיאה הסטנדרטית של הפרופורציה (SEP)?

טעות התקן של הפרופורציה מציינת עד כמה שונה ה פרופורציה לדוגמה סביר להניח שהוא מה שיעור האוכלוסייה.

טעות התקן של הפרופורציה מחושבת כסטיית התקן של פרופורציות המדגם.

תמונה מאת המחבר

תבחין שבכל נתוני דוגמה, יש לנו רק נתונים 1 או 0. כל ערך אחרי a הפצת ברנוילי. פרופורציות המדגם המחושבות אינן עוד ערכים בינאריים. במקום זאת, הם יכולים להיות כל ערך בין 0 ל-1.

משפט הגבול המרכזי קובע שלפרופורציה המדגם יש התפלגות נורמלית בקירוב עם a ממוצע של p וכן סטיית תקן (או שגיאת תקן) של √P(1-P)/√n, כאשר P הוא שיעור האוכלוסייה.

כיצד לגזור את הנוסחה עבור SEP?

תמונה מאת המחבר

בדומה ל-SEM,

תמונה מאת המחבר
תמונה מאת המחבר

אנחנו יכולים להעריך σ באמצעות סטיית התקן לדוגמה √p(1-p) (כלומר, סטיית התקן של התפלגות ברנוילי)

תמונה מאת המחבר

סיכום:

סטיית תקן ושגיאת תקן הם מושגים דומים ששניהם משמשים למדידה הִשׁתַנוּת.

סטיית תקן מציין כיצד ערכי נתונים לדוגמה שונים מהממוצע ב- התפלגות מדגם.

שגיאה סטנדרטית מציין כיצד נתונים סטטיסטיים לדוגמה שונים מסטטיסטיקת האוכלוסייה ב- התפלגות דגימה.

תודה שקראת !!!

אם אתה נהנה מהמאמר הזה ותרצה קנה לי קפה, אנא לחץ כאן.

אתה יכול להירשם ל- חֲבֵרוּת כדי לפתוח גישה מלאה למאמרים שלי, ולקבל גישה בלתי מוגבלת לכל דבר ב-Medium. אנא הירשמו אם תרצה לקבל הודעת דוא"ל בכל פעם שאני מפרסם מאמר חדש.

סטיית תקן לעומת שגיאת תקן: מה ההבדל? פורסם מחדש ממקור https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 דרך https://towardsdatascience.com/feed

<!–

->

בול זמן:

עוד מ יועצי בלוקצ'יין