ค่าเบี่ยงเบนมาตรฐานกับข้อผิดพลาดมาตรฐาน: อะไรคือความแตกต่าง?

ฝาแฝดจากต่างจักรวาล

ภาพถ่ายโดย มาร์ตินซานเชซ on Unsplash

Sค่าเบี่ยงเบนมาตรฐานและข้อผิดพลาดมาตรฐานเป็นแนวคิดทางสถิติสองประการที่มักทำให้เกิดความสับสน พวกเขามีการตีความที่เหมือนกันหรือมีจุดมุ่งหมายเพื่อแสดงถึงสิ่งที่แตกต่างไปจากเดิมอย่างสิ้นเชิงหรือไม่? เราจะพูดคุยเพิ่มเติมในโพสต์นี้

ค่าเบี่ยงเบนมาตรฐาน (SD) คืออะไร?

พื้นที่ ส่วนเบี่ยงเบนมาตรฐาน วัด ความแปรปรวน (เรียกอีกอย่างว่า กระจาย) ของจุดข้อมูลรอบๆ หมายความ ในชุดข้อมูลที่กำหนด กล่าวอีกนัยหนึ่ง มันบอกเราว่าโดยเฉลี่ยแล้วจุดข้อมูลแต่ละจุดอยู่ห่างจากค่าเฉลี่ยเท่าใด

ค่าเบี่ยงเบนมาตรฐานของประชากร

ในโลกแห่งความเป็นจริง เราสนใจที่จะประมาณค่าคุณลักษณะบางอย่างใน a ประชากร. ส่วนเบี่ยงเบนมาตรฐานคือ ตัวอย่างของลักษณะเหล่านี้

เมื่อคุณมี ทั้งหมด จุดข้อมูลจากประชากร คุณสามารถคำนวณได้ TRUE ค่าเบี่ยงเบนมาตรฐานประชากรโดยใช้สูตรต่อไปนี้

ภาพโดยผู้เขียน

ตัวอย่างค่าเบี่ยงเบนมาตรฐาน

บ่อยครั้ง การรวบรวมจุดข้อมูลทั้งหมดจากประชากรเป็นเรื่องยากเนื่องจากข้อจำกัดด้านเวลา การเงิน หรือทางเทคนิค เช่น ถ้าเราอยากจะคำนวณ TRUE ค่าเบี่ยงเบนมาตรฐานของรายได้ครัวเรือนในลอสแอนเจลิส เราจะต้องได้รับรายได้จากทุกครัวเรือนในลอสแอนเจลิส ซึ่งแทบจะเป็นไปไม่ได้เลย

แต่เราสามารถสุ่มตัวอย่างจากประชากรและทำการอนุมานเกี่ยวกับค่าเบี่ยงเบนมาตรฐานของประชากรโดยใช้ ตัวอย่างค่าเบี่ยงเบนมาตรฐาน สูตรสำหรับค่าเบี่ยงเบนมาตรฐานตัวอย่างคือ

ภาพโดยผู้เขียน

เหตุใดจึงต้องใช้ N-1 สำหรับค่าเบี่ยงเบนมาตรฐานตัวอย่าง

คุณจะสังเกตเห็นว่าเราใช้ค่าเฉลี่ยตัวอย่าง (x̄) แทนค่าเฉลี่ยประชากร (μ) สำหรับค่าเบี่ยงเบนมาตรฐานตัวอย่าง เพราะเราไม่รู้อะไรเกี่ยวกับค่าเฉลี่ยประชากรเลย x̄ เป็นค่าประมาณที่สมเหตุสมผลสำหรับ μ

ดังนั้น ค่า X ใดๆ ในชุดข้อมูลตัวอย่างจะใกล้กับ x̄ มากกว่าค่า μ ตัวเศษในส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างจะน้อยกว่าที่ควรจะเป็น ผลลัพธ์ที่ได้คือค่าเบี่ยงเบนมาตรฐานตัวอย่างจะเป็น ประเมิน.

เพื่อแก้ไขปัญหานี้ อคติ ในส่วนเบี่ยงเบนมาตรฐานตัวอย่าง เราจะใช้ “N-1” แทน “N” (อาคา การแก้ไขของเบสเซล) สำหรับค่าเบี่ยงเบนมาตรฐานตัวอย่าง.

การใช้ N-1 จะทำให้ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างมีขนาดใหญ่กว่าการใช้ N อย่างอื่น ดังนั้นเราจึงมีการประมาณค่าเบี่ยงเบนมาตรฐานประชากรที่มีอคติน้อยกว่า ทำให้เราได้ค่าประมาณความแปรปรวนแบบอนุรักษ์นิยม

ข้อผิดพลาดมาตรฐาน (SE) คืออะไร?

ก่อนที่เราจะพูดถึงข้อผิดพลาดมาตรฐาน ก่อนอื่นเรามาทำความคุ้นเคยกับแนวคิดของ การกระจายตัวอย่าง และ การกระจายตัวอย่าง.

การกระจายตัวอย่างและการกระจายตัวอย่าง

พื้นที่ การกระจายตัวอย่าง เป็นเพียงไฟล์ การกระจายข้อมูล ของกลุ่มตัวอย่างที่สุ่มมาจากประชากร

ตัวอย่างเช่น เราสุ่มถามผู้คน 100 คนในลอสแอนเจลีสว่ารายได้ของพวกเขาเป็นอย่างไร การกระจายตัวอย่างอธิบายถึง ที่เกิดขึ้นจริง การกระจายรายได้ใน 100 คนนี้

แต่การกระจายตัวอย่างคืออะไร?

พื้นที่ การกระจายตัวอย่าง คือ การกระจายตัวของสถิติตัวอย่าง (เช่น ค่าเฉลี่ยตัวอย่าง ความแปรปรวนตัวอย่าง ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง และสัดส่วนตัวอย่าง) เหนือตัวอย่างจำนวนมากที่มาจากประชากรกลุ่มเดียวกัน (เช่น การสุ่มตัวอย่างซ้ำ).

ตัวอย่างเช่น เราสุ่มถามผู้คน 100 คนในลอสแอนเจลีสว่ารายได้ของพวกเขาเป็นอย่างไร แล้วคำนวณรายได้เฉลี่ย เราทำซ้ำ 1000 ครั้ง เราก็มีรายได้เฉลี่ยต่างกัน 1000 รายการ การกระจายตัวของรายได้เฉลี่ย 1000 รายนี้เรียกว่าการกระจายตัวอย่าง

ดังนั้น การกระจายตัวอย่าง คือการกระจายตัวของ ข้อมูลตัวอย่าง ในขณะที่ การกระจายตัวอย่าง คือการกระจายตัวของ สถิติตัวอย่าง

แนวคิดก็คือ มาตรฐานบกพร่อง เกี่ยวข้องกับการกระจายตัวอย่าง ไม่ใช่การกระจายตัวอย่าง

พื้นที่ มาตรฐานบกพร่อง เป็นตัวชี้วัดที่อธิบายถึง ความแปรปรวนของสถิติ ใน การกระจายตัวอย่าง

จะตีความ Standard Error (SE) ได้อย่างไร

ข้อผิดพลาดมาตรฐานจะวัดว่าไกลแค่ไหน สถิติตัวอย่าง (เช่น ค่าเฉลี่ยตัวอย่าง) น่าจะมาจาก สถิติประชากรที่แท้จริง (เช่น ค่าเฉลี่ยประชากร)

เหตุใดเราจึงต้องมีข้อผิดพลาดมาตรฐาน (SE)

โดยปกติคุณอาจต้องการสร้าง ช่วงความเชื่อมั่น เมื่อเราพยายามอนุมานทางสถิติ และการระบุความน่าจะเป็นในการสร้างช่วงความเชื่อมั่นที่มีค่าเฉลี่ยจะมีข้อมูลมากกว่า

  • หากข้อมูลพื้นฐานมีการกระจายตามปกติ การกระจายตัวอย่างก็จะถูกกระจายตามปกติเช่นกัน จากนั้นเราสามารถพูดได้ว่าเรามั่นใจ 68% ว่าค่าเฉลี่ยประชากรอยู่ภายในข้อผิดพลาดมาตรฐาน 1 ข้อ หรือ 95% จะอยู่ภายในข้อผิดพลาดมาตรฐาน 2 ข้อ เป็นต้น
  • หากข้อมูลพื้นฐานไม่ได้กระจายตามปกติ แต่ขนาดตัวอย่างมีขนาดใหญ่เพียงพอ เราก็วางใจได้ ทฤษฎีบทขีดจำกัดกลาง (CLT) หากจะบอกว่าการกระจายตัวอย่างเป็นแบบกระจายปกติโดยประมาณ เราก็สามารถสร้างข้อความที่คล้ายกันเกี่ยวกับช่วงความเชื่อมั่นได้

จะคำนวณ Standard Error (SE) ได้อย่างไร

โดยทั่วไปเราใช้สูตรต่อไปนี้เพื่อคำนวณข้อผิดพลาดมาตรฐาน ฉันจะหารือถึงวิธีการรับสูตรนี้ในหัวข้อถัดไป

ภาพโดยผู้เขียน

ตัวอย่างของข้อผิดพลาดมาตรฐานมีอะไรบ้าง

Standard Error สามารถใช้ได้กับประเภทต่างๆ สถิติ. ตัวอย่างยอดนิยมบางส่วนคือ

  • ข้อผิดพลาดมาตรฐานของค่าเฉลี่ยตัวอย่าง (หรือที่เรียกว่าข้อผิดพลาดมาตรฐานของค่าเฉลี่ย SEM)
  • ข้อผิดพลาดมาตรฐานของสัดส่วนตัวอย่าง (หรือที่เรียกว่าข้อผิดพลาดมาตรฐานของสัดส่วน SEP)

ข้อผิดพลาดมาตรฐานของค่าเฉลี่ย (SEM) คืออะไร

ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย (หรือค่าคลาดเคลื่อนมาตรฐาน) บ่งชี้ว่าค่าคลาดเคลื่อนมาตรฐานแตกต่างกันอย่างไร ค่าเฉลี่ยตัวอย่าง น่าจะมาจาก ค่าเฉลี่ยประชากร.

ในทางเทคนิคแล้ว ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยจะคำนวณเป็นค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่าง

ภาพโดยผู้เขียน

ตามสมมุติฐาน เราสามารถคำนวณข้อผิดพลาดมาตรฐานภายใต้ตัวอย่างซ้ำๆ ได้โดยใช้ขั้นตอนต่อไปนี้:

  1. ดึงตัวอย่างใหม่จากประชากร
  2. คำนวณค่าเฉลี่ยตัวอย่างของตัวอย่างที่วาดไว้ในขั้นตอนที่ 1
  3. ทำซ้ำขั้นตอนที่ 1 และ 2 หลายครั้ง
  4. ข้อผิดพลาดมาตรฐานได้มาจากการคำนวณค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่างในขั้นตอนก่อนหน้า

ด้วย ทฤษฎีบทขีดจำกัดกลาง (CLT)เราไม่จำเป็นต้องพิจารณาการกระจายตัวอย่างภายใต้ตัวอย่างซ้ำ ในทางกลับกัน การกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างสามารถประมาณได้จากตัวอย่างแบบสุ่มเพียงตัวอย่างเดียว

ทฤษฎีบทขีดจำกัดศูนย์กลางระบุว่าค่าเฉลี่ยตัวอย่างมีการแจกแจงแบบปกติโดยประมาณด้วย a ค่าเฉลี่ยของμ และ ส่วนเบี่ยงเบนมาตรฐาน (หรือข้อผิดพลาดมาตรฐาน) ของ σ/√n.

จะหาสูตร SEM ได้อย่างไร?

ภาพโดยผู้เขียน

ดังนั้น

ภาพโดยผู้เขียน

ในกรณีส่วนใหญ่ จะไม่ทราบค่าเบี่ยงเบนมาตรฐานของข้อมูลประชากร เราจะประมาณค่าโดยใช้ค่าเบี่ยงเบนมาตรฐานของข้อมูลตัวอย่าง (ค่าเบี่ยงเบนมาตรฐานตัวอย่าง)

ดังนั้น

ภาพโดยผู้เขียน

ข้อผิดพลาดมาตรฐานของสัดส่วน (SEP) คืออะไร?

ค่าคลาดเคลื่อนมาตรฐานของสัดส่วนบ่งชี้ว่ามีความแตกต่างกันอย่างไร สัดส่วนตัวอย่าง น่าจะมาจาก สัดส่วนประชากร.

ค่าคลาดเคลื่อนมาตรฐานของสัดส่วนจะคำนวณเป็นค่าเบี่ยงเบนมาตรฐานของสัดส่วนตัวอย่าง

ภาพโดยผู้เขียน

คุณจะสังเกตได้ว่าในแต่ละข้อมูลตัวอย่าง เรามีเพียงข้อมูล 1 หรือ 0 เท่านั้น แต่ละค่าตามหลัง a การกระจายเบอร์นุอิลลี่. สัดส่วนตัวอย่างที่คำนวณได้ไม่ใช่ค่าไบนารีอีกต่อไป แต่อาจเป็นค่าใดก็ได้ระหว่าง 0 ถึง 1

ทฤษฎีบทขีดจำกัดศูนย์กลางระบุว่าสัดส่วนตัวอย่างมีการแจกแจงแบบปกติโดยประมาณโดยมี a ค่าเฉลี่ยของ p และ ส่วนเบี่ยงเบนมาตรฐาน (หรือข้อผิดพลาดมาตรฐาน) ของ √P(1-P)/√nโดยที่ P คือสัดส่วนประชากร

จะได้สูตรสำหรับ SEP ได้อย่างไร

ภาพโดยผู้เขียน

คล้ายกับ SEM

ภาพโดยผู้เขียน
ภาพโดยผู้เขียน

เราสามารถประมาณได้ σ โดยใช้ค่าเบี่ยงเบนมาตรฐานตัวอย่าง √พี(1-พี) (เช่น ค่าเบี่ยงเบนมาตรฐานของการแจกแจงแบบเบอร์นูอิลลี)

ภาพโดยผู้เขียน

สรุป:

ค่าเบี่ยงเบนมาตรฐานและข้อผิดพลาดมาตรฐานเป็นแนวคิดที่คล้ายกันซึ่งทั้งสองค่าใช้ในการวัด ความแปรปรวน

ส่วนเบี่ยงเบนมาตรฐาน บ่งชี้ว่า ค่าข้อมูลตัวอย่าง แตกต่างจากค่าเฉลี่ยใน การกระจายตัวอย่าง.

มาตรฐานบกพร่อง บ่งชี้ว่า สถิติข้อมูลตัวอย่าง แตกต่างจากสถิติประชากรใน การกระจายตัวอย่าง.

ขอบคุณสำหรับการอ่าน !!!

หากคุณชอบบทความนี้และต้องการ ซื้อกาแฟให้ฉัน กรุณา คลิกที่นี่.

คุณสามารถลงชื่อสมัครใช้ไฟล์ การเป็นสมาชิก เพื่อปลดล็อกการเข้าถึงบทความของฉันอย่างเต็มรูปแบบ และเข้าถึงทุกสิ่งบนสื่อได้อย่างไม่จำกัด โปรด สมัครเป็นสมาชิก หากคุณต้องการรับการแจ้งเตือนทางอีเมลทุกครั้งที่ฉันโพสต์บทความใหม่

ค่าเบี่ยงเบนมาตรฐานกับข้อผิดพลาดมาตรฐาน: อะไรคือความแตกต่าง? เผยแพร่ซ้ำจากแหล่งที่มา https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 ผ่าน https://towardsdatascience.com/feed

<!–

->

ประทับเวลา:

เพิ่มเติมจาก ที่ปรึกษาบล็อคเชน