Deviasi Standar vs Kesalahan Standar: Apa Bedanya?

Kembar dari Alam Semesta Berbeda

Foto oleh Martin Sanchez on Unsplash

STandard Deviasi dan Standard Error adalah dua konsep statistik yang sering menimbulkan kebingungan. Apakah interpretasinya sama atau dimaksudkan untuk mewakili sesuatu yang sama sekali berbeda? Kita akan membahas lebih lanjut pada postingan kali ini.

Apa itu Standar Deviasi (SD)?

Grafik standar deviasi mengukur variabilitas (alias, penyebaran) titik data di sekitar berarti dalam kumpulan data tertentu. Dengan kata lain, ini memberi tahu kita, secara rata-rata, seberapa jauh jarak setiap titik data dari mean.

Deviasi Standar Populasi

Di dunia nyata, kami tertarik untuk memperkirakan karakteristik tertentu dalam a populasi. Simpangan baku adalah contoh ciri-ciri tersebut.

Ketika Anda memiliki SEMUA titik data dari suatu populasi, Anda dapat menghitungnya BENAR nilai simpangan baku populasi menggunakan rumus sebagai berikut.

Gambar oleh penulis

Contoh Standar Deviasi

Seringkali sulit untuk mengumpulkan semua data dari populasi karena keterbatasan waktu, keuangan, atau teknis. Misalnya, jika kita ingin menghitung BENAR standar deviasi pendapatan rumah tangga di Los Angeles, kita perlu mendapatkan pendapatan dari seluruh rumah tangga di Los Angeles, yang hampir mustahil dilakukan.

Sebaliknya, kita dapat mengumpulkan sampel acak dari populasi dan membuat kesimpulan tentang deviasi standar populasi dengan menggunakan Contoh Standar Deviasi. Rumus simpangan baku sampel adalah

Gambar oleh penulis

Mengapa menggunakan N-1 untuk deviasi standar sampel?

Anda akan melihat bahwa kita menggunakan mean sampel (x̄) dan bukan mean populasi (μ) untuk simpangan baku sampel karena kita tidak mengetahui apa pun tentang mean populasi. x̄ adalah perkiraan yang masuk akal untuk μ.

Oleh karena itu, nilai apa pun X dalam kumpulan data sampel akan lebih dekat ke x̄ dibandingkan ke μ. Pembilang dalam standar deviasi sampel akan menjadi lebih kecil dari yang seharusnya. Hasilnya, simpangan baku sampel akan menjadi diremehkan.

Untuk memperbaikinya prasangka dalam standar deviasi sampel, kami akan menggunakan “N-1” bukannya “N” (alias, Koreksi Bessel) untuk deviasi standar sampel.

Penggunaan N-1 akan membuat deviasi standar sampel lebih besar dibandingkan jika menggunakan N. Oleh karena itu, kita mempunyai estimasi deviasi standar populasi yang tidak terlalu bias, sehingga menghasilkan estimasi variabilitas yang konservatif.

Apa itu Kesalahan Standar (SE)?

Sebelum kita membahas Standard Error, mari kita kenali dulu konsepnya Distribusi Sampel dan Distribusi Sampling.

Distribusi Sampel vs Distribusi Sampling

Grafik distribusi sampel adalah distribusi data sampel yang diambil secara acak dari populasi.

Misalnya, kami menanyakan 100 orang secara acak di Los Angeles berapa pendapatan mereka. Distribusi sampel menggambarkan SEBENARNYA distribusi pendapatan pada 100 orang tersebut.

Tapi apa itu Distribusi Sampling?

Grafik distribusi sampling adalah distribusi statistik sampel (misalnya, mean sampel, varians sampel, deviasi standar sampel, dan proporsi sampel) terhadap banyak sampel yang diambil dari populasi yang sama (yaitu, pengambilan sampel berulang).

Misalnya, kami menanyakan 100 orang secara acak di Los Angeles berapa pendapatan mereka. Kemudian hitung pendapatan rata-ratanya. Kita ulangi ini 1000 kali, maka kita mempunyai 1000 pendapatan rata-rata yang berbeda. Distribusi 1000 pendapatan rata-rata ini disebut distribusi sampling.

Oleh karena itu, distribusi sampel adalah distribusi contoh data sementara distribusi sampling adalah distribusi statistik sampel.

Konsepnya adalah kesalahan standar relevan dengan distribusi sampling, BUKAN distribusi sampel.

Grafik Kesalahan Standar adalah metrik yang menggambarkan variabilitas suatu statistik dalam distribusi pengambilan sampel.

Bagaimana cara mengartikan Standard Error (SE)?

Kesalahan Standar mengukur seberapa jauh statistik sampel (misalnya, mean sampel) kemungkinan besar berasal dari statistik populasi yang sebenarnya (misalnya, rata-rata populasi).

Mengapa kita memerlukan Standard Error (SE)?

Biasanya Anda mungkin ingin membangun interval kepercayaan ketika kita mencoba membuat kesimpulan statistik, dan akan lebih informatif jika kita menetapkan probabilitas untuk membangun interval kepercayaan yang berisi mean.

  • Jika data yang mendasarinya berdistribusi normal, maka distribusi sampling juga berdistribusi normal. Maka kita dapat mengatakan bahwa kita yakin 68% bahwa rata-rata populasi berada dalam 1 kesalahan standar atau 95% akan berada dalam 2 kesalahan standar, dan seterusnya.
  • Jika data yang mendasarinya TIDAK terdistribusi secara normal, namun ukuran sampelnya cukup besar, kita dapat mengandalkannya Teorema Limit Pusat (CLT) untuk mengatakan distribusi sampling mendekati terdistribusi normal, maka kita dapat membuat pernyataan serupa tentang interval kepercayaan.

Bagaimana cara menghitung Standard Error (SE)?

Kami biasanya menggunakan rumus berikut untuk menghitung kesalahan standar. Saya akan membahas cara menurunkan rumus ini di bagian selanjutnya.

Gambar oleh penulis

Apa saja contoh Kesalahan Standar?

Standard Error dapat diterapkan pada berbagai jenis statistik. Beberapa contoh populer adalah

  • Kesalahan Standar Rata-Rata Sampel (alias, kesalahan standar rata-rata, SEM)
  • Kesalahan Standar Proporsi Sampel (alias, kesalahan standar proporsi, SEP)

Apa yang dimaksud dengan Kesalahan Standar Mean (SEM)?

Kesalahan standar rata-rata (atau kesalahan standar saja), menunjukkan betapa berbedanya rata-rata tersebut mean sampel kemungkinan besar berasal dari populasi berarti.

Secara teknis, kesalahan standar mean dihitung sebagai deviasi standar mean sampel.

Gambar oleh penulis

Secara hipotetis, kita dapat menghitung kesalahan standar pada sampel berulang menggunakan langkah-langkah berikut:

  1. Ambil sampel baru dari populasi.
  2. Hitung mean sampel dari sampel yang diambil pada Langkah 1
  3. Ulangi Langkah 1 dan 2 beberapa kali.
  4. Kesalahan standar diperoleh dengan menghitung deviasi standar dari rata-rata sampel langkah sebelumnya.

Berkat Teorema Limit Pusat (CLT), kita tidak perlu mempertimbangkan Distribusi Pengambilan Sampel pada sampel berulang. Sebaliknya, distribusi sampling dari rata-rata sampel dapat diperkirakan hanya dari SATU sampel acak.

Teorema Limit Pusat menyatakan bahwa mean sampel mempunyai distribusi mendekati normal dengan a rata-rata μ dan deviasi standar (atau kesalahan standar) sebesar σ/√n.

Bagaimana cara mendapatkan rumus SEM?

Gambar oleh penulis

Oleh karena itu,

Gambar oleh penulis

Dalam kebanyakan kasus, simpangan baku data populasi tidak diketahui. Kami akan memperkirakannya menggunakan standar deviasi data sampel (sample standar deviasi).

Oleh karena itu,

Gambar oleh penulis

Apa yang dimaksud dengan Kesalahan Standar Proporsi (SEP)?

Kesalahan standar proporsi menunjukkan betapa berbedanya proporsi sampel kemungkinan besar berasal dari proporsi penduduk.

Kesalahan standar proporsi dihitung sebagai deviasi standar proporsi sampel.

Gambar oleh penulis

Anda akan melihat bahwa dalam setiap data sampel, kami hanya memiliki data 1 atau 0. Setiap nilai mengikuti a Distribusi Bernouilli. Proporsi sampel yang dihitung bukan lagi nilai biner. Sebaliknya, nilainya bisa berapa pun antara 0 dan 1.

Teorema Batas Pusat menyatakan bahwa proporsi sampel mempunyai distribusi mendekati normal dengan a rata-rata p dan deviasi standar (atau kesalahan standar) sebesar √P(1-P)/√n, dimana P adalah proporsi penduduk.

Bagaimana cara menurunkan rumus SEP?

Gambar oleh penulis

Mirip dengan SEM,

Gambar oleh penulis
Gambar oleh penulis

Kita bisa memperkirakannya σ menggunakan deviasi standar sampel √p(1-p) (yaitu, deviasi standar distribusi Bernouilli)

Gambar oleh penulis

Kesimpulan:

Deviasi Standar dan Kesalahan Standar adalah konsep serupa yang keduanya digunakan untuk mengukur variabilitas.

Standar Deviasi menunjukkan bagaimana contoh nilai data berbeda dari mean di distribusi sampel.

Kesalahan Standar menunjukkan bagaimana statistik data sampel berbeda dengan statistik populasi di distribusi sampling.

Terima kasih telah membaca !!!

Jika Anda menikmati artikel ini dan menginginkannya Belikan Aku Kopi, silahkan klik disini.

Anda dapat mendaftar untuk a keanggotaan untuk membuka akses penuh ke artikel saya, dan memiliki akses tak terbatas ke semua hal di Medium. Silakan berlangganan jika Anda ingin mendapatkan notifikasi email setiap kali saya memposting artikel baru.

Deviasi Standar vs Kesalahan Standar: Apa Bedanya? Diterbitkan ulang dari Sumber https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 melalui https://towardsdatascience.com/feed

<!–

->

Stempel Waktu:

Lebih dari Konsultan Blockchain