Tertipu oleh signifikansi statistik

Jangan biarkan penyair berbohong padamu

Lihatlah kuliah terpendek di dunia tentang #statistik dan segala sesuatu yang salah dengan cara orang mendekatinya:

42.

Atau sebaiknya: p= 0.042

Tangkapan layar dari tesaurus.com. Tesaurus saya yang lain sangat buruk, buruk, dan juga buruk.

Bertentangan dengan kepercayaan umum, istilah โ€œsignifikan secara statistikโ€ tidak berarti sesuatu penting, sangat penting, atau meyakinkan ambil tempat. Jika menurut Anda kami menggunakan kata tersebut penting di sini dengan cara yang akan membuat tesaurus Anda bangga, Anda menjadi korban sulap yang licik. Jangan biarkan penyair berbohong padamu.

โ€œJangan biarkan penyair membohongimu.โ€ โ€” Bjork

Bagi mereka yang lebih memilih untuk menjaga eksposur mereka statistik seluk beluknya seminimal mungkin, inilah yang perlu Anda ketahui tentang istilah ini signifikan secara statistik:

  • Ini tidak berarti bahwa sesuatu yang penting telah terjadi.
  • Ini tidak berarti bahwa hasilnya โ€œbesarโ€ atau patut diperhatikan.
  • Itu tidak berarti Anda akan menemukannya data menarik.
  • Artinya seseorang mengaku terkejut terhadap sesuatu.
  • Tidak ada gunanya jika Anda tidak tahu banyak tentangnya seseorang dan sesuatu dalam pertanyaan.

Bagi semua orang selain pengambil keputusan, jarang sekali ada hasil yang signifikan secara statistik penting dalam arti โ€œpentingโ€ โ€” kadang-kadang bagus untuk mengajukan pertanyaan menarik, namun sering kali hal tersebut tidak relevan.

Foto oleh Andrew George on Unsplash

Berhati-hatilah saat orang yang bukan ahli menggunakan istilah ini, terutama jika istilah ini disertai dengan kegembiraan yang membuat sesak napas. Terkadang sangat kurang ajar penipu melangkah lebih jauh dan hilangkan bagian "secara statistik", manfaatkan kekuatan penuh puisi. "Hei lihat," mereka memberitahumu, โ€œapa yang kita bicarakan itu PENTING di mata alam semesta.โ€

Tidak.

Pelanggar terburuk yang mungkin terjadi adalah mereka yang mengucapkan โ€œsignifikan secara statistikโ€ seperti sinonim dari โ€œpasti" atau "tertentu" atau "pengetahuan yang sempurnaโ€ โ€” ada ironi yang hilang di sini. Istilah tersebut berasal dari suatu bidang yang berhubungan dengan ketidakpastian dan dengan demikian (menurut definisi!) hanya termasuk dalam lingkungan di mana pengetahuan kita berada tidak tanpa cela.

Bagi mereka yang lebih suka melawan jargon dengan jargon, saya akan menggunakan bahasa yang lebih formal di bagian selanjutnya. Jangan ragu untuk tidak membahasnya lagi, tetapi jika Anda juga penasaran dan baru di sekitar sini, ambil a jalan memutar kecil untuk memperbesar semua ide terbesar dalam statistik hanya dalam 8 menit:

Sebagian besar tautan dalam artikel saya membawa Anda ke postingan blog tempat saya memberi Anda ikhtisar lebih dalam tentang topik yang disorot, sehingga Anda juga dapat menggunakan artikel ini sebagai landasan peluncuran untuk Petualangan Pilih Anda Sendiri. kursus singkat on ilmu data.

โ€œSignifikansi statistikโ€ hanya berarti bahwa a p-value* cukup rendah untuk mengubah pikiran pengambil keputusan. Dengan kata lain, ini adalah istilah yang kami gunakan untuk menunjukkan bahwa a hipotesis nol adalah ditolak.** Apa adalah hipotesis nol? Dan seberapa ketat ujiannya? ยฏ_(ใƒ„)_/ยฏ

Selamat datang di statistik, di mana Jawabannya berada p = 0.042 tetapi Anda tidak tahu apa pertanyaannya.

Secara teknis, file pengambil keputusan yang menyiapkan syarat uji hipotesis adalah hanya orang yang hasil tesnya signifikan secara statistik.

Statistik memberi Anda seperangkat alat untuk mengambil keputusan, namun cara Anda menggunakannya terserah Anda โ€” ini akan bersifat individual seperti keputusan lainnya.

Foto oleh Towfiqu barbhuiya on Unsplash

Prosesnya melibatkan mengutarakan pertanyaan keputusan Anda dengan sangat hati-hati, memilih asumsi Anda bersedia menerimanya, membuat beberapa pengorbanan risiko tentang berbagai cara jawaban Anda mungkin salah*** (karena keacakan adalah hal yang menyebalkan), dan kemudian menggunakan matematika untuk mendapatkan jawaban yang dikontrol risiko untuk pertanyaan khusus Anda.

Ada sesuatu yang aneh dan lucu dalam popularitasnya sebagai alat untuk penindasan retoris.

Itu sebabnya ahli sejati tidak akan pernah menggunakan statistik seperti palu untuk memukul Kebenaran ke musuhnya. Dua pengambil keputusan dapat menggunakan alat yang sama pada data dan data yang sama sampai pada dua kesimpulan yang berbeda โ€” dan sepenuhnya validโ€ฆ yang berarti ada sesuatu yang menyimpang dan lucu dalam popularitasnya sebagai alat untuk penindasan retoris.

Signifikansi statistik bersifat pribadi. Hanya karena I Saya cukup terkejut dengan data tersebut hingga berubah pikiran, bukan berarti Anda harus terkejut.

Segera setelah saya mengerti bagaimana statistik bekerja, Saya takjub melihat betapa sombongnya โ€” hampir tidak sopan โ€” menyatakan sesuatu yang signifikan secara statistik di hadapan orang-orang yang tidak fasih dalam batasan pengambilan keputusan statistik. Istilah ini terdengar terlalu universal untuk kebaikan siapa pun; itu bermain seperti a โ€œDiam dan percaya padaku karena metodeku bagusโ€ perangkat retoris. Saya harap Anda mau bergabung dengan saya dalam memberikan retorika seperti itu โ€œpffftโ€ itu pantas.

Tunggu dulu, apakah tidak ada yang bisa kita pelajari dari hasil signifikan statistik orang lain?

Di sinilah hal ini menjadi agak filosofis, jadi saya memerlukan artikel terpisah untuk itu pendapat saya tentang pertanyaan itu:

Singkatnya, saran saya adalah tidak masalah untuk mendelegasikan sebagian pengambilan keputusan Anda kepada orang lain selama Anda memercayai mereka kompeten dan mengutamakan kepentingan terbaik Anda. Ketika mereka yakin, Anda akan meminjam pendapat mereka sehingga Anda tidak perlu mengulangi sendiri semua pekerjaan mereka.

Dengan menggunakan kesimpulan statistik orang lain, Anda tidak mendasarkan keputusan Anda pada data melainkan pada kepercayaan Anda pada individu manusia.

Sadarilah bahwa dengan menggunakan hasil orang lain, Anda tidak mendasarkan keputusan Anda pada data melainkan pada kepercayaan Anda pada individu. Tidak ada masalah dalam memilih untuk memercayai orang lain sehingga Anda tidak perlu membangun seluruh pandangan dunia Anda secara empiris dari awal โ€” berbagi pengetahuan adalah bagian dari apa yang membuat spesies manusia begitu sukses โ€” namun perlu disadari bahwa Anda mungkin akan mengalami beberapa kegagalan. telepon di bagian hilir โ€œpengetahuanโ€ apa pun yang menurut Anda sedang Anda pelajari.

Jika Anda membiarkan seseorang mengambil keputusan atas nama Anda - itulah artinya memakan keputusan orang lain p-value dan kesimpulan untuk pengambilan keputusan โ€” maka pastikan orang tersebut adalah orang yang Anda anggap cukup kompeten dan dapat dipercaya.

Bagaimana jika orang yang melontarkan jargon statistik kepada Anda adalah Anda sendiri tidak memercayai? Lari ke bukit!

Kapan pun ada kesan persuasif yang melekat pada pernyataan yang memiliki signifikansi statistik, berhati-hatilah terhadap barang apa pun pembicara sedang menjajakan. Jika Anda memercayai orang yang Anda ajak bicara, Anda tidak memerlukan daya tarik mereka terhadap signifikansi statistik. Yang perlu Anda ketahui adalah mereka yakin. Jika Anda tidak mempercayai mereka, Anda tidak bisa percaya jargon statistik mereka lebih dari yang Anda percayai pada musik jazz mereka.

Apa gunanya sebuah jawaban jika Anda tidak mau repot-repot memahami pertanyaannya?

Jika ada satu hal yang saya ingin Anda ambil dari postingan blog ini, ini adalah: Jika Anda tidak tahu banyak tentang pembuat keputusan dan bagaimana mereka menentukan apakah mereka harus mengambil keputusan atau tidak. berubah pikiran (dan tepatnya tentang apa), maka klaim mereka terkait dengan signifikansi statistik adalah sama sekali tidak ada artinya bagimu. Apa gunanya sebuah jawaban jika Anda tidak mau repot-repot memahami pertanyaannya?

Jika Anda bersenang-senang di sini dan mencari kursus AI terapan yang dirancang untuk menyenangkan bagi pemula dan ahli, berikut ini yang saya buat untuk hiburan Anda:

Nikmati playlist kursus yang dibagi menjadi 120 video pelajaran terpisah di sini: bit.ly/machinefriend

Mari berteman! Anda dapat menemukan saya di Twitter, Youtube, Substacks, dan LinkedIn. Tertarik untuk mengajak saya berbicara di acara Anda? Menggunakan formulir ini untuk menghubungi.

Berikut adalah beberapa panduan 10 menit favorit saya:

*Jika Anda ingin mempelajari apa itu nilai-p, berikut video yang saya buat untuk membantu Anda:

Ini adalah video pertama di playlist YouTube saya, yang dapat Anda temukan di http://bit.ly/quaesita_p1

**Untuk penjelasan tentang pengujian hipotesis, kunjungi saya posting blog tentang topik ini atau lihat sepasang video ini:

Tertipu oleh signifikansi statistik Diterbitkan ulang dari Sumber https://towardsdatascience.com/fooled-by-statistical-significance-7fed1bc2caf9?source=rssโ€”-7f60cf5620c9โ€”4 melalui https://towardsdatascience.com/feed

<!โ€“

->

Stempel Waktu:

Lebih dari Konsultan Blockchain