ถูกหลอกด้วยนัยสำคัญทางสถิติ

อย่าปล่อยให้กวีโกหกคุณ

ชมการบรรยายที่สั้นที่สุดในโลกเรื่อง #สถิติ และทุกสิ่งที่ไม่ถูกต้องกับวิธีที่ผู้คนเข้าถึง:

42.

หรือว่า .. แทน: p= 0.042

ภาพหน้าจอจาก thesaurus.com พจนานุกรมศัพท์อื่นของฉันแย่มาก แย่มาก และแย่มากเช่นกัน

ตรงกันข้ามกับความเชื่อที่นิยมคำว่า “อย่างมีนัยสำคัญทางสถิติ” ไม่ได้หมายความว่าบางสิ่งบางอย่าง สำคัญ, สำคัญยิ่ง,หรือ น่าเชื่อ ไปยังสถานที่. ถ้าคุณคิดว่าเราใช้คำว่า สำคัญ ในลักษณะที่จะทำให้พจนานุกรมของคุณภาคภูมิใจ คุณกำลังตกเป็นเหยื่อของมืออันชาญฉลาด อย่าปล่อยให้กวีโกหกคุณ

“คุณไม่ควรปล่อยให้กวีโกหกคุณ” — บียอร์ก

สำหรับผู้ที่ต้องการเก็บความได้เปรียบเอาไว้ ทางสถิติ สำคัญที่สุด นี่คือทั้งหมดที่คุณต้องรู้เกี่ยวกับคำนี้ อย่างมีนัยสำคัญทางสถิติ:

  • ไม่ได้หมายความว่ามีเรื่องสำคัญเกิดขึ้น
  • ไม่ได้หมายความว่าผลลัพธ์จะ “ใหญ่” หรือน่าจดจำ
  • ไม่ได้หมายความว่าคุณจะพบกับ ข้อมูล น่าสนใจ
  • หมายความว่ามีคนอ้างว่ารู้สึกประหลาดใจกับบางสิ่งบางอย่าง
  • มันไม่ได้บอกอะไรที่เป็นประโยชน์แก่คุณหากคุณไม่มีความรู้มากนักเกี่ยวกับมัน บางคน และ บางสิ่งบางอย่าง ในคำถาม.

สำหรับคนอื่นๆ ที่ไม่ใช่ผู้มีอำนาจตัดสินใจนั้น ผลลัพธ์ที่มีนัยสำคัญทางสถิติแทบจะไม่เกิดขึ้นเลย สำคัญ ในความหมายของ “สำคัญ” — เป็นบางครั้งบางคราว เหมาะสำหรับการตั้งคำถามที่น่าสนใจแต่บ่อยครั้งที่พวกเขาไม่เกี่ยวข้อง

ภาพถ่ายโดย แอนดรูว์ จอร์จ on Unsplash

ควรระมัดระวังเป็นพิเศษเมื่อผู้ที่ไม่ใช่ผู้เชี่ยวชาญใช้คำนี้ โดยเฉพาะอย่างยิ่งเมื่อมาพร้อมกับความเบิกบานใจที่หายใจไม่ออก บางครั้งก็หน้าด้านเป็นพิเศษ กระจอกงอกง่อย ก้าวไปอีกขั้นหนึ่งแล้วทิ้งบิต "ทางสถิติ" เข้าไป เข้าถึงพลังเต็มรูปแบบของบทกวี “เฮ้ ดูสิ” พวกเขาบอกคุณว่า “สิ่งที่เรากำลังพูดถึงนั้นมีความสำคัญในสายตาของจักรวาล”

ไม่มันไม่ใช่

ผู้กระทำความผิดที่เลวร้ายที่สุดที่เป็นไปได้คือผู้ที่ออกเสียงว่า "มีนัยสำคัญทางสถิติ" เหมือนเป็นคำพ้องความหมายสำหรับ "ชัดเจน" หรือ "บาง" หรือ "ความรู้ที่ไร้ที่ติ” — มีเรื่องน่าขันเกิดขึ้นที่นี่ คำนี้มาจากสาขาที่เกี่ยวข้องกับ ความไม่แน่นอน และด้วยเหตุนี้ (ตามคำจำกัดความ!) จึงเป็นเพียงการตั้งค่าที่ความรู้ของเราเท่านั้น ไม่ ไร้ที่ติ

สำหรับผู้ที่ชอบต่อสู้กับศัพท์เฉพาะ ฉันจะช่วยตัวเองเป็นภาษาที่เป็นทางการมากขึ้นในหัวข้อถัดไป อย่าลังเลที่จะมองข้ามสิ่งนั้นไป แต่ถ้าคุณอยากรู้ไปพร้อมๆ กัน และ ใหม่แถวนี้ เอา ทางอ้อมเล็กน้อย เพื่อขยายแนวคิดที่ยิ่งใหญ่ที่สุดทั้งหมดในสถิติในเวลาเพียง 8 นาที:

ลิงก์ส่วนใหญ่ในบทความของฉันจะนำคุณไปยังโพสต์ในบล็อก ซึ่งฉันได้ให้ภาพรวมเชิงลึกของหัวข้อที่ไฮไลต์ ดังนั้นคุณจึงสามารถใช้บทความนี้เป็น Launchpad สำหรับการเลือกการผจญภัยของคุณเอง หลักสูตรสั้นๆ on วิทยาศาสตร์ข้อมูล.

“นัยสำคัญทางสถิติ” เพียงหมายความว่า ก p-value* ต่ำพอที่จะเปลี่ยนความคิดของผู้มีอำนาจตัดสินใจ กล่าวอีกนัยหนึ่ง มันเป็นคำที่เราใช้เพื่อระบุว่าก สมมติฐานว่าง คือ ปฏิเสธ.** อะไร คือ สมมุติฐานว่างล่ะ? และการทดสอบนั้นเข้มงวดแค่ไหน? ลาก_(ツ)_/¯

ยินดีต้อนรับสู่สถิติ โดยที่คำตอบคือ p = 0.042 แต่คุณไม่รู้ว่าคำถามคืออะไร

ในทางเทคนิค ผู้มีอำนาจตัดสินใจ ผู้กำหนดเงื่อนไขการทดสอบสมมุติฐานคือ เพียง บุคคลที่ผลการทดสอบนั้นมีนัยสำคัญทางสถิติ

สถิติให้ชุดเครื่องมือสำหรับการตัดสินใจแก่คุณ แต่วิธีใช้งานนั้นขึ้นอยู่กับคุณ มันจะเป็นการตัดสินใจส่วนบุคคลเช่นเดียวกับการตัดสินใจอื่นๆ

ภาพถ่ายโดย ทอฟฟิกุ บาร์บุยยา on Unsplash

กระบวนการนี้เกี่ยวข้องกับการใช้ถ้อยคำคำถามเพื่อการตัดสินใจของคุณอย่างระมัดระวัง โดยเลือก สมมติฐาน คุณยินดีที่จะใช้ชีวิตอยู่โดยแลกความเสี่ยงกับวิธีต่างๆ ที่คำตอบของคุณอาจผิด*** (เพราะการสุ่มเป็นสิ่งที่งี่เง่า) จากนั้นใช้คณิตศาสตร์เพื่อหาคำตอบแบบควบคุมความเสี่ยงสำหรับคำถามเฉพาะของคุณ

มีบางสิ่งที่แปลกประหลาดและตลกขบขันในความนิยมนี้เพื่อใช้เป็นข้ออ้างในการกลั่นแกล้งทางวาทศิลป์

นั่นเป็นสาเหตุที่ผู้เชี่ยวชาญที่แท้จริงไม่เคยใช้สถิติเหมือนค้อนทุบความจริงให้กลายเป็นศัตรู ผู้มีอำนาจตัดสินใจสองคนสามารถใช้เครื่องมือเดียวกันบนข้อมูลเดียวกันและ มาถึงข้อสรุปที่แตกต่างกันสองประการและถูกต้องสมบูรณ์... ซึ่งหมายความว่า มีบางสิ่งที่ทั้งแปลกประหลาดและตลกขบขันในความนิยมในฐานะที่เป็นปัจจัยสนับสนุนการกลั่นแกล้งทางวาทศิลป์

นัยสำคัญทางสถิติเป็นเรื่องส่วนบุคคล เพียงเพราะว่า I ฉันประหลาดใจมากพอกับข้อมูลที่เปลี่ยนใจไม่ได้หมายความว่าคุณควรจะเป็น

ทันทีที่เข้าใจ สถิติทำงานอย่างไรอดไม่ได้ที่จะประหลาดใจกับความหยิ่งทะนงอย่างน่าทึ่ง - เกือบจะหยาบคาย - คือการประกาศว่าบางสิ่งมีนัยสำคัญทางสถิติต่อหน้าผู้คนที่ไม่คล่องในข้อจำกัดของการตัดสินใจทางสถิติ คำนี้ฟังดูเป็นสากลเกินไปสำหรับความดีของใครๆ มันเล่นเหมือนก “หุบปากแล้วเชื่อฉันเถอะ เพราะวิธีการของฉันมันเลิศ” อุปกรณ์วาทศิลป์ ฉันหวังว่าคุณจะร่วมกับฉันในการให้วาทศิลป์แบรนด์นั้น “Pffft“มันสมควรแล้ว

เดี๋ยวก่อน ไม่มีอะไรเลยที่เราสามารถเรียนรู้จากผลลัพธ์ที่มีนัยสำคัญทางสถิติของผู้อื่นได้เลยหรือ

ประเด็นนี้ค่อนข้างเป็นปรัชญา ดังนั้นฉันต้องมีบทความแยกต่างหาก ฉันตอบคำถามนั้น:

โดยสรุป คำแนะนำของฉันคือเป็นการดีที่จะมอบหมายการตัดสินใจบางส่วนของคุณให้กับผู้อื่น ตราบใดที่คุณไว้วางใจให้พวกเขามีความสามารถและคำนึงถึงผลประโยชน์สูงสุดของคุณเป็นหลัก เมื่อพวกเขามั่นใจแล้ว คุณจะยืมความคิดเห็นของพวกเขาเพื่อที่คุณจะได้ไม่ต้องทำงานทั้งหมดใหม่ด้วยตัวเอง

การใช้ข้อสรุปทางสถิติของผู้อื่น คุณไม่ได้ตัดสินใจจากข้อมูล แต่ขึ้นอยู่กับความไว้วางใจที่คุณมีต่อมนุษย์แต่ละคน

โปรดทราบว่าการใช้ผลลัพธ์ของผู้อื่นไม่ได้ขึ้นอยู่กับการตัดสินใจของคุณบนข้อมูล แต่ขึ้นอยู่กับความไว้วางใจที่คุณมีต่อมนุษย์แต่ละคน ไม่มีปัญหาในการเลือกที่จะเชื่อใจผู้อื่น ดังนั้นคุณไม่จำเป็นต้องสร้างโลกทัศน์ทั้งโลกโดยอาศัยประสบการณ์ตั้งแต่เริ่มต้น การแบ่งปันความรู้เป็นส่วนหนึ่งของสิ่งที่ทำให้เผ่าพันธุ์มนุษย์ประสบความสำเร็จ แต่ก็คุ้มค่าที่จะตระหนักว่าคุณอาจแตกสลายไปสองสามรอบแล้ว โทรหา "ความรู้" ใดๆ ก็ตามที่คุณคิดว่าคุณกำลังสนใจ

หากคุณปล่อยให้ใครสักคนก้าวเข้ามาตัดสินใจแทนคุณ การบริโภคของผู้อื่นก็หมายความว่า p-value และข้อสรุปสำหรับการตัดสินใจ — จากนั้นต้องแน่ใจว่าเป็นคนที่คุณพิจารณาว่ามีความสามารถและเชื่อถือได้เพียงพอ

จะเป็นอย่างไรถ้าคนที่กำลังศัพท์แสงทางสถิติใส่คุณคือคนที่คุณคิด ทำไม่ได้ เชื่อมั่น? วิ่งเพื่อเนินเขา!

เมื่อใดก็ตามที่มีแรงโน้มน้าวใจติดอยู่กับการประกาศที่มีนัยสำคัญทางสถิติ ให้ระมัดระวังเป็นพิเศษกับสินค้าใดก็ตามที่ ผู้พูด กำลังเร่ขาย หากคุณเชื่อใจคนที่คุณกำลังคุยด้วย คุณไม่จำเป็นต้องดึงดูดใจพวกเขาให้มีนัยสำคัญทางสถิติ สิ่งที่คุณต้องรู้ก็คือพวกเขามั่นใจแล้ว ถ้าคุณไม่ไว้ใจพวกเขาคุณก็ ไม่สามารถไว้วางใจได้ ศัพท์เฉพาะทางสถิติของพวกเขามากกว่าที่คุณเชื่อถือมือดนตรีแจ๊สของพวกเขา

คำตอบจะมีประโยชน์อะไรหากคุณไม่ใส่ใจที่จะเข้าใจว่าคำถามคืออะไร

หากมีสิ่งหนึ่งที่ฉันต้องการให้คุณยกเลิกจากโพสต์ในบล็อกนี้ ก็คือ: หากคุณไม่ค่อยมีความรู้เกี่ยวกับผู้มีอำนาจตัดสินใจมากนัก และพวกเขาตัดสินใจอย่างไรในการพิจารณาว่าควรทำอย่างไร เปลี่ยนความคิดของพวกเขา (และแน่นอนว่าเกี่ยวกับอะไร) แล้วข้อกล่าวอ้างของพวกเขาที่เกี่ยวข้องกับนัยสำคัญทางสถิติก็คือ ไร้ความหมายสำหรับคุณโดยสิ้นเชิง. คำตอบจะมีประโยชน์อะไรหากคุณไม่ใส่ใจที่จะเข้าใจว่าคำถามคืออะไร

หากคุณสนุกที่นี่และกำลังมองหาหลักสูตร AI ประยุกต์ที่ออกแบบมาเพื่อความสนุกสนานสำหรับผู้เริ่มต้นและผู้เชี่ยวชาญ นี่คือหลักสูตรที่ฉันสร้างขึ้นเพื่อความบันเทิงของคุณ:

เพลิดเพลินกับเพลย์ลิสต์ของหลักสูตรที่แบ่งออกเป็นวิดีโอบทเรียนขนาดสั้น 120 วิดีโอแยกกันที่นี่: bit.ly/machinefriend

มาเป็นเพื่อนกัน! คุณสามารถหาฉันได้ที่ Twitter, YouTube, กองย่อยและ LinkedIn. สนใจให้ฉันพูดในงานของคุณไหม? ใช้ แบบฟอร์มนี้ เพื่อติดต่อ

ต่อไปนี้คือคำแนะนำแบบทีละขั้นตอน 10 นาทีที่ฉันชื่นชอบ:

*หากคุณสนใจที่จะเรียนรู้ว่า p-value คืออะไร นี่คือวิดีโอที่ฉันจัดทำขึ้นเพื่อช่วยเหลือคุณ:

นี่เป็นวิดีโอแรกในเพลย์ลิสต์ YouTube ของฉัน ซึ่งคุณสามารถพบได้ที่ http://bit.ly/quaesita_p1

**สำหรับคำอธิบายการทดสอบสมมติฐาน โปรดไปที่ของฉัน โพสต์บล็อก ในหัวข้อหรือดูวิดีโอคู่นี้:

หลงกลด้วยนัยสำคัญทางสถิติ เผยแพร่ซ้ำจากแหล่งที่มา https://towardsdatascience.com/fooled-by-statistical-significance-7fed1bc2caf9?source=rss—-7f60cf5620c9—4 ผ่าน https://towardsdatascience.com/feed

<!–

->

ประทับเวลา:

เพิ่มเติมจาก ที่ปรึกษาบล็อคเชน