Pettis statistilise olulisuse tõttu

Ärge laske luuletajatel teile valetada

Vaadake maailma lühimat loengut #statistika ja kõik, mis on valesti sellega, kuidas inimesed sellele lähenevad:

42.

Või õigemini: p= 0.042

Ekraanipilt saidilt thesaurus.com. Minu teine ​​tesaurus on kohutav, kohutav ja ka kohutav.

Vastupidiselt levinud arvamusele on termin "statistiliselt oluline” ei tähenda seda midagi oluline, olulinevõi veenev võttis aset. Kui arvate, et me kasutame seda sõna märkimisväärne siin viisil, mis teeks teie tesauruse uhkeks, langete kavala näpunäidete ohvriks. Ärge laske luuletajatel teile valetada.

"Te ei tohiks lasta luuletajatel endale valetada." — Björk

Neile, kes eelistavad säilitada oma kokkupuudet statistiline minimaalne, siin on kõik, mida pead selle termini kohta teadma statistiliselt oluline:

  • See ei tähenda, et midagi märkimisväärset oleks juhtunud.
  • See ei tähenda, et tulemused oleksid "suured" või tähelepanuväärsed.
  • See ei tähenda, et leiate andmed huvitav.
  • See tähendab, et keegi väidab end olevat millegi üle üllatunud.
  • See ei ütle teile midagi kasulikku, kui te sellest palju ei tea keegi ja midagi kõnealune.

Kõigile, välja arvatud kõnealune otsustaja, on statistiliselt olulised tulemused harva märkimisväärne mõttes "oluline” — nad on aeg-ajalt suurepärane huvitavate küsimuste esitamiseks, kuid sageli on need ebaolulised.

Foto: Andrew George on Unsplash

Olge eriti valvel, kui mitteeksperdid seda terminit kasutavad, eriti kui sellega kaasneb hingeldav ülevool. Vahel eriti jultunud šarlatanid astuge üks samm edasi ja loobuge "statistilisest" osast, kasutades kogu luule võimsust. "Hei vaata," nad ütlevad sulle, "See, millest me räägime, on universumi silmis TÄHTIS."

Ei, ei ole.

Kõige hullemad võimalikud kurjategijad on need, kes hääldavad "statistiliselt oluline", nagu see on sünonüüm sõnale "kindel"Või"kindel"Või"veatu teadmine” — siin on mingi iroonia kaduma läinud. Mõiste pärineb valdkonnast, mis tegeleb ebakindlus ja seega (definitsiooni järgi!) kuulub ainult seadetesse, kus on meie teadmised mitte veatu.

Neile, kes eelistavad žargooni vastu žargooniga võidelda, aitan end järgmises osas ametlikuma keelekasutusse. Võite sellest osast loobuda, kuid kui olete samal ajal uudishimulik ja uus siinkandis, võta a väike ümbersõit statistika kõige suuremate ideede suumimiseks vaid 8 minutiga:

Enamik minu artiklite linke viivad teid ajaveebipostituste juurde, kus olen andnud teile esiletõstetud teemadest sügavama ülevaate, nii et saate seda artiklit kasutada ka valiku "Valige oma seiklus" käivitusplaadina. minikursus on andmeteadus.

"Statistiline olulisus" tähendab lihtsalt seda, et a p-väärtus* oli piisavalt madal, et muuta otsustaja meelt. Teisisõnu, see on termin, mida kasutame näitamaks, et a nullhüpotees oli tagasi.** Mida oli aga nullhüpotees? Ja kui range test oli? ¯_(ツ)_/¯

Tere tulemast statistikasse, kus on vastus p = 0.042, kuid te ei tea, mis küsimus oli.

Tehniliselt on otsustaja kes püstitas hüpoteesi testimise tingimused on ainult isik, kelle jaoks selle testi tulemused võivad olla statistiliselt olulised.

Statistika annab teile otsuste tegemiseks tööriistu, kuid see, kuidas te neid kasutate, on teie otsustada – see on sama individuaalne kui mis tahes muu otsus.

Foto: Towfiqu barbhuiya on Unsplash

Protsess hõlmab oma otsustusküsimuse väga hoolikalt sõnastamist ja selle valimist eeldused olete nõus koos elama, tehes mõningaid riskikompromissioone selle kohta, kuidas teie vastus võib olla vale*** (sest juhuslikkus on jama) ja seejärel kasutades matemaatikat, et saada oma konkreetsele küsimusele riskikontrollitud vastus.

Selle populaarsuses retoorilise kiusamise rekvisiidina on midagi perversset ja koomilist.

Sellepärast ei kasutaks tõelised eksperdid kunagi statistikat nagu haamrit Tõe vaenlasteks löömiseks. Kaks otsustajat saavad kasutada samu tööriistu samadel andmetel ja jõuda kahe erineva – ja täiesti kehtiva – järelduseni… mis tähendab, et selle populaarsuses retoorilise kiusamise rekvisiidina on midagi nii perversset kui ka koomilist.

Statistiline olulisus on isiklik. Lihtsalt sellepärast I Olen andmete üle piisavalt üllatunud, et meelt muuta, ei tähenda see, et peaksite seda tegema.

Niipea kui ma aru sain kuidas statistika töötab, Ma ei suutnud ära imestada, kui tähelepanuväärselt edev – peaaegu ebaviisakas – on kuulutada midagi statistiliselt oluliseks inimeste juuresolekul, kes ei valda ladusalt statistiliste otsuste tegemise piiranguid. See mõiste kõlab kellegi heaks liiga universaalselt; see mängib nagu a "Ole vait ja usalda mind, sest mu meetodid on väljamõeldud" retooriline seade. Loodan, et ühinete minuga, andes sellele retoorikale "pfft"see väärib.

Oota, kas kellegi teise statistiliselt olulisest tulemusest pole üldse midagi õppida?

Siin muutub see mõnevõrra filosoofiliseks, nii et mul on selle jaoks vaja eraldi artiklit minu seisukoht selle küsimuse kohta:

Lühidalt öeldes on minu nõuanne, et on hea delegeerida osa oma otsustusprotsessist teistele inimestele, kui usaldate, et nad on pädevad ja teie parimad huvid. Kui nad on veendunud, laenate nende arvamust, et te ei peaks kogu nende tööd ise uuesti tegema.

Kasutades kellegi teise statistilisi järeldusi, ei tugine te oma otsuses andmetele, vaid pigem oma usaldusele konkreetse inimese vastu.

Pidage meeles, et kellegi teise tulemusi kasutades ei põhine te oma otsuses andmetel, vaid pigem oma usaldusel konkreetse inimese vastu. Pole probleemi, kui otsustate teisi usaldada, nii et te ei pea kogu oma maailmapilti empiiriliselt nullist üles ehitama – teadmiste jagamine on osa sellest, mis teeb inimliigi nii edukaks –, kuid tasub olla teadlik, et võite olla mõne ringi katki. telefoni teel mis tahes "teadmistest", mida arvate end häälestamas.

Kui lasete kellelgi enda nimel otsuseid langetada, tähendab see kellegi teise omade tarbimist p-väärtus ja järeldused otsuste tegemiseks – siis veenduge, et see on keegi, keda peate piisavalt pädevaks ja usaldusväärseks.

Mis siis, kui statistilise žargooni vastu kühveldab keegi teie ei usaldada? Jookse mäkke!

Iga kord, kui statistilise tähtsuse deklaratsioonide külge on klammerdumas veenmise hõng, olge kõigi asjade suhtes eriti ettevaatlik. lausuma kaupleb. Kui usaldate inimest, kellega räägite, ei vaja te tema statistilist olulisust. Kõik, mida pead teadma, on see, et nad on veendunud. Kui te neid ei usalda, siis teie ei saa usaldada nende statistikažargon enam kui nende džässikäsi usaldada.

Mis kasu on vastusest, kui te pole vaevunud aru saama, milles küsimus seisnes?

Kui ma tahaksin, et te sellest blogipostitusest ühe asja ära võtaksite, siis see on järgmine: kui te ei tea otsustajast palju ja kuidas nad otsustavad, kas nad peaksid seda tegema. meelt muutma (ja täpselt mille kohta), siis on nende statistilise olulisusega seotud väited sinu jaoks täiesti mõttetu. Mis kasu on vastusest, kui te pole vaevunud aru saama, milles küsimus seisnes?

Kui teil oli siin lõbus ja otsite rakenduslikku AI kursust, mis oleks lõbus nii algajatele kui ka asjatundjatele, siis siin on üks, mille tegin teie meelelahutuseks:

Nautige kursuse esitusloendit, mis on jagatud 120 erinevaks väikeseks tunnivideoks siin: bit.ly/masinasõber

Hakkame sõpradeks! Mind leiate aadressilt puperdama, Youtube, Alamühikja LinkedIn. Kas olete huvitatud, et ma teie üritusel räägiksin? Kasutage Selle vormi kontakti saamiseks.

Siin on mõned minu lemmikud 10-minutilised läbikäigud:

*Kui soovite teada saada, mis on p-väärtus, siis siin on video, mille tegin teile abiks:

See on esimene video minu YouTube'i esitusloendis, mille leiate aadressilt http://bit.ly/quaesita_p1

** Hüpoteesi testimise selgituse saamiseks minge minu lehele blogi postitus teemal või vaadake seda paari videot:

Statistilise olulisuse pettus Avaldatud uuesti allikast https://towardsdatascience.com/fooled-by-statistic-significance-7fed1bc2caf9?source=rss—-7f60cf5620c9—4 https://towardsdatascience.com/feed kaudu

<!–

->

Ajatempel:

Veel alates Blockchaini konsultandid