Tilastollisen merkitsevyyden huijaama

Älä anna runoilijoiden valehdella sinulle

Katso maailman lyhin luento aiheesta #tilastot ja kaikki mikä on vialla ihmisten suhtautumisessa siihen:

42.

Tai pikemminkin: p= 0.042

Kuvakaappaus osoitteesta thesaurus.com. Toinen asiasanastoni on kauhea, kauhea ja myös kauhea.

Vastoin yleistä käsitystä, termi "tilastollisesti merkittävä”ei tarkoita sitä tärkeä, tärkeätai vakuuttava tapahtui. Jos luulet, että käytämme sanaa merkittävä Tässä tavalla, joka tekisi tesaurustasi ylpeäksi, joudut ovelan tempun uhriksi. Älä anna runoilijoiden valehdella sinulle.

"Et saa antaa runoilijoiden valehdella sinulle." — Björk

Niille, jotka haluavat säilyttää altistumisensa tilastollinen nitty gritty minimiin, tässä on kaikki mitä sinun tulee tietää termistä tilastollisesti merkittävä:

  • Se ei tarkoita, että mitään merkittävää olisi tapahtunut.
  • Se ei tarkoita, että tulokset olisivat "suuria" tai huomionarvoisia.
  • Se ei tarkoita, että löydät tiedot mielenkiintoista.
  • Se tarkoittaa, että joku väittää olevansa yllättynyt jostakin.
  • Se ei kerro sinulle mitään hyödyllistä, jos et tiedä siitä paljon joku ja jotain kysymyksessä.

Kaikille muille kuin kyseessä olevalle päätöksentekijälle tilastollisesti merkitsevät tulokset ovat harvoin merkittävä siinä mielessä "tärkeä”- he ovat silloin tällöin loistava mielenkiintoisten kysymysten esittämiseen, mutta usein niillä ei ole merkitystä.

Kuva Andrew George on Unsplash

Ole erityisen valppaana, kun ei-asiantuntijat käyttävät tätä termiä, varsinkin kun siihen liittyy hengenahdistusta. Joskus erityisen röyhkeästi huijareita mene askeleen pidemmälle ja pudota "tilastollinen" pala hyödyntäen runouden täyttä voimaa. "Hei katso," he kertovat sinulle, "Se, mistä puhumme, on MERKITTÄVÄÄ universumin silmissä."

Ei, se ei ole.

Pahimpia mahdollisia rikkojia ovat ne, jotka lausuvat sanan "tilastollisesti merkittävä", kuten se on synonyymi sanalle "selvä"Tai"tietty"Tai"virheetön tieto” — tässä on vähän ironiaa hukassa. Termi tulee alalta, joka käsittelee epävarmuus ja siten (määritelmän mukaan!) kuuluu vain ympäristöihin, joissa tietomme on emme virheetön.

Niille, jotka haluavat taistella ammattislangia vastaan ​​jargonin kanssa, autan itseäni virallisempaan kielenkäyttöön seuraavassa osiossa. Voit vapaasti olla pois tuosta, mutta jos olet samalla utelias ja uutta täällä, ota a pieni kiertotie zoomata tilastojen suurimmat ideat läpi vain 8 minuutissa:

Suurin osa artikkeleissani olevista linkeistä vie sinut blogikirjoituksiin, joissa olen antanut sinulle syvemmän yleiskatsauksen korostetuista aiheista, joten voit käyttää tätä artikkelia myös aloituslevynä Valitse oma seikkailulle. minikurssi on tietojenkäsittely.

"Tilastollinen merkitys" tarkoittaa vain sitä, että a p-arvo* oli tarpeeksi alhainen muuttaakseen päätöksentekijän mielen. Toisin sanoen, se on termi, jota käytämme osoittamaan, että a nolla hypoteesi oli hylätty.** Mitä oli nollahypoteesi kuitenkin? Ja kuinka tiukka testi oli? ¯_(ツ)_/¯

Tervetuloa tilastoihin, missä on vastaus p = 0.042, mutta et tiedä mikä kysymys oli.

Teknisesti päätöksentekijä joka asetti hypoteesitestin ehdot, on vain henkilö, jolle kyseisen testin tulokset voivat olla tilastollisesti merkittäviä.

Tilastot tarjoavat sinulle joukon työkaluja päätöksentekoon, mutta se, miten käytät niitä, on sinun päätettävissäsi – se on yhtä yksilöllinen kuin mikä tahansa muu päätös.

Kuva Towfiqu barbhuiya on Unsplash

Prosessi sisältää päätöskysymyksen muotoilun erittäin huolellisesti ja sen valitsemisen oletukset olet valmis elämään, tekemällä riskeistä kompromisseja eri tavoista, joilla vastauksesi saattaa olla väärä*** (koska satunnaisuus on ääliö), ja sitten käyttää matematiikkaa saadaksesi riskikontrolloidun vastauksen tiettyyn kysymykseesi.

Sen suosiossa retorisen kiusaamisen välineenä on jotain perverssiä ja koomisia.

Siksi todelliset asiantuntijat eivät koskaan käyttäisi tilastoja vasaran lailla lyödäkseen Totuutta vihollisiksi. Kaksi päättäjää voivat käyttää samoja työkaluja samoihin tietoihin ja tehdä kaksi erilaista - ja täysin pätevää - johtopäätöstä… mikä tarkoittaa, että sen suosiossa retorisen kiusaamisen välineenä on jotain sekä perverssiä että koomisia.

Tilastollinen merkitys on henkilökohtainen. Vain koska I Olen niin yllättynyt tiedoista, että muutan mieleni, ei tarkoita, että sinun pitäisi olla.

Heti kun ymmärsin miten tilastot toimivat, En voinut olla ihmettelemättä, kuinka huomattavan ylimielistä - melkein töykeää - on julistaa jotain tilastollisesti merkitseväksi sellaisten ihmisten läsnäollessa, jotka eivät ymmärrä tilastollisen päätöksenteon rajoituksia. Termi kuulostaa aivan liian yleismaailmalliselta kenenkään hyväksi; se pelaa kuin a "Ole hiljaa ja luota minuun, koska menetelmäni ovat hienoja" retorinen laite. Toivon, että liityt kanssani antamaan tälle retoriikkaalle "pffft"se ansaitsee.

Odota hetki, eikö meillä ole mitään opittavaa jonkun muun tilastollisesti merkitsevästä tuloksesta?

Tässä se tulee hieman filosofiseksi, joten tarvitsen erillisen artikkelin minun kantani tuohon kysymykseen:

Lyhyesti sanottuna neuvoni on, että on hienoa delegoida osa päätöksenteosta muille ihmisille, kunhan luotat heidän pätevyyteen ja etusi pohtimaan. Kun he ovat vakuuttuneita, lainaat heidän mielipiteensä, jotta sinun ei tarvitse tehdä kaikkea heidän työtään itse.

Käyttämällä jonkun muun tilastollisia johtopäätöksiä et perusta päätöstäsi tietoihin vaan pikemminkin luottamukseesi yksittäiseen ihmiseen.

Muista vain, että käyttämällä jonkun muun tuloksia et perusta päätöstäsi tietoihin vaan pikemminkin luottamukseesi yksittäiseen ihmiseen. Ei ole ongelmaa valita luottaa muihin, joten sinun ei tarvitse rakentaa koko maailmankuvaasi empiirisesti tyhjästä – tiedon jakaminen on osa sitä, mikä tekee ihmislajista niin menestyvän – mutta on syytä olla tietoinen siitä, että saatat olla muutaman kierroksen rikki. puhelimitse sen "tiedon" jälkeen, jota luulet virittäväsi.

Jos annat jonkun tehdä päätöksiä puolestasi – sitä tarkoittaa kuluttaa jonkun muun p-arvo ja johtopäätökset päätöksentekoa varten – varmista sitten, että kyseessä on joku, jota pidät riittävän pätevänä ja luotettavana.

Entä jos henkilö, joka lapioi sinulle tilastojargonia, on joku sinä älä luottamus? Juokse kukkuloille!

Aina kun tilastollisen merkityksen julistuksiin takertuu taivuttelun tuulahdus, ole erityisen varovainen kaikenlaisten tavaroiden suhteen. ehdoton kaupitelee. Jos luotat henkilöön, jonka kanssa puhut, et tarvitse hänen vetoomuksiaan tilastolliseen merkitykseen. Sinun tarvitsee vain tietää, että he ovat vakuuttuneita. Jos et luota heihin, sinä ei voi luottaa heidän tilastojargoniaan enemmän kuin luottaisit heidän jazzkäsiinsä.

Mitä hyötyä on vastauksesta, jos et ole vaivautunut ymmärtämään, mistä kysymys oli?

Jos haluaisin sinun ottavan pois tästä blogikirjoituksesta yhden asian, se on tämä: Jos et tiedä paljoakaan päätöksentekijästä ja siitä, kuinka he ryhtyvät miettimään, pitäisikö heidän tehdä muuttaa heidän mieltään (ja tarkalleen mistä), niin heidän tilastolliseen merkitsevyyteen liittyvät väitteensä ovat täysin merkityksetön sinulle. Mitä hyötyä on vastauksesta, jos et ole vaivautunut ymmärtämään, mistä kysymys oli?

Jos sinulla oli hauskaa täällä ja etsit soveltavaa tekoälykurssia, joka on suunniteltu hauskaksi aloittelijoille ja asiantuntijoille, tässä on yksi, jonka tein huviksesi:

Nauti kurssin soittolistasta, joka on jaettu 120 erilliseen pieneen oppituntivideoon täällä: bit.ly/koneystävä

Ollaan ystäviä! Löydät minut osoitteesta Twitter, YouTube, alaryhmäja LinkedIn. Kiinnostaako minun puhua tapahtumassasi? Käyttää tämä lomake saada yhteyttä.

Tässä on joitain suosikkini 10 minuutin esittelyistä:

*Jos haluat tietää, mikä p-arvo on, tässä on video, jonka tein auttamaan sinua:

Tämä on ensimmäinen video YouTube-soittolistallani, jonka löydät osoitteesta http://bit.ly/quaesita_p1

**Jos haluat selityksen hypoteesien testaamisesta, siirry sivulleni blogi aiheesta tai katso tämä pari videota:

Tilastollisen merkitsevyyden huijaama Julkaistu uudelleen lähteestä https://towardsdatascience.com/fooled-by-statistic-significance-7fed1bc2caf9?source=rss—-7f60cf5620c9—4 https://towardsdatascience.com/feed

<!-

->

Aikaleima:

Lisää aiheesta Blockchain-konsultit