Vakiopoikkeama vs standardivirhe: mikä ero on?

Kaksoset eri universumeista

Kuva Martin sanchez on Unsplash

Standardipoikkeama ja standardivirhe ovat kaksi tilastollista käsitettä, jotka usein aiheuttavat sekaannusta. Onko niillä samat tulkinnat vai onko niiden tarkoitus edustaa jotain täysin erilaista? Keskustelemme lisää tässä viestissä.

Mikä on keskihajonta (SD)?

- standardipoikkeama mittaa vaihtelevuus (alias, levitä) datapisteiden ympärillä tarkoittaa tietyssä tietojoukossa. Toisin sanoen se kertoo meille keskimäärin, kuinka kaukana kukin datapiste on poissa keskiarvosta.

Väestön keskihajonta

Todellisessa maailmassa olemme kiinnostuneita arvioimaan tietyn ominaisuuden a väestö. Standardipoikkeama on an esimerkki näistä ominaisuuksista.

Kun olet KAIKKI tietopisteet populaatiosta, voit laskea TOSI perusjoukon keskihajonnan arvo seuraavan kaavan avulla.

Kuva tekijältä

Esimerkki keskihajonnasta

Usein kaikkien tietopisteiden kerääminen väestöstä on vaikeaa ajan, taloudellisten tai teknisten rajoitusten vuoksi. Esimerkiksi, jos haluamme laskea TOSI Los Angelesin kotitalouksien tulojen keskihajonnalla, meidän pitäisi saada tuloja kaikista Los Angelesin kotitalouksista, mikä on lähes mahdotonta tehdä.

Sen sijaan voimme kerätä populaatiosta satunnaisia ​​näytteitä ja tehdä johtopäätöksiä populaation keskihajonnasta käyttämällä Esimerkki keskihajonnasta. Näytteen keskihajonnan kaava on

Kuva tekijältä

Miksi käyttää N-1:tä näytteen keskihajontaan?

Huomaat, että käytämme otoksen keskihajonnan otoksen keskiarvoa (x̄) perusjoukon keskiarvon (μ) sijaan, koska emme tiedä mitään perusjoukon keskiarvosta. x̄ on kohtuullinen arvio μ:lle.

Siksi mikä tahansa arvo X näytetietojoukossa olisi lähempänä x̄ kuin μ. Otoksen keskihajonnan osoittajasta tulisi keinotekoisesti pienempi kuin sen oletetaan olevan. Tämän seurauksena otoksen keskihajonnan määrä olisi aliarvioida.

Tämän korjaamiseksi puolueellisuus käyttäisimme näytteen keskihajonnan "N-1" "N":n sijaan (aka, Besselin korjaus) näytteen keskihajonnan osalta.

N-1:n käyttäminen tekisi otoksen keskihajonnasta suuremman kuin muutoin käyttämällä N:tä. Siksi meillä on vähemmän puolueellinen arvio populaation keskihajonnasta, mikä antaa meille konservatiivisen vaihteluarvion.

Mikä on standardivirhe (SE)?

Ennen kuin käsittelemme vakiovirhettä, tutustutaan ensin käsitteisiin Näytteen jakelu ja Näytteen jakelu.

Näytteen jakelu vs näytteenjakelu

- näytteiden jakelu on yksinkertaisesti tiedon jakelu näytteestä, joka on otettu satunnaisesti populaatiosta.

Kysymme esimerkiksi 100 satunnaiselta ihmiseltä Los Angelesissa heidän tulonsa. Esimerkkijakauma kuvaa TODELLINEN tulonjako näissä 100 ihmisessä.

Mutta mikä on otantajakauma?

- näytteen jakaminen on otantatilaston jakautuminen (esim. otoskeskiarvo, otosvarianssi, otoksen keskihajonna ja otososuus) useista samasta populaatiosta otetuista näytteistä (ts. toistuva näytteenotto).

Kysymme esimerkiksi 100 satunnaiselta ihmiseltä Los Angelesissa heidän tulonsa. Laske sitten keskitulot. Toistamme tämän 1000 kertaa, sitten meillä on 1000 erilaista keskituloa. Näiden 1000 keskitulon jakautumista kutsutaan otantajakaumaksi.

Näin ollen, näytteiden jakelu on jakelu näytetiedot vaikka näytteen jakaminen on jakelu näytetilasto.

Konsepti on standardivirhe on relevantti otosjakauman, EI näytejakauman kannalta.

- Standardivirhe on mittari, joka kuvaa tilaston vaihtelevuus vuonna näytteiden jakelu.

Miten standardivirhe (SE) tulkitaan?

Vakiovirhe mittaa kuinka pitkälle otostilastot (esim. otoksen keskiarvo) on todennäköisesti peräisin todellinen väestötilasto (esim. väestön keskiarvo).

Miksi tarvitsemme standardivirheen (SE)?

Yleensä saatat haluta rakentaa luottamusvälit kun yritämme tehdä tilastollisia johtopäätöksiä, ja on informatiivisempaa määrittää todennäköisyys keskiarvon sisältävän luottamusvälin muodostamiseksi.

  • Jos taustalla olevat tiedot ovat normaalijakautuneita, myös näytteenottojakauma on normaalijakautunut. Sitten voimme sanoa, että olemme 68 % varmoja siitä, että perusjoukon keskiarvo on yhden keskivirheen sisällä tai 1 % on kahden keskivirheen sisällä jne.
  • Jos taustalla olevat tiedot EIVÄT ole jakautuneet normaalisti, mutta otoskoko on riittävän suuri, voimme luottaa Keskirajalause (CLT) jos sanotaan, että otantajakauma on likimäärin normaalijakautumassa, voimme tehdä samanlaisia ​​väitteitä luottamusvälistä.

Kuinka standardivirhe (SE) lasketaan?

Normaalivirheen laskemiseen käytetään yleensä seuraavaa kaavaa. Aion keskustella tämän kaavan johtamisesta seuraavissa osissa.

Kuva tekijältä

Mitkä ovat esimerkkejä vakiovirheistä?

Vakiovirheitä voidaan soveltaa eri tyyppisiin tilastoissa. Jotkut suositut esimerkit ovat

  • Otoskeskiarvon standardivirhe (alias keskiarvon standardivirhe, SEM)
  • Otossuhteen standardivirhe (alias osuuden standardivirhe, SEP)

Mikä on keskimääräinen standardivirhe (SEM)?

Keskiarvon standardivirhe (tai yksinkertaisesti standardivirhe) osoittaa, kuinka erilainen on näytteen keskiarvo on todennäköisesti kotoisin keskimääräinen väestö.

Teknisesti keskiarvon keskivirhe lasketaan otoskeskiarvon keskihajonnana.

Kuva tekijältä

Hypoteettisesti voimme laskea vakiovirheen toistuvissa näytteissä seuraavien vaiheiden avulla:

  1. Piirrä populaatiosta uusi näyte.
  2. Laske näytteen keskiarvo vaiheessa 1
  3. Toista vaiheet 1 ja 2 useita kertoja.
  4. Keskivirhe saadaan laskemalla aikaisempien vaiheiden näytekeskiarvojen keskihajonna.

Kiitokset Keskirajalause (CLT), meidän ei tarvitse ottaa huomioon näytteenottojakaumaa toistuvissa näytteissä. Sen sijaan näytevälineiden näytteenottojakauma voidaan arvioida vain YHDEN satunnaisnäytteen perusteella.

Keskirajalause sanoo, että näytteen keskiarvolla on suunnilleen normaalijakauma a:n kanssa μ:n keskiarvo ja σ/√n:n keskihajonta (tai keskivirhe)..

Miten SEM:n kaava johdetaan?

Kuva tekijältä

Näin ollen,

Kuva tekijältä

Useimmissa tapauksissa väestötietojen keskihajontaa ei tunneta. Arvioimme sen käyttämällä otostietojen keskihajontaa (näytteen keskihajonta).

Näin ollen,

Kuva tekijältä

Mikä on osuuden vakiovirhe (SEP)?

Suhteen keskivirhe kertoo kuinka erilainen on näytteen osuus on todennäköisesti kotoisin väestöosuus.

Suhteen keskivirhe lasketaan otossuhteiden keskihajonnana.

Kuva tekijältä

Huomaat, että jokaisessa näytetiedossa meillä on vain data joko 1 tai 0. Jokainen arvo seuraa a:ta Bernouillin jakelu. Lasketut otossuhteet eivät ole enää binääriarvoja. Sen sijaan ne voivat olla mikä tahansa arvo välillä 0 ja 1.

Keskirajalause sanoo, että näyteosuudella on suunnilleen normaalijakauma a:n kanssa keskiarvo p ja keskihajonta (tai keskivirhe) √P(1-P)/√n, jossa P on väestöosuus.

Kuinka johdetaan SEP:n kaava?

Kuva tekijältä

Samanlainen kuin SEM,

Kuva tekijältä
Kuva tekijältä

Voimme arvioida σ näytteen keskihajonnan avulla √p(1-p) (eli Bernouilli-jakauman keskihajonta)

Kuva tekijältä

Johtopäätös:

Keskihajonta ja standardivirhe ovat samanlaisia ​​käsitteitä, joita molempia käytetään mittaamaan vaihtelua.

Standardipoikkeama osoittaa kuinka näytetietoarvot ovat erilaisia ​​kuin keskiarvo näytteiden jakelu.

Standardivirhe osoittaa kuinka näytetietotilastot ovat erilaisia ​​kuin väestötilastoissa näytteen jakaminen.

Kiitos, että luit !!!

Jos pidät tästä artikkelista ja haluat Osta minulle kahvia, Ole hyvä Klikkaa tästä.

Voit rekisteröityä jäsenyys avataksesi täyden pääsyn artikkeleihini ja sinulla on rajoittamaton pääsy kaikkeen Mediumissa. Ole kiltti merkitä jos haluat saada sähköposti-ilmoituksen aina kun julkaisen uuden artikkelin.

Keskihajonta vs. standardivirhe: mikä ero on? Julkaistu uudelleen lähteestä https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 https://towardsdatascience.com/feed kautta

<!-

->

Aikaleima:

Lisää aiheesta Blockchain-konsultit