Standardavvikelse vs standardfel: Vad är skillnaden?

Tvillingar från olika universum

Foto: Martin sanchez on Unsplash

Standardavvikelse och standardfel är två statistiska begrepp som ofta orsakar förvirring. Har de samma tolkningar eller är de tänkta att representera något helt annat? Vi kommer att diskutera mer i det här inlägget.

Vad är standardavvikelse (SD)?

Smakämnen standardavvikelse mäter variabilitet (aka, den spridning) av datapunkter runt betyda i en given datamängd. Med andra ord, det talar om för oss i genomsnitt hur långt varje datapunkt är borta från medelvärdet.

Population standardavvikelse

I den verkliga världen är vi intresserade av att uppskatta en viss egenskap i en befolkning. Standardavvikelse är en exempel på dessa egenskaper.

När du har ALLA datapunkterna från en population kan du beräkna SANN värdet av populationens standardavvikelse med hjälp av följande formel.

Bild av författare

Exempel på standardavvikelse

Ofta är det svårt att samla in alla datapunkter från befolkningen på grund av tidsmässiga, ekonomiska eller tekniska begränsningar. Till exempel, om vi skulle vilja beräkna SANN standardavvikelse för hushållsinkomsten i Los Angeles skulle vi behöva få inkomst från alla hushåll i Los Angeles, vilket är nästan omöjligt att göra.

Istället kan vi samla in slumpmässiga urval från populationen och dra slutsatser om populationens standardavvikelse med hjälp av Exempel på standardavvikelse. Formeln för provets standardavvikelse är

Bild av författare

Varför använda N-1 för provets standardavvikelse?

Du kommer att märka att vi använder urvalets medelvärde (x̄) istället för populationsmedelvärdet (μ) för urvalets standardavvikelse eftersom vi inte vet något om populationsmedelvärdet. x̄ är en rimlig uppskattning för μ.

Därför skulle vilket värde X som helst i provdatauppsättningen vara närmare x̄ än μ. Täljaren i provets standardavvikelse skulle bli artificiellt mindre än den är tänkt att vara. Som ett resultat skulle provets standardavvikelse bli skattas.

För att rätta till detta förspänning i provet standardavvikelse skulle vi använda "N-1" istället för "N" (aka, Bessels korrigering) för provets standardavvikelse.

Att använda N-1 skulle göra urvalets standardavvikelse större än annars med N. Därför har vi en mindre partisk uppskattning av populationens standardavvikelse, vilket ger oss en konservativ uppskattning av variabiliteten.

Vad är standardfel (SE)?

Innan vi diskuterar standardfelet, låt oss först bekanta oss med begreppen Provdistribution och Provtagningsfördelning.

Provfördelning vs provfördelning

Smakämnen provfördelning är helt enkelt den datadistribution av urvalet som tas slumpmässigt från populationen.

Till exempel frågar vi 100 slumpmässiga personer i Los Angeles vad deras inkomster är. Provfördelningen beskriver FAKTISK inkomstfördelning i dessa 100 personer.

Men vad är samplingsdistribution?

Smakämnen provtagningsfördelning är fördelning av urvalsstatistiken (t.ex. urvalsmedelvärde, urvalsvarians, urvalsstandardavvikelse och urvalsproportion) över många urval dragna från samma population (dvs. upprepad provtagning).

Till exempel frågar vi 100 slumpmässiga personer i Los Angeles vad deras inkomster är. Beräkna sedan medelinkomsten. Vi upprepar detta 1000 gånger, sedan har vi 1000 olika medelinkomster. Fördelningen av dessa 1000 medelinkomster kallas urvalsfördelningen.

Därför, provfördelning är fördelningen av stickprov medan provtagningsfördelning är fördelningen av exempelstatistik.

Konceptet är standard fel är relevant för urvalsfördelningen, INTE urvalsfördelningen.

Smakämnen Standard fel är ett mått som beskriver variabilitet hos en statistik i provtagningsfördelning.

Hur tolkar man Standard Error (SE)?

Standardfelet mäter hur långt exempelstatistik (t.ex. provmedelvärde) kommer sannolikt från sann befolkningsstatistik (t.ex. befolkningens medelvärde).

Varför behöver vi Standard Error (SE)?

Vanligtvis kanske du vill bygga konfidensintervaller när vi försöker göra statistiska slutsatser, och det är mer informativt att tilldela en sannolikhet för att konstruera ett konfidensintervall som innehåller medelvärdet.

  • Om de underliggande data är normalfördelade, så är också samplingsfördelningen normalfördelad. Då kan vi säga att vi är 68% säkra på att populationens medelvärde ligger inom 1 standardfel eller att 95% kommer att vara inom 2 standardfel, etc.
  • Om de underliggande data INTE är normalfördelade, men urvalsstorleken är tillräckligt stor, kan vi lita på Central Limit Theorem (CLT) att säga att urvalsfördelningen är ungefär normalfördelad, då kan vi göra liknande påståenden om konfidensintervall.

Hur beräknar man standardfel (SE)?

Vi använder vanligtvis följande formel för att beräkna standardfelet. Jag kommer att diskutera hur man härleder denna formel i nästa avsnitt.

Bild av författare

Vilka är exemplen på standardfel?

Standardfel kan appliceras på olika typer av statistik. Några populära exempel är

  • Standardfelet för provmedelvärdet (aka, standardfelet för medelvärdet, SEM)
  • Standardfelet för provandelen (aka, standardfelet för proportionen, SEP)

Vad är standardfelet för medelvärdet (SEM)?

Standardfelet för medelvärdet (eller helt enkelt standardfel) anger hur olika provmedelvärde sannolikt kommer från befolkningsmedelvärde.

Tekniskt sett beräknas standardfelet för medelvärdet som standardavvikelsen för provmedelvärdet.

Bild av författare

Hypotetiskt kan vi beräkna standardfelet under upprepade prover med hjälp av följande steg:

  1. Ta ett nytt urval från populationen.
  2. Beräkna provmedelvärdet för det dragna provet i steg 1
  3. Upprepa steg 1 och 2 flera gånger.
  4. Standardfelet erhålls genom att beräkna standardavvikelsen för de tidigare stegens sampelmedel.

Tack vare Central Limit Theorem (CLT), behöver vi inte ta hänsyn till samplingsfördelningen under upprepade prover. Istället kan urvalsfördelningen av urvalsmedlen uppskattas från bara ETT slumpmässigt urval.

Central Limit Theorem säger att urvalsmedelvärdet har en ungefärlig normalfördelning med a medelvärde av μ och en standardavvikelse (eller standardfel) för σ/√n.

Hur härleder man formeln för SEM?

Bild av författare

Därför,

Bild av författare

I de flesta fall är standardavvikelsen för populationsdata okänd. Vi kommer att uppskatta det med hjälp av standardavvikelsen för provdata (provstandardavvikelse).

Därför,

Bild av författare

Vad är standardfelet för proportionen (SEP)?

Standardfelet för andelen indikerar hur olika provandel sannolikt kommer från befolkningsandel.

Standardfelet för proportionen beräknas som standardavvikelsen för urvalsproportionerna.

Bild av författare

Du kommer att märka att i varje exempeldata har vi bara data antingen 1 eller 0. Varje värde följer a Bernouilli distribution. De beräknade provproportionerna är inte längre binära värden. Istället kan de vara vilket värde som helst mellan 0 och 1.

Central Limit Theorem säger att urvalsproportionen har en ungefärlig normalfördelning med a medel av sid och en standardavvikelse (eller standardfel) för √P(1-P)/√n, där P är befolkningsandelen.

Hur härleder man formeln för SEP?

Bild av författare

I likhet med SEM,

Bild av författare
Bild av författare

Vi kan uppskatta σ med hjälp av provets standardavvikelse √p(1-p) (dvs standardavvikelsen för en Bernouilli-fördelning)

Bild av författare

Slutsats:

Standardavvikelse och standardfel är liknande begrepp som båda används för att mäta variabilitet.

Standardavvikelse anger hur exempeldatavärden skiljer sig från medelvärdet i provfördelning.

Standard fel anger hur exempeldatastatistik skiljer sig från befolkningsstatistiken i provtagningsfördelning.

Tack för att du läste !!!

Om du gillar den här artikeln och vill Köp mig en kaffe, snälla du Klicka här.

Du kan registrera dig för en medlemskap för att låsa upp full tillgång till mina artiklar, och ha obegränsad tillgång till allt på Medium. Snälla du prenumerera om du vill få ett e-postmeddelande när jag postar en ny artikel.

Standardavvikelse vs standardfel: Vad är skillnaden? Återpublicerad från källa https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

->

Tidsstämpel:

Mer från Blockchain-konsulter