Szórás vs standard hiba: mi a különbség?

Ikrek a különböző univerzumokból

Fotó Martin sanchez on Unsplash

SA tandard eltérés és a standard hiba két statisztikai fogalom, amelyek gyakran zavart okoznak. Ugyanaz az értelmezésük, vagy valami egészen mást akarnak képviselni? Ebben a bejegyzésben többet fogunk megvitatni.

Mi az a szórás (SD)?

A szórás méri a változékonyság (más néven a terjedése) körüli adatpontok jelent egy adott adathalmazban. Más szóval, átlagosan megmondja, hogy az egyes adatpontok milyen messze vannak az átlagtól.

Populáció szórás

A való világban egy bizonyos jellemző becslése érdekel bennünket a népesség. A szórás egy példa ezekre a jellemzőkre.

Ha van MINDEN az adatpontokat egy populációból, akkor kiszámíthatja a TRUE a sokaság szórásának értéke a következő képlet segítségével.

Kép szerzőtől

Minta szórás

Gyakran időbeli, pénzügyi vagy technikai korlátok miatt nehéz az összes adatpontot összegyűjteni a sokaságból. Például, ha ki szeretnénk számítani a TRUE A Los Angeles-i háztartások jövedelmének szórása, akkor az összes Los Angeles-i háztartásból bevételt kellene szereznünk, amit szinte lehetetlen megtenni.

Ehelyett véletlenszerű mintákat gyűjthetünk a sokaságból, és a segítségével következtetéseket vonhatunk le a sokaság szórására Minta szórás. A minta szórásának képlete a

Kép szerzőtől

Miért használja az N-1-et a minta szórására?

Észre fogja venni, hogy a minta átlagát (x̄) használjuk a sokaság átlaga (μ) helyett a minta szórásához, mert nem tudunk semmit a sokaság átlagáról. x̄ egy ésszerű becslés μ-re.

Ezért a mintaadatkészletben bármely X érték közelebb lenne x̄-hez, mint μ-hez. A minta szórásának számlálója mesterségesen kisebb lesz, mint amilyennek lennie kellene. Ennek eredményeként a minta szórása az lenne alábecsülik.

Ennek kijavítására előítélet a mintában a szórás, használnánk „N-1” az „N” helyett (más néven, Bessel korrekciója) a minta szórására.

N-1 használata esetén a minta szórása nagyobb lenne, mint az N-t használva. Ezért van egy kevésbé torzított becslésünk a sokaság szórására, ami konzervatív becslést ad a változékonyságra.

Mi az a Standard Error (SE)?

Mielőtt a szabványos hibáról beszélnénk, először ismerkedjünk meg a fogalmával Mintaelosztás és a Mintavétel elosztása.

Mintaelosztás vs mintavételezés

A mintaelosztás egyszerűen az adatterjesztés a sokaságból véletlenszerűen vett mintából.

Például megkérdezünk 100 véletlenszerű embert Los Angelesben, hogy mennyi a jövedelmük. A mintaeloszlás leírja a TÉNYLEGES jövedelemeloszlás ebben a 100 főben.

De mi is az a mintavételezés?

A mintavételi eloszlás a a minta statisztika eloszlása (pl. a minta átlaga, a minta szórása, a minta szórása és a minta aránya) több mintán, amelyeket ugyanabból a sokaságból vettek (pl. ismételt mintavétel).

Például megkérdezünk 100 véletlenszerű embert Los Angelesben, hogy mennyi a jövedelmük. Ezután számítsa ki az átlagos jövedelmet. Ezt 1000-szer megismételjük, akkor 1000 különböző átlagjövedelem van. Ennek az 1000 átlagjövedelemnek az eloszlását mintavételi eloszlásnak nevezzük.

Ezért mintaelosztás az eloszlása ​​a minta adat míg mintavételi eloszlás az eloszlása ​​a minta statisztika.

A koncepció az standard hiba a mintaeloszlásra vonatkozik, NEM a mintaeloszlásra.

A Normál hiba egy mérőszám, amely leírja a egy statisztika változékonysága a mintavételi eloszlás.

Hogyan kell értelmezni a standard hibát (SE)?

A Standard Error azt méri, hogy milyen messzire a minta statisztika (pl. mintaátlag) valószínűleg a valódi népességstatisztika (pl. a népesség átlaga).

Miért van szükségünk a szabványos hibára (SE)?

Általában érdemes lehet építeni megbízhatósági intervallumok amikor megpróbálunk statisztikai következtetéseket levonni, és informatívabb az átlagot tartalmazó konfidenciaintervallum felépítéséhez való valószínűség hozzárendelése.

  • Ha az alapul szolgáló adatok normális eloszlásúak, akkor a mintavételi eloszlás is normális eloszlású. Akkor azt mondhatjuk, hogy 68%-ban biztosak vagyunk abban, hogy a sokaság átlaga 1 standard hibán belül van, vagy 95% 2 standard hibán belül lesz, stb.
  • Ha az alapul szolgáló adatok NEM normális eloszlásúak, de a minta mérete elég nagy, akkor támaszkodhatunk Központi határérték tétel (CLT) Ha azt mondjuk, hogy a mintavételi eloszlás megközelítőleg normális eloszlású, akkor hasonló megállapításokat tehetünk a konfidenciaintervallumokról.

Hogyan kell kiszámítani a standard hibát (SE)?

Általában a következő képletet használjuk a standard hiba kiszámításához. A képlet levezetésének módját a következő részekben tárgyalom.

Kép szerzőtől

Melyek a szabványos hibák példái?

A Standard Error különféle típusú hibákra alkalmazható statisztika. Néhány népszerű példa

  • A mintaátlag standard hibája (más néven az átlag standard hibája, SEM)
  • A minta arányának standard hibája (más néven az arány standard hibája, SEP)

Mi az a standard Error of the Mean (SEM)?

Az átlag standard hibája (vagy egyszerűen standard hiba) azt jelzi, hogy mennyire különbözik az minta átlag valószínűleg a népesség átlaga.

Technikailag az átlag standard hibáját a minta átlagának szórásaként számítják ki.

Kép szerzőtől

Hipotetikusan kiszámíthatjuk a standard hibát ismételt minták esetén a következő lépésekkel:

  1. Rajzoljon új mintát a sokaságból.
  2. Számítsa ki a minta átlagát az 1. lépésben
  3. Ismételje meg többször az 1. és 2. lépést.
  4. A standard hibát az előző lépések mintaátlagainak szórásának kiszámításával kapjuk meg.

A Központi határérték tétel (CLT), nem kell figyelembe vennünk a mintavételi eloszlást ismételt minták esetén. Ehelyett a mintaátlagok mintavételi eloszlása ​​mindössze EGY véletlenszerű mintából becsülhető meg.

A Central Limit Theorem kimondja, hogy a mintaátlag megközelítőleg normális eloszlású a-val μ átlaga és egy σ/√n szórása (vagy standard hibája)..

Hogyan származtatható a SEM képlete?

Kép szerzőtől

Ezért

Kép szerzőtől

A legtöbb esetben a populációs adatok szórása ismeretlen. Megbecsüljük a mintaadatok szórásával (minta szórása).

Ezért

Kép szerzőtől

Mi az arány standard hibája (SEP)?

Az arány standard hibája azt jelzi, hogy mennyire különbözik a minta aránya valószínűleg a lakosság aránya.

Az arány standard hibája a mintaarányok szórásaként kerül kiszámításra.

Kép szerzőtől

Észreveheti, hogy minden mintaadatban csak 1 vagy 0 adat van. Minden érték a következőt követi Bernouilli eloszlás. A kiszámított mintaarányok már nem bináris értékek. Ehelyett bármilyen 0 és 1 közötti érték lehet.

A Central Limit Theorem kimondja, hogy a minta aránya megközelítőleg normális eloszlású a-val p és egy √P(1-P)/√n szórása (vagy standard hibája)., ahol P a népesség aránya.

Hogyan származtatható a SEP képlet?

Kép szerzőtől

Hasonló a SEM-hez,

Kép szerzőtől
Kép szerzőtől

Meg tudjuk becsülni σ a minta szórásának felhasználásával √p(1-p) (azaz egy Bernouilli-eloszlás szórása)

Kép szerzőtől

Következtetés:

A szórás és a standard hiba hasonló fogalmak, amelyeket mindkettő mérésére használnak változékonyság.

Standard eltérés jelzi, hogyan a minta adatértékek eltérnek az átlagtól mintaelosztás.

Normál hiba jelzi, hogyan a minta adatstatisztika eltérnek a lakossági statisztikától mintavételi eloszlás.

Köszönöm hogy elolvastad !!!

Ha tetszik ez a cikk, és szeretné Vegyél nekem egy kávét, kérem kattints ide.

Jelentkezni lehet a tagság hogy teljes hozzáférést kapjak a cikkeimhez, és korlátlanul hozzáférhessek mindenhez a Mediumon. Kérem Iratkozz fel ha szeretne e-mail értesítést kapni, amikor új cikket teszek közzé.

Szórás vs standard hiba: mi a különbség? Újra közzétéve a következő forrásból: https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 a https://towardsdatascience.com/feed oldalon

<!–

->

Időbélyeg:

Még több Blockchain tanácsadók