Szórás vs standard hiba: mi a különbség?

Újra kiadta Platón

Követő: 0

Ikrek a különböző univerzumokból

SA tandard eltérés és a standard hiba két statisztikai fogalom, amelyek gyakran zavart okoznak. Ugyanaz az értelmezésük, vagy valami egészen mást akarnak képviselni? Ebben a bejegyzésben többet fogunk megvitatni.

Mi az a szórás (SD)?

A szórás méri a változékonyság (más néven a terjedése) körüli adatpontok jelent egy adott adathalmazban. Más szóval, átlagosan megmondja, hogy az egyes adatpontok milyen messze vannak az átlagtól.

Populáció szórás

A való világban egy bizonyos jellemző becslése érdekel bennünket a népesség. A szórás egy példa ezekre a jellemzőkre.

Ha van MINDEN az adatpontokat egy populációból, akkor kiszámíthatja a TRUE a sokaság szórásának értéke a következő képlet segítségével.

Minta szórás

Gyakran időbeli, pénzügyi vagy technikai korlátok miatt nehéz az összes adatpontot összegyűjteni a sokaságból. Például, ha ki szeretnénk számítani a TRUE A Los Angeles-i háztartások jövedelmének szórása, akkor az összes Los Angeles-i háztartásból bevételt kellene szereznünk, amit szinte lehetetlen megtenni.

Ehelyett véletlenszerű mintákat gyűjthetünk a sokaságból, és a segítségével következtetéseket vonhatunk le a sokaság szórására Minta szórás. A minta szórásának képlete a

Miért használja az N-1-et a minta szórására?

Észre fogja venni, hogy a minta átlagát (x̄) használjuk a sokaság átlaga (μ) helyett a minta szórásához, mert nem tudunk semmit a sokaság átlagáról. x̄ egy ésszerű becslés μ-re.

Ezért a mintaadatkészletben bármely X érték közelebb lenne x̄-hez, mint μ-hez. A minta szórásának számlálója mesterségesen kisebb lesz, mint amilyennek lennie kellene. Ennek eredményeként a minta szórása az lenne alábecsülik.

Ennek kijavítására előítélet a mintában a szórás, használnánk „N-1” az „N” helyett (más néven, Bessel korrekciója) a minta szórására.

N-1 használata esetén a minta szórása nagyobb lenne, mint az N-t használva. Ezért van egy kevésbé torzított becslésünk a sokaság szórására, ami konzervatív becslést ad a változékonyságra.

Mi az a Standard Error (SE)?

Mielőtt a szabványos hibáról beszélnénk, először ismerkedjünk meg a fogalmával Mintaelosztás és a Mintavétel elosztása.

Mintaelosztás vs mintavételezés

A mintaelosztás egyszerűen az adatterjesztés a sokaságból véletlenszerűen vett mintából.

Például megkérdezünk 100 véletlenszerű embert Los Angelesben, hogy mennyi a jövedelmük. A mintaeloszlás leírja a TÉNYLEGES jövedelemeloszlás ebben a 100 főben.

De mi is az a mintavételezés?

A mintavételi eloszlás a a minta statisztika eloszlása (pl. a minta átlaga, a minta szórása, a minta szórása és a minta aránya) több mintán, amelyeket ugyanabból a sokaságból vettek (pl. ismételt mintavétel).

Például megkérdezünk 100 véletlenszerű embert Los Angelesben, hogy mennyi a jövedelmük. Ezután számítsa ki az átlagos jövedelmet. Ezt 1000-szer megismételjük, akkor 1000 különböző átlagjövedelem van. Ennek az 1000 átlagjövedelemnek az eloszlását mintavételi eloszlásnak nevezzük.

Ezért mintaelosztás az eloszlása a minta adat míg mintavételi eloszlás az eloszlása a minta statisztika.

A koncepció az standard hiba a mintaeloszlásra vonatkozik, NEM a mintaeloszlásra.

A Normál hiba egy mérőszám, amely leírja a egy statisztika változékonysága a mintavételi eloszlás.

Hogyan kell értelmezni a standard hibát (SE)?

A Standard Error azt méri, hogy milyen messzire a minta statisztika (pl. mintaátlag) valószínűleg a valódi népességstatisztika (pl. a népesség átlaga).

Miért van szükségünk a szabványos hibára (SE)?

Általában érdemes lehet építeni megbízhatósági intervallumok amikor megpróbálunk statisztikai következtetéseket levonni, és informatívabb az átlagot tartalmazó konfidenciaintervallum felépítéséhez való valószínűség hozzárendelése.

Ha az alapul szolgáló adatok normális eloszlásúak, akkor a mintavételi eloszlás is normális eloszlású. Akkor azt mondhatjuk, hogy 68%-ban biztosak vagyunk abban, hogy a sokaság átlaga 1 standard hibán belül van, vagy 95% 2 standard hibán belül lesz, stb.
Ha az alapul szolgáló adatok NEM normális eloszlásúak, de a minta mérete elég nagy, akkor támaszkodhatunk Központi határérték tétel (CLT) Ha azt mondjuk, hogy a mintavételi eloszlás megközelítőleg normális eloszlású, akkor hasonló megállapításokat tehetünk a konfidenciaintervallumokról.

Hogyan kell kiszámítani a standard hibát (SE)?

Általában a következő képletet használjuk a standard hiba kiszámításához. A képlet levezetésének módját a következő részekben tárgyalom.

Melyek a szabványos hibák példái?

A Standard Error különféle típusú hibákra alkalmazható statisztika. Néhány népszerű példa

A mintaátlag standard hibája (más néven az átlag standard hibája, SEM)
A minta arányának standard hibája (más néven az arány standard hibája, SEP)

Mi az a standard Error of the Mean (SEM)?

Az átlag standard hibája (vagy egyszerűen standard hiba) azt jelzi, hogy mennyire különbözik az minta átlag valószínűleg a népesség átlaga.

Technikailag az átlag standard hibáját a minta átlagának szórásaként számítják ki.

Hipotetikusan kiszámíthatjuk a standard hibát ismételt minták esetén a következő lépésekkel:

Rajzoljon új mintát a sokaságból.
Számítsa ki a minta átlagát az 1. lépésben
Ismételje meg többször az 1. és 2. lépést.
A standard hibát az előző lépések mintaátlagainak szórásának kiszámításával kapjuk meg.

A Központi határérték tétel (CLT), nem kell figyelembe vennünk a mintavételi eloszlást ismételt minták esetén. Ehelyett a mintaátlagok mintavételi eloszlása mindössze EGY véletlenszerű mintából becsülhető meg.

A Central Limit Theorem kimondja, hogy a mintaátlag megközelítőleg normális eloszlású a-val μ átlaga és egy σ/√n szórása (vagy standard hibája)..

Hogyan származtatható a SEM képlete?

Ezért

Kép szerzőtől

A legtöbb esetben a populációs adatok szórása ismeretlen. Megbecsüljük a mintaadatok szórásával (minta szórása).

Ezért

Mi az arány standard hibája (SEP)?

Az arány standard hibája azt jelzi, hogy mennyire különbözik a minta aránya valószínűleg a lakosság aránya.

Az arány standard hibája a mintaarányok szórásaként kerül kiszámításra.

Észreveheti, hogy minden mintaadatban csak 1 vagy 0 adat van. Minden érték a következőt követi Bernouilli eloszlás. A kiszámított mintaarányok már nem bináris értékek. Ehelyett bármilyen 0 és 1 közötti érték lehet.

A Central Limit Theorem kimondja, hogy a minta aránya megközelítőleg normális eloszlású a-val p és egy √P(1-P)/√n szórása (vagy standard hibája)., ahol P a népesség aránya.

Hogyan származtatható a SEP képlet?

Hasonló a SEM-hez,

Kép szerzőtől

Meg tudjuk becsülni σ a minta szórásának felhasználásával √p(1-p) (azaz egy Bernouilli-eloszlás szórása)

Következtetés:

A szórás és a standard hiba hasonló fogalmak, amelyeket mindkettő mérésére használnak változékonyság.

Standard eltérés jelzi, hogyan a minta adatértékek eltérnek az átlagtól mintaelosztás.

Normál hiba jelzi, hogyan a minta adatstatisztika eltérnek a lakossági statisztikától mintavételi eloszlás.

Köszönöm hogy elolvastad !!!

Ha tetszik ez a cikk, és szeretné Vegyél nekem egy kávét, kérem kattints ide.

Jelentkezni lehet a tagság hogy teljes hozzáférést kapjak a cikkeimhez, és korlátlanul hozzáférhessek mindenhez a Mediumon. Kérem Iratkozz fel ha szeretne e-mail értesítést kapni, amikor új cikket teszek közzé.

Szórás vs standard hiba: mi a különbség? Újra közzétéve a következő forrásból: https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 a https://towardsdatascience.com/feed oldalon

<!–

Időbélyeg: November 2, 2022November 3, 2022