Ikrek a különböző univerzumokból
SA tandard eltérés és a standard hiba két statisztikai fogalom, amelyek gyakran zavart okoznak. Ugyanaz az értelmezésük, vagy valami egészen mást akarnak képviselni? Ebben a bejegyzésben többet fogunk megvitatni.
Mi az a szórás (SD)?
A szórás méri a változékonyság (más néven a terjedése) körüli adatpontok jelent egy adott adathalmazban. Más szóval, átlagosan megmondja, hogy az egyes adatpontok milyen messze vannak az átlagtól.
Populáció szórás
A való világban egy bizonyos jellemző becslése érdekel bennünket a népesség. A szórás egy példa ezekre a jellemzőkre.
Ha van MINDEN az adatpontokat egy populációból, akkor kiszámíthatja a TRUE a sokaság szórásának értéke a következő képlet segítségével.
Minta szórás
Gyakran időbeli, pénzügyi vagy technikai korlátok miatt nehéz az összes adatpontot összegyűjteni a sokaságból. Például, ha ki szeretnénk számítani a TRUE A Los Angeles-i háztartások jövedelmének szórása, akkor az összes Los Angeles-i háztartásból bevételt kellene szereznünk, amit szinte lehetetlen megtenni.
Ehelyett véletlenszerű mintákat gyűjthetünk a sokaságból, és a segítségével következtetéseket vonhatunk le a sokaság szórására Minta szórás. A minta szórásának képlete a
Miért használja az N-1-et a minta szórására?
Észre fogja venni, hogy a minta átlagát (x̄) használjuk a sokaság átlaga (μ) helyett a minta szórásához, mert nem tudunk semmit a sokaság átlagáról. x̄ egy ésszerű becslés μ-re.
Ezért a mintaadatkészletben bármely X érték közelebb lenne x̄-hez, mint μ-hez. A minta szórásának számlálója mesterségesen kisebb lesz, mint amilyennek lennie kellene. Ennek eredményeként a minta szórása az lenne alábecsülik.
Ennek kijavítására előítélet a mintában a szórás, használnánk „N-1” az „N” helyett (más néven, Bessel korrekciója) a minta szórására.
N-1 használata esetén a minta szórása nagyobb lenne, mint az N-t használva. Ezért van egy kevésbé torzított becslésünk a sokaság szórására, ami konzervatív becslést ad a változékonyságra.
Mi az a Standard Error (SE)?
Mielőtt a szabványos hibáról beszélnénk, először ismerkedjünk meg a fogalmával Mintaelosztás és a Mintavétel elosztása.
Mintaelosztás vs mintavételezés
A mintaelosztás egyszerűen az adatterjesztés a sokaságból véletlenszerűen vett mintából.
Például megkérdezünk 100 véletlenszerű embert Los Angelesben, hogy mennyi a jövedelmük. A mintaeloszlás leírja a TÉNYLEGES jövedelemeloszlás ebben a 100 főben.
De mi is az a mintavételezés?
A mintavételi eloszlás a a minta statisztika eloszlása (pl. a minta átlaga, a minta szórása, a minta szórása és a minta aránya) több mintán, amelyeket ugyanabból a sokaságból vettek (pl. ismételt mintavétel).
Például megkérdezünk 100 véletlenszerű embert Los Angelesben, hogy mennyi a jövedelmük. Ezután számítsa ki az átlagos jövedelmet. Ezt 1000-szer megismételjük, akkor 1000 különböző átlagjövedelem van. Ennek az 1000 átlagjövedelemnek az eloszlását mintavételi eloszlásnak nevezzük.
Ezért mintaelosztás az eloszlása a minta adat míg mintavételi eloszlás az eloszlása a minta statisztika.
A koncepció az standard hiba a mintaeloszlásra vonatkozik, NEM a mintaeloszlásra.
A Normál hiba egy mérőszám, amely leírja a egy statisztika változékonysága a mintavételi eloszlás.
Hogyan kell értelmezni a standard hibát (SE)?
A Standard Error azt méri, hogy milyen messzire a minta statisztika (pl. mintaátlag) valószínűleg a valódi népességstatisztika (pl. a népesség átlaga).
Miért van szükségünk a szabványos hibára (SE)?
- Ha az alapul szolgáló adatok normális eloszlásúak, akkor a mintavételi eloszlás is normális eloszlású. Akkor azt mondhatjuk, hogy 68%-ban biztosak vagyunk abban, hogy a sokaság átlaga 1 standard hibán belül van, vagy 95% 2 standard hibán belül lesz, stb.
- Ha az alapul szolgáló adatok NEM normális eloszlásúak, de a minta mérete elég nagy, akkor támaszkodhatunk Központi határérték tétel (CLT) Ha azt mondjuk, hogy a mintavételi eloszlás megközelítőleg normális eloszlású, akkor hasonló megállapításokat tehetünk a konfidenciaintervallumokról.
Hogyan kell kiszámítani a standard hibát (SE)?
Általában a következő képletet használjuk a standard hiba kiszámításához. A képlet levezetésének módját a következő részekben tárgyalom.
Melyek a szabványos hibák példái?
A Standard Error különféle típusú hibákra alkalmazható statisztika. Néhány népszerű példa
- A mintaátlag standard hibája (más néven az átlag standard hibája, SEM)
- A minta arányának standard hibája (más néven az arány standard hibája, SEP)
Mi az a standard Error of the Mean (SEM)?
Az átlag standard hibája (vagy egyszerűen standard hiba) azt jelzi, hogy mennyire különbözik az minta átlag valószínűleg a népesség átlaga.
Technikailag az átlag standard hibáját a minta átlagának szórásaként számítják ki.
Hipotetikusan kiszámíthatjuk a standard hibát ismételt minták esetén a következő lépésekkel:
- Rajzoljon új mintát a sokaságból.
- Számítsa ki a minta átlagát az 1. lépésben
- Ismételje meg többször az 1. és 2. lépést.
- A standard hibát az előző lépések mintaátlagainak szórásának kiszámításával kapjuk meg.
A Központi határérték tétel (CLT), nem kell figyelembe vennünk a mintavételi eloszlást ismételt minták esetén. Ehelyett a mintaátlagok mintavételi eloszlása mindössze EGY véletlenszerű mintából becsülhető meg.
A Central Limit Theorem kimondja, hogy a mintaátlag megközelítőleg normális eloszlású a-val μ átlaga és egy σ/√n szórása (vagy standard hibája)..
Hogyan származtatható a SEM képlete?
Ezért
A legtöbb esetben a populációs adatok szórása ismeretlen. Megbecsüljük a mintaadatok szórásával (minta szórása).
Ezért
Mi az arány standard hibája (SEP)?
Az arány standard hibája azt jelzi, hogy mennyire különbözik a minta aránya valószínűleg a lakosság aránya.
Az arány standard hibája a mintaarányok szórásaként kerül kiszámításra.
Észreveheti, hogy minden mintaadatban csak 1 vagy 0 adat van. Minden érték a következőt követi Bernouilli eloszlás. A kiszámított mintaarányok már nem bináris értékek. Ehelyett bármilyen 0 és 1 közötti érték lehet.
A Central Limit Theorem kimondja, hogy a minta aránya megközelítőleg normális eloszlású a-val p és egy √P(1-P)/√n szórása (vagy standard hibája)., ahol P a népesség aránya.
Hogyan származtatható a SEP képlet?
Hasonló a SEM-hez,
Meg tudjuk becsülni σ a minta szórásának felhasználásával √p(1-p) (azaz egy Bernouilli-eloszlás szórása)
Következtetés:
A szórás és a standard hiba hasonló fogalmak, amelyeket mindkettő mérésére használnak változékonyság.
Standard eltérés jelzi, hogyan a minta adatértékek eltérnek az átlagtól mintaelosztás.
Normál hiba jelzi, hogyan a minta adatstatisztika eltérnek a lakossági statisztikától mintavételi eloszlás.
Köszönöm hogy elolvastad !!!
Ha tetszik ez a cikk, és szeretné Vegyél nekem egy kávét, kérem kattints ide.
Jelentkezni lehet a tagság hogy teljes hozzáférést kapjak a cikkeimhez, és korlátlanul hozzáférhessek mindenhez a Mediumon. Kérem Iratkozz fel ha szeretne e-mail értesítést kapni, amikor új cikket teszek közzé.
Szórás vs standard hiba: mi a különbség? Újra közzétéve a következő forrásból: https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 a https://towardsdatascience.com/feed oldalon
<!–
->
- Bitcoin
- bizbuildermike
- blockchain
- blokklánc megfelelőség
- blockchain konferencia
- Blockchain tanácsadók
- coinbase
- coingenius
- megegyezés
- kriptokonferencia
- kriptikus bányászat
- cryptocurrency
- decentralizált
- Defi
- Digitális eszközök
- Ethereum
- gépi tanulás
- nem helyettesíthető token
- Plató
- plato ai
- Platón adatintelligencia
- Platoblockchain
- PlatoData
- platogaming
- Poligon
- a tét igazolása
- W3
- zephyrnet