Odchylenie standardowe a błąd standardowy: jaka jest różnica?

Opublikowane ponownie przez Plato

Obserwuje: 0

Bliźniacy z różnych wszechświatów

SOdchylenie standardowe i błąd standardowy to dwie koncepcje statystyczne, które często powodują zamieszanie. Czy mają tę samą interpretację, czy też mają reprezentować coś zupełnie innego? Więcej omówimy w tym poście.

Co to jest odchylenie standardowe (SD)?

Połączenia odchylenie standardowe mierzy zmienność (aka, rozpiętość) punktów danych wokół oznaczać w danym zbiorze danych. Innymi słowy, mówi nam średnio, jak daleko każdy punkt danych jest oddalony od średniej.

Odchylenie standardowe populacji

W prawdziwym świecie jesteśmy zainteresowani oszacowaniem pewnej cechy w a populacja. Odchylenie standardowe to przykład tych cech.

kiedy masz WSZYSTKO punkty danych z populacji, można obliczyć TRUE wartość odchylenia standardowego populacji, korzystając z poniższego wzoru.

Odchylenie standardowe próbki

Często zebranie wszystkich punktów danych z populacji jest trudne ze względu na ograniczenia czasowe, finansowe lub techniczne. Na przykład, jeśli chcemy obliczyć TRUE odchyleniu standardowym dochodu gospodarstwa domowego w Los Angeles, musielibyśmy uzyskać dochód ze wszystkich gospodarstw domowych w Los Angeles, co jest prawie niemożliwe.

Zamiast tego możemy zebrać losowe próbki z populacji i wyciągnąć wnioski na temat odchylenia standardowego populacji Odchylenie standardowe próbki. Wzór na odchylenie standardowe próbki to:

Dlaczego warto używać N-1 do odchylenia standardowego próbki?

Zauważysz, że do określenia odchylenia standardowego próbki używamy średniej próbki (x̄) zamiast średniej populacji (µ), ponieważ nie wiemy nic o średniej populacji. x̄ jest rozsądnym oszacowaniem dla μ.

Dlatego dowolna wartość X w przykładowym zbiorze danych byłaby bliższa x̄ niż μ. Licznik odchylenia standardowego próbki zostałby sztucznie mniejszy, niż powinien. W rezultacie odchylenie standardowe próbki będzie wynosić niedoceniany.

Aby to poprawić stronniczość w próbce odchylenia standardowego, użylibyśmy „N-1” zamiast „N” (znany jako, Poprawka Bessela) dla odchylenia standardowego próbki.

Użycie N-1 spowodowałoby, że odchylenie standardowe próbki byłoby większe niż w przypadku zastosowania N. Dlatego mamy mniej obciążone oszacowanie odchylenia standardowego populacji, co daje nam ostrożne oszacowanie zmienności.

Co to jest błąd standardowy (SE)?

Zanim omówimy błąd standardowy, zapoznajmy się najpierw z pojęciami Dystrybucja próbek i Dystrybucja próbek.

Dystrybucja próbek a dystrybucja próbek

Połączenia dystrybucja próbek jest po prostu dystrybucja danych próbki pobranej losowo z populacji.

Na przykład pytamy 100 przypadkowych osób w Los Angeles, jakie są ich dochody. Rozkład próbek opisuje RZECZYWISTY rozkład dochodów na te 100 osób.

Ale czym jest dystrybucja próbkowania?

Połączenia dystrybucja próbek jest rozkład statystyki próbki (np. średnia próbki, wariancja próbki, odchylenie standardowe próbki i proporcja próbki) dla wielu próbek pobranych z tej samej populacji (tj. powtarzane pobieranie próbek).

Na przykład pytamy 100 przypadkowych osób w Los Angeles, jakie są ich dochody. Następnie oblicz średni dochód. Powtarzamy to 1000 razy, wtedy mamy 1000 różnych średnich dochodów. Rozkład tych 1000 średnich dochodów nazywany jest rozkładem próby.

Dlatego dystrybucja próbek jest dystrybucja przykładowe dane Podczas dystrybucja próbek jest dystrybucja przykładowa statystyka.

Koncepcja jest Standardowy błąd dotyczy rozkładu próby, a NIE rozkładu próbki.

Połączenia Standardowy błąd jest metryką opisującą zmienność statystyki dystrybucja próbek.

Jak interpretować błąd standardowy (SE)?

Błąd standardowy mierzy, jak daleko przykładowa statystyka (np. średnia próbki) prawdopodobnie pochodzi z prawdziwa statystyka populacji (np. średnia populacji).

Dlaczego potrzebujemy błędu standardowego (SE)?

Zwykle możesz chcieć zbudować przedziały ufności kiedy próbujemy wyciągnąć wnioski statystyczne, a bardziej pouczające jest przypisanie prawdopodobieństwa w celu skonstruowania przedziału ufności zawierającego średnią.

Jeśli dane bazowe mają rozkład normalny, wówczas rozkład próbkowania również ma rozkład normalny. Możemy wtedy powiedzieć, że mamy 68% pewności, że średnia populacji mieści się w granicach 1 błędu standardowego lub 95% będzie mieściła się w granicach 2 błędów standardowych itd.
Jeśli podstawowe dane NIE mają rozkładu normalnego, ale wielkość próby jest wystarczająco duża, możemy na tym polegać Centralne twierdzenie graniczne (CLT) powiedzieć, że rozkład próbkowania ma w przybliżeniu rozkład normalny, wówczas możemy sformułować podobne stwierdzenia dotyczące przedziałów ufności.

Jak obliczyć błąd standardowy (SE)?

Do obliczenia błędu standardowego zwykle używamy następującego wzoru. Omówię sposób wyprowadzenia tego wzoru w następnych sekcjach.

Jakie są przykłady błędu standardowego?

Błąd standardowy można zastosować do różnych typów statystyki. Oto kilka popularnych przykładów

Błąd standardowy średniej próbki (inaczej błąd standardowy średniej, SEM)
Błąd standardowy proporcji próbki (inaczej błąd standardowy proporcji, SEP)

Co to jest błąd standardowy średniej (SEM)?

Błąd standardowy średniej (lub po prostu błąd standardowy) wskazuje, jak różne są średnia próbki prawdopodobnie pochodzi z średnia populacja.

Z technicznego punktu widzenia błąd standardowy średniej oblicza się jako odchylenie standardowe średniej próbki.

Hipotetycznie możemy obliczyć błąd standardowy dla powtarzających się próbek, wykonując następujące kroki:

Pobierz nową próbę z populacji.
Oblicz średnią próbki pobranej w kroku 1
Powtórz kroki 1 i 2 kilka razy.
Błąd standardowy oblicza się poprzez obliczenie odchylenia standardowego średnich z próbek z poprzednich etapów.

Dzięki Centralne twierdzenie graniczne (CLT), nie musimy brać pod uwagę rozkładu próbkowania w przypadku powtarzających się próbek. Zamiast tego rozkład próbkowania średnich z próby można oszacować na podstawie tylko JEDNEJ próbki losowej.

Centralne twierdzenie graniczne stwierdza, że średnia próbki ma w przybliżeniu rozkład normalny z a średnia μ oraz odchylenie standardowe (lub błąd standardowy) σ/√n.

Jak wyprowadzić wzór na SEM?

Dlatego

Zdjęcie autora

W większości przypadków odchylenie standardowe danych populacji jest nieznane. Oszacujemy to na podstawie odchylenia standardowego próbki danych (odchylenie standardowe próbki).

Dlatego

Co to jest błąd standardowy proporcji (SEP)?

Błąd standardowy proporcji wskazuje, jak różne są proporcja próbki prawdopodobnie pochodzi z proporcja populacji.

Błąd standardowy proporcji oblicza się jako odchylenie standardowe proporcji próbki.

Zauważysz, że w każdym przykładowym danych mamy tylko dane 1 lub 0. Każda wartość następuje po a Rozkład Bernouilliego. Obliczone proporcje próbek nie są już wartościami binarnymi. Zamiast tego mogą mieć dowolną wartość z zakresu od 0 do 1.

Centralne twierdzenie graniczne stwierdza, że proporcja próbki ma w przybliżeniu rozkład normalny z a średnia ze str oraz odchylenie standardowe (lub błąd standardowy) √P(1-P)/√n, gdzie P jest proporcją populacji.

Jak wyprowadzić wzór na SEP?

Podobnie jak SEM,

Zdjęcie autora

Możemy oszacować σ przy użyciu odchylenia standardowego próbki √p(1-p) (tj. odchylenie standardowe rozkładu Bernouilliego)

Wnioski:

Odchylenie standardowe i błąd standardowy to podobne pojęcia, które służą do pomiaru zmienność.

Odchylenie standardowe wskazuje, w jaki sposób przykładowe wartości danych różnią się od średnich w dystrybucja próbek.

Standardowy błąd wskazuje, w jaki sposób przykładowe statystyki danych różnią się od statystyk populacji w dystrybucja próbek.

Dziękuję za przeczytanie !!!

Jeśli podoba Ci się ten artykuł i chcesz Kup mi kawę, Proszę kliknij tutaj.

Możesz zarejestrować się w członkostwo aby odblokować pełny dostęp do moich artykułów i mieć nieograniczony dostęp do wszystkiego na Medium. Proszę subskrybuj jeśli chcesz otrzymywać powiadomienia e-mail za każdym razem, gdy opublikuję nowy artykuł.

Odchylenie standardowe a błąd standardowy: jaka jest różnica? Opublikowano ponownie ze źródła https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 przez https://towardsdatascience.com/feed

<!–

Znak czasu: Listopad 2, 2022Listopad 3, 2022