Standardabweichung vs. Standardfehler: Was ist der Unterschied?

Zwillinge aus verschiedenen Universen

Photo by Martin Sanchez on Unsplash

SStandardabweichung und Standardfehler sind zwei statistische Konzepte, die oft Verwirrung stiften. Haben sie die gleichen Interpretationen oder sollen sie etwas völlig anderes darstellen? Wir werden in diesem Beitrag mehr besprechen.

Was ist die Standardabweichung (SD)?

Das Standardabweichung misst die Variabilität (aka, die Verbreitung) von Datenpunkten rund um die bedeuten in einem bestimmten Datensatz. Mit anderen Worten: Es sagt uns im Durchschnitt, wie weit jeder Datenpunkt vom Mittelwert entfernt ist.

Bevölkerungsstandardabweichung

In der realen Welt sind wir daran interessiert, ein bestimmtes Merkmal in einem zu schätzen Bevölkerung. Die Standardabweichung ist ein Beispiel für diese Eigenschaften.

Wenn Sie ALLER Die Datenpunkte einer Population können Sie berechnen TRUE Wert der Populationsstandardabweichung mithilfe der folgenden Formel.

Bild vom Autor

Beispiel einer Standardabweichung

Aufgrund zeitlicher, finanzieller oder technischer Einschränkungen ist es oft schwierig, alle Datenpunkte der Bevölkerung zu sammeln. Wenn wir zum Beispiel die berechnen möchten TRUE Um die Standardabweichung des Haushaltseinkommens in Los Angeles zu berechnen, müssten wir das Einkommen aller Haushalte in Los Angeles ermitteln, was nahezu unmöglich ist.

Stattdessen können wir Zufallsstichproben aus der Grundgesamtheit sammeln und daraus Rückschlüsse auf die Standardabweichung der Grundgesamtheit ziehen Beispiel einer Standardabweichung. Die Formel für die Stichprobenstandardabweichung lautet

Bild vom Autor

Warum N-1 für die Stichprobenstandardabweichung verwenden?

Sie werden feststellen, dass wir für die Stichprobenstandardabweichung den Stichprobenmittelwert (x̄) anstelle des Grundgesamtheitsmittelwerts (μ) verwenden, da wir nichts über den Grundgesamtheitsmittelwert wissen. x̄ ist eine vernünftige Schätzung für μ.

Daher wäre jeder Wert X im Beispieldatensatz näher an x̄ als an μ. Der Zähler in der Stichprobenstandardabweichung würde künstlich kleiner werden, als er sein sollte. Das Ergebnis wäre die Standardabweichung der Stichprobe schätzt.

Um dies zu korrigieren vorspannen in der Stichprobe würden wir die Standardabweichung verwenden „N-1“ statt „N“ (auch bekannt, Bessels Korrektur) für die Standardabweichung der Stichprobe.

Die Verwendung von N-1 würde die Standardabweichung der Stichprobe größer machen als sonst die Verwendung von N. Daher verfügen wir über eine weniger verzerrte Schätzung der Standardabweichung der Grundgesamtheit, was uns zu einer konservativen Schätzung der Variabilität führt.

Was ist der Standardfehler (SE)?

Bevor wir den Standardfehler besprechen, machen wir uns zunächst mit den Konzepten von vertraut Probenverteilung und Stichprobenverteilung.

Stichprobenverteilung vs. Stichprobenverteilung

Das Probenverteilung ist einfach das Datenverteilung der Stichprobe, die zufällig aus der Grundgesamtheit gezogen wird.

Wir fragen zum Beispiel 100 zufällig ausgewählte Personen in Los Angeles nach ihrem Einkommen. Die Stichprobenverteilung beschreibt die ACTUAL Einkommensverteilung in diesen 100 Personen.

Aber was ist Sampling-Verteilung?

Das Stichprobenverteilung lernen muss die Verteilung der Stichprobenstatistik (z. B. Stichprobenmittelwert, Stichprobenvarianz, Stichprobenstandardabweichung und Stichprobenanteil) über viele Stichproben aus derselben Grundgesamtheit (d. h. wiederholte Probenahme).

Wir fragen zum Beispiel 100 zufällig ausgewählte Personen in Los Angeles nach ihrem Einkommen. Berechnen Sie dann das Durchschnittseinkommen. Wiederholen wir das 1000 Mal, dann haben wir 1000 verschiedene Durchschnittseinkommen. Die Verteilung dieser 1000 Durchschnittseinkommen wird als Stichprobenverteilung bezeichnet.

Daher sind Probenverteilung ist die Verteilung der Beispieldaten während Stichprobenverteilung ist die Verteilung der Beispielstatistik.

Das Konzept ist Standart Fehler ist für die Stichprobenverteilung relevant, NICHT für die Stichprobenverteilung.

Das Standart Fehler ist eine Metrik, die das beschreibt Variabilität einer Statistik der Stichprobenverteilung.

Wie ist der Standardfehler (SE) zu interpretieren?

Der Standardfehler misst, wie weit die Beispielstatistik (z. B. Stichprobenmittelwert) stammt wahrscheinlich aus dem wahre Bevölkerungsstatistik (z. B. der Bevölkerungsmittelwert).

Warum brauchen wir den Standardfehler (SE)?

Normalerweise möchten Sie möglicherweise konstruieren Vertrauensintervalle Wenn wir versuchen, statistische Schlussfolgerungen zu ziehen, ist es aussagekräftiger, eine Wahrscheinlichkeit zuzuweisen, um ein Konfidenzintervall zu erstellen, das den Mittelwert enthält.

  • Wenn die zugrunde liegenden Daten normalverteilt sind, ist auch die Stichprobenverteilung normalverteilt. Dann können wir sagen, dass wir zu 68 % sicher sind, dass der Mittelwert der Grundgesamtheit innerhalb eines Standardfehlers liegt, oder zu 1 % innerhalb von 95 Standardfehlern usw. liegen.
  • Wenn die zugrunde liegenden Daten NICHT normalverteilt sind, die Stichprobengröße jedoch groß genug ist, können wir uns darauf verlassen Zentraler Grenzwertsatz (CLT) Wenn wir also sagen, dass die Stichprobenverteilung annähernd normalverteilt ist, können wir ähnliche Aussagen über Konfidenzintervalle treffen.

Wie berechnet man den Standardfehler (SE)?

Normalerweise verwenden wir die folgende Formel, um den Standardfehler zu berechnen. Ich werde in den nächsten Abschnitten besprechen, wie man diese Formel herleitet.

Bild vom Autor

Was sind die Beispiele für Standardfehler?

Der Standardfehler kann auf verschiedene Arten von angewendet werden Statistik. Einige beliebte Beispiele sind

  • Der Standardfehler des Stichprobenmittelwerts (auch bekannt als Standardfehler des Mittelwerts, SEM)
  • Der Standardfehler des Stichprobenanteils (auch bekannt als Standardfehler des Anteils, SEP)

Was ist der Standardfehler des Mittelwerts (SEM)?

Der Standardfehler des Mittelwerts (oder einfach Standardfehler) gibt an, wie unterschiedlich die Werte sind Stichprobenmittelwert dürfte aus der stammen mittlere Einwohnerzahl.

Technisch gesehen wird der Standardfehler des Mittelwerts als Standardabweichung des Stichprobenmittelwerts berechnet.

Bild vom Autor

Hypothetisch können wir den Standardfehler bei wiederholten Stichproben mithilfe der folgenden Schritte berechnen:

  1. Ziehen Sie eine neue Stichprobe aus der Grundgesamtheit.
  2. Berechnen Sie den Stichprobenmittelwert der gezogenen Stichprobe in Schritt 1
  3. Wiederholen Sie die Schritte 1 und 2 mehrmals.
  4. Der Standardfehler wird durch Berechnen der Standardabweichung der Stichprobenmittelwerte der vorherigen Schritte ermittelt.

Mit unserer Zentraler Grenzwertsatz (CLT), müssen wir die Stichprobenverteilung bei wiederholten Stichproben nicht berücksichtigen. Stattdessen kann die Stichprobenverteilung der Stichprobenmittelwerte anhand nur EINER Zufallsstichprobe geschätzt werden.

Der Zentrale Grenzwertsatz besagt, dass der Stichprobenmittelwert annähernd normalverteilt mit a ist Mittelwert von μ und einem Standardabweichung (oder Standardfehler) von σ/√n.

Wie leitet man die Formel für SEM ab?

Bild vom Autor

Daher sind

Bild vom Autor

In den meisten Fällen ist die Standardabweichung der Bevölkerungsdaten unbekannt. Wir schätzen es anhand der Standardabweichung der Stichprobendaten (Stichprobenstandardabweichung).

Daher sind

Bild vom Autor

Was ist der Standardfehler der Proportion (SEP)?

Der Standardfehler des Anteils gibt an, wie unterschiedlich die Probenanteil dürfte aus der stammen Bevölkerungsanteil.

Der Standardfehler des Anteils wird als Standardabweichung der Stichprobenanteile berechnet.

Bild vom Autor

Sie werden feststellen, dass wir in allen Beispieldaten nur die Daten 1 oder 0 haben. Auf jeden Wert folgt a Bernouilli-Verteilung. Die berechneten Stichprobenanteile sind keine binären Werte mehr. Stattdessen können sie einen beliebigen Wert zwischen 0 und 1 haben.

Der Zentrale Grenzwertsatz besagt, dass der Stichprobenanteil annähernd normalverteilt mit a ist Mittelwert von p und einem Standardabweichung (oder Standardfehler) von √P(1-P)/√n, wobei P der Bevölkerungsanteil ist.

Wie leitet man die Formel für SEP ab?

Bild vom Autor

Ähnlich wie SEM,

Bild vom Autor
Bild vom Autor

Wir können abschätzen σ unter Verwendung der Stichprobenstandardabweichung √p(1-p) (d. h. die Standardabweichung einer Bernouilli-Verteilung)

Bild vom Autor

Fazit:

Standardabweichung und Standardfehler sind ähnliche Konzepte, die beide zur Messung verwendet werden Variabilität.

Standardabweichung gibt an, wie die Beispieldatenwerte unterscheiden sich vom Mittelwert in der Probenverteilung.

Standart Fehler gibt an, wie die Beispieldatenstatistik unterscheiden sich von der Bevölkerungsstatistik in der Stichprobenverteilung.

Vielen Dank fürs Lesen!!!

Wenn Ihnen dieser Artikel gefällt und Sie möchten Kauf mir einen Kaffee, Bitte Klicke hier.

Sie können sich für eine anmelden Mitgliedschaft um vollen Zugriff auf meine Artikel freizuschalten und uneingeschränkten Zugriff auf alles auf Medium zu haben. Bitte Abonnieren wenn Sie eine E-Mail-Benachrichtigung erhalten möchten, wenn ich einen neuen Artikel veröffentliche.

Standardabweichung vs. Standardfehler: Was ist der Unterschied? Neuveröffentlicht von der Quelle https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 über https://towardsdatascience.com/feed

<!–

->

Zeitstempel:

Mehr von Blockchain-Berater