Стандартное отклонение против стандартной ошибки: в чем разница?

Близнецы из разных вселенных

Фото Мартин Санчес on Unsplash

SТандардное отклонение и стандартная ошибка — это два статистических понятия, которые часто вызывают путаницу. Имеют ли они одинаковые интерпретации или они предназначены для обозначения чего-то совершенно разного? Подробнее мы обсудим в этом посте.

Что такое стандартное отклонение (SD)?

Ассоциация стандартное отклонение измеряет изменчивость (он же распространение) точек данных вокруг значить в заданном наборе данных. Другими словами, он в среднем сообщает нам, насколько далеко каждая точка данных находится от среднего значения.

Стандартное отклонение населения

В реальном мире нас интересует оценка определенной характеристики объекта. население. Стандартное отклонение – это пример этих характеристик.

Когда у тебя есть BCE точки данных из совокупности, вы можете вычислить ИСТИНА значение стандартного отклонения генеральной совокупности, используя следующую формулу.

Изображение автора

Стандартное отклонение выборки

Зачастую сложно собрать все данные о населении из-за временных, финансовых или технических ограничений. Например, если мы хотим вычислить ИСТИНА стандартное отклонение доходов домохозяйств в Лос-Анджелесе, нам нужно будет получить доходы всех домохозяйств в Лос-Анджелесе, что практически невозможно сделать.

Вместо этого мы можем собрать случайные выборки из совокупности и сделать выводы о стандартном отклонении совокупности, используя Стандартное отклонение выборки. Формула выборочного стандартного отклонения:

Изображение автора

Зачем использовать N-1 для стандартного отклонения выборки?

Вы заметите, что мы используем выборочное среднее (x̄) вместо генерального среднего значения (μ) для выборочного стандартного отклонения, потому что мы ничего не знаем о генеральном среднем. x̄ является разумной оценкой для µ.

Следовательно, любое значение X в выборочном наборе данных будет ближе к x, чем к μ. Числитель стандартного отклонения выборки станет искусственно меньшим, чем должно быть. В результате выборочное стандартное отклонение будет равно недооценивается.

Чтобы исправить это смещение в выборочном стандартном отклонении мы бы использовали «Н-1» вместо «Н» (ака, Поправка Бесселя) для выборочного стандартного отклонения.

Использование N-1 сделает стандартное отклонение выборки больше, чем в противном случае при использовании N. Таким образом, мы имеем менее смещенную оценку стандартного отклонения генеральной совокупности, что дает нам консервативную оценку изменчивости.

Что такое стандартная ошибка (SE)?

Прежде чем мы обсудим стандартную ошибку, давайте сначала познакомимся с концепциями Пример распределения и Выборочное распределение.

Выборочное распределение против выборочного распределения

Ассоциация распределение выборки просто распределение данных выборки, которая случайным образом отбирается из населения.

Например, мы спрашиваем 100 случайных людей в Лос-Анджелесе, каковы их доходы. Распределение выборки описывает АКТУАЛЬНЫЕ распределение доходов у этих 100 человек.

Но что такое выборочное распределение?

Ассоциация выборочное распределение это распределение выборочной статистики (например, выборочное среднее, выборочная дисперсия, выборочное стандартное отклонение и выборочная доля) по многим выборкам, взятым из одной и той же генеральной совокупности (т. е. повторный отбор проб).

Например, мы спрашиваем 100 случайных людей в Лос-Анджелесе, каковы их доходы. Затем рассчитайте средний доход. Повторим это 1000 раз, тогда у нас будет 1000 разных средних доходов. Распределение этих 1000 средних доходов называется выборочным распределением.

Следовательно, распределение выборки это распределение образец данных в то время как выборочное распределение это распределение примерная статистика.

Концепция стандартная ошибка относится к распределению выборки, а НЕ к распределению выборки.

Ассоциация Стандартная ошибка это показатель, который описывает изменчивость статистики в выборочное распределение.

Как интерпретировать стандартную ошибку (SE)?

Стандартная ошибка показывает, насколько далеко статистика выборки (например, выборочное среднее), скорее всего, будет получено из реальная статистика населения (например, среднее значение численности населения).

Зачем нам нужна стандартная ошибка (SE)?

Обычно вы можете захотеть построить доверительные интервалы когда мы пытаемся сделать статистические выводы, более информативно назначить вероятность для построения доверительного интервала, содержащего среднее значение.

  • Если базовые данные нормально распределены, то и распределение выборки также нормально распределено. Тогда мы можем сказать, что мы на 68% уверены, что среднее значение генеральной совокупности находится в пределах 1 стандартной ошибки, или 95% будет в пределах 2 стандартных ошибок и т. д.
  • Если исходные данные НЕ распределены нормально, но размер выборки достаточно велик, мы можем положиться на Центральная предельная теорема (ЦПТ) Если сказать, что выборочное распределение имеет примерно нормальное распределение, то мы можем сделать аналогичные утверждения относительно доверительных интервалов.

Как вычислить стандартную ошибку (SE)?

Обычно мы используем следующую формулу для расчета стандартной ошибки. О том, как вывести эту формулу, я расскажу в следующих разделах.

Изображение автора

Каковы примеры стандартной ошибки?

Стандартная ошибка может применяться к различным типам статистики. Некоторые популярные примеры:

  • Стандартная ошибка выборочного среднего (также известная как стандартная ошибка среднего, SEM)
  • Стандартная ошибка выборочной пропорции (также известная как стандартная ошибка пропорции, SEP)

Что такое стандартная ошибка среднего (SEM)?

Стандартная ошибка среднего (или просто стандартная ошибка) показывает, насколько различаются выборочное среднее скорее всего, из Средняя численность населения.

Технически стандартная ошибка среднего вычисляется как стандартное отклонение выборочного среднего.

Изображение автора

Гипотетически мы можем вычислить стандартную ошибку при повторных выборках, выполнив следующие шаги:

  1. Создайте новую выборку из населения.
  2. Вычислите выборочное среднее взятой выборки на шаге 1.
  3. Повторите шаги 1 и 2 несколько раз.
  4. Стандартная ошибка получается путем вычисления стандартного отклонения выборочных средних предыдущих шагов.

Благодаря Центральная предельная теорема (ЦПТ), нам не нужно учитывать выборочное распределение при повторных выборках. Вместо этого выборочное распределение выборочных средних можно оценить всего лишь по ОДНОЙ случайной выборке.

Центральная предельная теорема утверждает, что выборочное среднее имеет приблизительно нормальное распределение с среднее значение μ и еще один стандартное отклонение (или стандартная ошибка) σ/√n.

Как вывести формулу SEM?

Изображение автора

Следовательно,

Изображение автора

В большинстве случаев стандартное отклонение данных о популяции неизвестно. Мы оценим его, используя стандартное отклонение выборочных данных (выборочное стандартное отклонение).

Следовательно,

Изображение автора

Что такое стандартная ошибка пропорции (SEP)?

Стандартная ошибка пропорции показывает, насколько различны пропорция выборки скорее всего, из доля населения.

Стандартная ошибка пропорции рассчитывается как стандартное отклонение пропорций выборки.

Изображение автора

Вы заметите, что в каждом образце данных у нас есть только данные 1 или 0. Каждое значение следует за Распределение Бернулли. Вычисленные доли выборки больше не являются двоичными значениями. Вместо этого они могут иметь любое значение от 0 до 1.

Центральная предельная теорема утверждает, что доля выборки имеет приблизительно нормальное распределение с среднее значение p и еще один стандартное отклонение (или стандартная ошибка) √P(1-P)/√n, где P — доля населения.

Как вывести формулу SEP?

Изображение автора

Подобно SEM,

Изображение автора
Изображение автора

Мы можем оценить σ используя выборочное стандартное отклонение √п(1-п) (т. е. стандартное отклонение распределения Бернулли)

Изображение автора

Вывод:

Стандартное отклонение и стандартная ошибка — это схожие понятия, которые оба используются для измерения изменчивость.

Стандартное отклонение указывает на то, как образцы значений данных отличаются от среднего в распределение выборки.

Стандартная ошибка указывает на то, как статистика выборочных данных отличаются от статистики населения в выборочное распределение.

Спасибо за чтение !!!

Если вам понравилась эта статья и вы хотите Купи мне кофе, пожалуйста нажмите здесь..

Вы можете подписаться на членство чтобы разблокировать полный доступ к моим статьям и иметь неограниченный доступ ко всему на Medium. Пожалуйста подписаться если вы хотите получать уведомление по электронной почте всякий раз, когда я публикую новую статью.

Стандартное отклонение и стандартная ошибка: в чем разница? Опубликовано из источника https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 через https://towardsdatascience.com/feed

<!–

->

Отметка времени:

Больше от Блокчейн-консультанты