Desvio padrão versus erro padrão: qual é a diferença?

Republicado por Platão

seguidores: 0

Gêmeos de universos diferentes

SDesvio padrão e erro padrão são dois conceitos estatísticos que muitas vezes causam confusão. Eles têm as mesmas interpretações ou pretendem representar algo totalmente diferente? Discutiremos mais neste post.

O que é desvio padrão (SD)?

A desvio padrão mede o variabilidade (também conhecido como, o propagação) de pontos de dados ao redor do significar em um determinado conjunto de dados. Em outras palavras, nos diz, em média, a que distância cada ponto de dados está da média.

Desvio Padrão da População

No mundo real, estamos interessados em estimar uma determinada característica em um população. O desvio padrão é um exemplo dessas características.

Quando você tem TODAS os pontos de dados de uma população, você pode calcular o VERDADEIRO valor do desvio padrão da população usando a seguinte fórmula.

Desvio Padrão de Amostra

Muitas vezes, é difícil recolher todos os dados da população devido a limitações de tempo, financeiras ou técnicas. Por exemplo, se quisermos calcular o VERDADEIRO desvio padrão da renda familiar em Los Angeles, precisaríamos obter a renda de todas as famílias de Los Angeles, o que é quase impossível de fazer.

Em vez disso, podemos coletar amostras aleatórias da população e fazer inferências sobre o desvio padrão da população usando Desvio padrão da amostra. A fórmula para o desvio padrão da amostra é

Por que usar N-1 para desvio padrão amostral?

Você notará que estamos usando a média amostral (x̄) em vez da média populacional (μ) para o desvio padrão amostral porque não sabemos nada sobre a média populacional. x̄ é uma estimativa razoável para μ.

Portanto, qualquer valor X no conjunto de dados de amostra estaria mais próximo de x̄ do que de μ. O numerador no desvio padrão da amostra ficaria artificialmente menor do que deveria ser. Como resultado, o desvio padrão da amostra seria subestimado.

Para corrigir isso viés no desvio padrão da amostra, usaríamos “N-1” em vez de “N” (também conhecido como Correção de Bessel) para desvio padrão amostral.

Usar N-1 tornaria o desvio padrão da amostra maior do que usar N. Portanto, temos uma estimativa menos tendenciosa do desvio padrão da população, dando-nos uma estimativa conservadora da variabilidade.

O que é erro padrão (SE)?

Antes de discutirmos o erro padrão, vamos primeiro nos familiarizar com os conceitos de Distribuição de amostras e Distribuição de amostras.

Distribuição de Amostra vs Distribuição de Amostragem

A distribuição de amostra é simplesmente a distribuição de dados da amostra retirada aleatoriamente da população.

Por exemplo, perguntamos a 100 pessoas aleatórias em Los Angeles quais são os seus rendimentos. A distribuição da amostra descreve o REAL distribuição de renda nessas 100 pessoas.

Mas o que é distribuição amostral?

A distribuição de amostras é o distribuição da estatística da amostra (por exemplo, a média amostral, a variância amostral, o desvio padrão amostral e a proporção amostral) sobre muitas amostras extraídas da mesma população (ou seja, amostragem repetida).

Por exemplo, perguntamos a 100 pessoas aleatórias em Los Angeles quais são os seus rendimentos. Em seguida, calcule a renda média. Repetimos isso 1000 vezes, então temos 1000 rendimentos médios diferentes. A distribuição desses 1000 rendimentos médios é chamada de distribuição amostral.

Portanto, distribuição de amostra é a distribuição do dados de amostra enquanto distribuição de amostras é a distribuição do estatística da amostra.

O conceito é erro padrão é relevante para a distribuição amostral, NÃO para a distribuição amostral.

A Erro padrão é uma métrica que descreve o variabilidade de uma estatística no distribuição de amostras.

Como interpretar o erro padrão (SE)?

O erro padrão mede até que ponto o estatística de amostra (por exemplo, média amostral) provavelmente será do estatística populacional verdadeira (por exemplo, a média da população).

Por que precisamos do erro padrão (SE)?

Normalmente você pode querer construir intervalos de confiança quando tentamos fazer inferências estatísticas, e é mais informativo atribuir uma probabilidade para construir um intervalo de confiança que contenha a média.

Se os dados subjacentes forem normalmente distribuídos, então a distribuição amostral também será normalmente distribuída. Então podemos dizer que estamos 68% confiantes de que a média da população está dentro de 1 erro padrão ou 95% estará dentro de 2 erros padrão, etc.
Se os dados subjacentes NÃO forem distribuídos normalmente, mas o tamanho da amostra for grande o suficiente, podemos confiar em Teorema do Limite Central (CLT) para dizer que a distribuição amostral tem distribuição aproximadamente normal, então podemos fazer afirmações semelhantes sobre intervalos de confiança.

Como calcular o erro padrão (SE)?

Normalmente usamos a seguinte fórmula para calcular o erro padrão. Discutirei como derivar essa fórmula nas próximas seções.

Quais são os exemplos de erro padrão?

O erro padrão pode ser aplicado a vários tipos de estatísticas. Alguns exemplos populares são

O erro padrão da média amostral (também conhecido como erro padrão da média, SEM)
O erro padrão da proporção da amostra (também conhecido como erro padrão da proporção, SEP)

Qual é o erro padrão da média (SEM)?

O erro padrão da média (ou simplesmente erro padrão), indica quão diferente é o média da amostra é provável que seja do média da população.

Tecnicamente, o erro padrão da média é calculado como o desvio padrão da média amostral.

Hipoteticamente, podemos calcular o erro padrão em amostras repetidas usando as seguintes etapas:

Extraia uma nova amostra da população.
Calcule a média amostral da amostra sorteada na Etapa 1
Repita as etapas 1 e 2 várias vezes.
O erro padrão é obtido calculando o desvio padrão das médias amostrais das etapas anteriores.

Graças a Teorema do Limite Central (CLT), não precisamos considerar a distribuição de amostragem em amostras repetidas. Em vez disso, a distribuição amostral das médias amostrais pode ser estimada a partir de apenas UMA amostra aleatória.

O Teorema do Limite Central afirma que a média amostral tem uma distribuição aproximadamente normal com um média de μ e de um desvio padrão (ou erro padrão) de σ/√n.

Como derivar a fórmula para SEM?

Portanto,

Imagem do autor

Na maioria dos casos, o desvio padrão dos dados populacionais é desconhecido. Iremos estimá-lo usando o desvio padrão dos dados amostrais (desvio padrão amostral).

Portanto,

Qual é o erro padrão da proporção (SEP)?

O erro padrão da proporção indica quão diferente é o proporção da amostra é provável que seja do proporção da população.

O erro padrão da proporção é calculado como o desvio padrão das proporções da amostra.

Você notará que em cada dado de amostra, temos apenas dados 1 ou 0. Cada valor segue um Distribuição Bernouilli. As proporções amostrais calculadas não são mais valores binários. Em vez disso, eles poderiam ter qualquer valor entre 0 e 1.

O Teorema do Limite Central afirma que a proporção da amostra tem uma distribuição aproximadamente normal com um média de p e de um desvio padrão (ou erro padrão) de √P(1-P)/√n, onde P é a proporção da população.

Como derivar a fórmula do SEP?

Semelhante ao SEM,

Imagem do autor

Podemos estimar σ usando o desvio padrão da amostra √p(1-p) (ou seja, o desvio padrão de uma distribuição de Bernouilli)

Conclusão:

Desvio padrão e erro padrão são conceitos semelhantes e ambos são usados para medir variabilidade.

Desvio Padrão indica como o valores de dados de amostra são diferentes da média no distribuição de amostra.

Erro padrão indica como o estatísticas de dados de amostra são diferentes da estatística da população no distribuição de amostras.

Obrigado por ler !!!

Se você gostou deste artigo e gostaria de Compre-me um café, por favor clique aqui.

Você pode se inscrever para um Filiação para desbloquear acesso total aos meus artigos e ter acesso ilimitado a tudo no Medium. Por favor Inscreva-se se desejar receber uma notificação por e-mail sempre que eu postar um novo artigo.

Desvio padrão vs erro padrão: qual é a diferença? Republicado da fonte https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

Carimbo de hora: 2 de novembro de 2022 3 de novembro de 2022