Gêmeos de universos diferentes
SDesvio padrão e erro padrão são dois conceitos estatísticos que muitas vezes causam confusão. Eles têm as mesmas interpretações ou pretendem representar algo totalmente diferente? Discutiremos mais neste post.
O que é desvio padrão (SD)?
A desvio padrão mede o variabilidade (também conhecido como, o propagação) de pontos de dados ao redor do significar em um determinado conjunto de dados. Em outras palavras, nos diz, em média, a que distância cada ponto de dados está da média.
Desvio Padrão da População
No mundo real, estamos interessados em estimar uma determinada característica em um população. O desvio padrão é um exemplo dessas características.
Quando você tem TODAS os pontos de dados de uma população, você pode calcular o VERDADEIRO valor do desvio padrão da população usando a seguinte fórmula.
Desvio Padrão de Amostra
Muitas vezes, é difícil recolher todos os dados da população devido a limitações de tempo, financeiras ou técnicas. Por exemplo, se quisermos calcular o VERDADEIRO desvio padrão da renda familiar em Los Angeles, precisaríamos obter a renda de todas as famílias de Los Angeles, o que é quase impossível de fazer.
Em vez disso, podemos coletar amostras aleatórias da população e fazer inferências sobre o desvio padrão da população usando Desvio padrão da amostra. A fórmula para o desvio padrão da amostra é
Por que usar N-1 para desvio padrão amostral?
Você notará que estamos usando a média amostral (x̄) em vez da média populacional (μ) para o desvio padrão amostral porque não sabemos nada sobre a média populacional. x̄ é uma estimativa razoável para μ.
Portanto, qualquer valor X no conjunto de dados de amostra estaria mais próximo de x̄ do que de μ. O numerador no desvio padrão da amostra ficaria artificialmente menor do que deveria ser. Como resultado, o desvio padrão da amostra seria subestimado.
Para corrigir isso viés no desvio padrão da amostra, usaríamos “N-1” em vez de “N” (também conhecido como Correção de Bessel) para desvio padrão amostral.
Usar N-1 tornaria o desvio padrão da amostra maior do que usar N. Portanto, temos uma estimativa menos tendenciosa do desvio padrão da população, dando-nos uma estimativa conservadora da variabilidade.
O que é erro padrão (SE)?
Antes de discutirmos o erro padrão, vamos primeiro nos familiarizar com os conceitos de Distribuição de amostras e Distribuição de amostras.
Distribuição de Amostra vs Distribuição de Amostragem
A distribuição de amostra é simplesmente a distribuição de dados da amostra retirada aleatoriamente da população.
Por exemplo, perguntamos a 100 pessoas aleatórias em Los Angeles quais são os seus rendimentos. A distribuição da amostra descreve o REAL distribuição de renda nessas 100 pessoas.
Mas o que é distribuição amostral?
A distribuição de amostras é o distribuição da estatística da amostra (por exemplo, a média amostral, a variância amostral, o desvio padrão amostral e a proporção amostral) sobre muitas amostras extraídas da mesma população (ou seja, amostragem repetida).
Por exemplo, perguntamos a 100 pessoas aleatórias em Los Angeles quais são os seus rendimentos. Em seguida, calcule a renda média. Repetimos isso 1000 vezes, então temos 1000 rendimentos médios diferentes. A distribuição desses 1000 rendimentos médios é chamada de distribuição amostral.
Portanto, distribuição de amostra é a distribuição do dados de amostra enquanto distribuição de amostras é a distribuição do estatística da amostra.
O conceito é erro padrão é relevante para a distribuição amostral, NÃO para a distribuição amostral.
A Erro padrão é uma métrica que descreve o variabilidade de uma estatística no distribuição de amostras.
Como interpretar o erro padrão (SE)?
O erro padrão mede até que ponto o estatística de amostra (por exemplo, média amostral) provavelmente será do estatística populacional verdadeira (por exemplo, a média da população).
Por que precisamos do erro padrão (SE)?
- Se os dados subjacentes forem normalmente distribuídos, então a distribuição amostral também será normalmente distribuída. Então podemos dizer que estamos 68% confiantes de que a média da população está dentro de 1 erro padrão ou 95% estará dentro de 2 erros padrão, etc.
- Se os dados subjacentes NÃO forem distribuídos normalmente, mas o tamanho da amostra for grande o suficiente, podemos confiar em Teorema do Limite Central (CLT) para dizer que a distribuição amostral tem distribuição aproximadamente normal, então podemos fazer afirmações semelhantes sobre intervalos de confiança.
Como calcular o erro padrão (SE)?
Normalmente usamos a seguinte fórmula para calcular o erro padrão. Discutirei como derivar essa fórmula nas próximas seções.
Quais são os exemplos de erro padrão?
O erro padrão pode ser aplicado a vários tipos de estatísticas. Alguns exemplos populares são
- O erro padrão da média amostral (também conhecido como erro padrão da média, SEM)
- O erro padrão da proporção da amostra (também conhecido como erro padrão da proporção, SEP)
Qual é o erro padrão da média (SEM)?
O erro padrão da média (ou simplesmente erro padrão), indica quão diferente é o média da amostra é provável que seja do média da população.
Tecnicamente, o erro padrão da média é calculado como o desvio padrão da média amostral.
Hipoteticamente, podemos calcular o erro padrão em amostras repetidas usando as seguintes etapas:
- Extraia uma nova amostra da população.
- Calcule a média amostral da amostra sorteada na Etapa 1
- Repita as etapas 1 e 2 várias vezes.
- O erro padrão é obtido calculando o desvio padrão das médias amostrais das etapas anteriores.
Graças a Teorema do Limite Central (CLT), não precisamos considerar a distribuição de amostragem em amostras repetidas. Em vez disso, a distribuição amostral das médias amostrais pode ser estimada a partir de apenas UMA amostra aleatória.
O Teorema do Limite Central afirma que a média amostral tem uma distribuição aproximadamente normal com um média de μ e de um desvio padrão (ou erro padrão) de σ/√n.
Como derivar a fórmula para SEM?
Portanto,
Na maioria dos casos, o desvio padrão dos dados populacionais é desconhecido. Iremos estimá-lo usando o desvio padrão dos dados amostrais (desvio padrão amostral).
Portanto,
Qual é o erro padrão da proporção (SEP)?
O erro padrão da proporção indica quão diferente é o proporção da amostra é provável que seja do proporção da população.
O erro padrão da proporção é calculado como o desvio padrão das proporções da amostra.
Você notará que em cada dado de amostra, temos apenas dados 1 ou 0. Cada valor segue um Distribuição Bernouilli. As proporções amostrais calculadas não são mais valores binários. Em vez disso, eles poderiam ter qualquer valor entre 0 e 1.
O Teorema do Limite Central afirma que a proporção da amostra tem uma distribuição aproximadamente normal com um média de p e de um desvio padrão (ou erro padrão) de √P(1-P)/√n, onde P é a proporção da população.
Como derivar a fórmula do SEP?
Semelhante ao SEM,
Podemos estimar σ usando o desvio padrão da amostra √p(1-p) (ou seja, o desvio padrão de uma distribuição de Bernouilli)
Conclusão:
Desvio padrão e erro padrão são conceitos semelhantes e ambos são usados para medir variabilidade.
Desvio Padrão indica como o valores de dados de amostra são diferentes da média no distribuição de amostra.
Erro padrão indica como o estatísticas de dados de amostra são diferentes da estatística da população no distribuição de amostras.
Obrigado por ler !!!
Se você gostou deste artigo e gostaria de Compre-me um café, por favor clique aqui.
Você pode se inscrever para um Filiação para desbloquear acesso total aos meus artigos e ter acesso ilimitado a tudo no Medium. Por favor Inscreva-se se desejar receber uma notificação por e-mail sempre que eu postar um novo artigo.
Desvio padrão vs erro padrão: qual é a diferença? Republicado da fonte https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed
<!–
->
- Bitcoin
- bizbuilder Mike
- blockchain
- conformidade do blockchain
- conferência blockchain
- Consultores Blockchain
- coinbase
- Coingenius
- Consenso
- conferência de criptografia
- crypto mining
- criptomoedas
- Descentralizada
- DeFi
- Ativos Digitais
- ethereum
- aprendizado de máquina
- token não fungível
- platão
- platão ai
- Inteligência de Dados Platão
- Platoblockchain
- PlatãoData
- jogo de platô
- Polygon
- prova de participação
- W3
- zefirnet