표준 편차 대 표준 오차: 차이점은 무엇입니까?

서로 다른 우주에서 온 쌍둥이

님이 촬영 한 사진 마틴 산체스 on Unsplash

S표준 편차와 표준 오류는 종종 혼동을 일으키는 두 가지 통계 개념입니다. 그것들은 동일한 해석을 가지고 있습니까, 아니면 완전히 다른 것을 나타내기 위한 것입니까? 이 게시물에서 더 자세히 논의하겠습니다.

표준편차(SD)란 무엇입니까?

XNUMXD덴탈의 표준 편차 측정 변동성 (일명, 전파) 주변의 데이터 포인트 평균 주어진 데이터 세트에서. 즉, 평균적으로 각 데이터 포인트가 평균에서 얼마나 떨어져 있는지 알려줍니다.

모집단 표준편차

현실 세계에서 우리는 특정 특성을 추정하는 데 관심이 있습니다. 인구. 표준편차는 이러한 특성의 예.

너가 가질 때 모든 모집단의 데이터 포인트를 사용하여 다음을 계산할 수 있습니다. TRUE 다음 공식을 사용하여 모집단 표준 편차의 값을 구합니다.

작성자의 이미지

표본 표준편차

시간, 재정적, 기술적 한계로 인해 모집단으로부터 모든 데이터 포인트를 수집하는 것이 어려운 경우가 많습니다. 예를 들어, 다음을 계산하고 싶다면 TRUE 로스앤젤레스 가계 소득의 표준편차를 구하려면 로스앤젤레스에 있는 모든 가구로부터 소득을 얻어야 하는데 이는 거의 불가능합니다.

대신, 모집단에서 무작위 표본을 수집하고 다음을 사용하여 모집단 표준 편차에 대해 추론할 수 있습니다. 샘플 표준 편차. 표본 표준편차 공식은 다음과 같습니다.

작성자의 이미지

표본 표준편차에 N-1을 사용하는 이유는 무엇입니까?

모집단 평균에 대해 아무것도 모르기 때문에 표본 표준 편차에 모집단 평균(μ) 대신 표본 평균(x̄)을 사용하고 있음을 알 수 있습니다. x̄는 μ에 대한 합리적인 추정치입니다.

따라서 샘플 데이터 세트의 모든 값 X는 μ보다 x̄에 더 가깝습니다. 표본 표준 편차의 분자는 예상보다 인위적으로 작아집니다. 결과적으로 표본 표준편차는 다음과 같습니다. 과소 평가 된.

이를 수정하려면 바이어스 표본 표준 편차에서 우리는 다음을 사용합니다. "N" 대신 "N-1"(일명, 베셀의 수정) 표본 표준편차의 경우.

N-1을 사용하면 N을 사용하는 것보다 표본 표준 편차가 더 커집니다. 따라서 모집단 표준 편차에 대한 편향이 덜한 추정치를 갖게 되어 보수적인 변동성 추정치를 얻을 수 있습니다.

표준 오류(SE)란 무엇입니까?

표준오차에 대해 논의하기 전에 먼저 샘플 배포샘플링 분포.

샘플 배포와 샘플링 배포

XNUMXD덴탈의 샘플 배포 단순히 데이터 배포 모집단에서 무작위로 추출한 표본입니다.

예를 들어, 로스앤젤레스에 거주하는 무작위 100명에게 소득이 얼마인지 물어봅니다. 표본 분포는 다음을 설명합니다. 실제 이 100명의 소득 분배.

그런데 샘플링 분포란 무엇일까요?

XNUMXD덴탈의 샘플링 분포 이다 표본 통계의 분포 동일한 모집단에서 추출한 여러 표본에 대한 표본 평균, 표본 분산, 표본 표준 편차 및 표본 비율(예: 반복 샘플링).

예를 들어, 로스앤젤레스에 거주하는 무작위 100명에게 소득이 얼마인지 물어봅니다. 그런 다음 평균 소득을 계산합니다. 이것을 1000번 반복하면 1000가지의 평균 소득이 나옵니다. 이 1000개의 평균 소득 분포를 표본 분포라고 합니다.

따라서, 샘플 배포 의 분포이다 샘플 데이터 동안 샘플링 분포 의 분포이다 샘플 통계.

컨셉은 표준 에러 표본 분포가 아니라 표본 분포와 관련이 있습니다.

XNUMXD덴탈의 표준 에러 설명하는 측정항목입니다. 통계의 변동성 FBI 증오 범죄 보고서 샘플링 분포.

표준 오류(SE)를 해석하는 방법은 무엇입니까?

표준오차는 얼마나 멀리 측정하는가 샘플 통계 (예: 표본 평균)은 다음에서 나올 가능성이 높습니다. 실제 인구 통계 (예: 모집단 평균).

표준 오류(SE)가 필요한 이유는 무엇입니까?

일반적으로 다음을 구성하고 싶을 수도 있습니다. 신뢰 구간 통계적 추론을 시도할 때 평균을 포함하는 신뢰 구간을 구성하기 위해 확률을 할당하는 것이 더 유익합니다.

  • 기본 데이터가 정규 분포를 따르는 경우 샘플링 분포도 정규 분포를 따릅니다. 그러면 모집단 평균이 68 표준 오류 내에 있거나 1%가 95 표준 오류 내에 있을 것이라고 2% 확신한다고 말할 수 있습니다.
  • 기본 데이터가 정규 분포를 따르지 않지만 표본 크기가 충분히 큰 경우 다음을 신뢰할 수 있습니다. 중심극한정리(CLT) 샘플링 분포가 대략적으로 정규 분포를 따른다고 말하면 신뢰 구간에 대해서도 비슷한 설명을 할 수 있습니다.

표준 오류(SE)를 계산하는 방법은 무엇입니까?

우리는 일반적으로 표준오차를 계산하기 위해 다음 공식을 사용합니다. 다음 섹션에서 이 공식을 도출하는 방법에 대해 설명하겠습니다.

작성자의 이미지

표준 오류의 예는 무엇입니까?

표준오차는 다양한 유형의 오류에 적용될 수 있습니다. 통계. 몇 가지 인기 있는 예는 다음과 같습니다.

  • 표본 평균의 표준 오차(일명 평균의 표준 오차, SEM)
  • 표본 비율의 표준 오차(일명 비율의 표준 오차, SEP)

평균의 표준 오차(SEM)란 무엇입니까?

평균의 표준 오차(또는 간단히 표준 오차)는 평균의 차이가 얼마나 다른지 나타냅니다. 표본 평균 출신일 가능성이 높습니다. 평균 인구.

기술적으로 평균의 표준 오차는 표본 평균의 표준 편차로 계산됩니다.

작성자의 이미지

가정적으로 다음 단계를 사용하여 반복된 샘플에서 표준 오차를 계산할 수 있습니다.

  1. 모집단에서 새로운 표본을 추출합니다.
  2. 1단계에서 추출한 표본의 표본평균을 계산합니다.
  3. 1단계와 2단계를 여러 번 반복합니다.
  4. 표준오차는 이전 단계의 표본평균의 표준편차를 계산하여 구합니다.

덕분에 중심극한정리(CLT), 반복되는 샘플에서 샘플링 분포를 고려할 필요가 없습니다. 대신, 표본 평균의 표본 분포는 단 하나의 무작위 표본에서만 추정할 수 있습니다.

중심 극한 정리(Central Limit Theorem)는 표본 평균이 다음과 같은 대략적인 정규 분포를 갖는다고 말합니다. μ의 평균 σ/√n의 표준편차(또는 표준오차).

SEM의 공식을 도출하는 방법은 무엇입니까?

작성자의 이미지

따라서,

작성자의 이미지

대부분의 경우 모집단 데이터의 표준편차는 알려져 있지 않습니다. 표본 데이터의 표준편차(표본 표준편차)를 이용하여 추정해보겠습니다.

따라서,

작성자의 이미지

비율의 표준오차(SEP)란 무엇입니까?

비율의 표준오차는 비율이 얼마나 다른지를 나타냅니다. 표본 비율 출신일 가능성이 높습니다. 인구 비율.

비율의 표준 오차는 표본 비율의 표준 편차로 계산됩니다.

작성자의 이미지

각 샘플 데이터에는 1 또는 0의 데이터만 있다는 것을 알 수 있습니다. 각 값은 다음을 따릅니다. 베르누이 분포. 계산된 표본 비율은 더 이상 이진 값이 아닙니다. 대신 0과 1 사이의 값이 될 수 있습니다.

중심 극한 정리(Central Limit Theorem)는 표본 비율이 다음과 같은 대략적인 정규 분포를 갖는다고 말합니다. p의 평균 √P(1-P)/√n의 표준편차(또는 표준오차), 여기서 P는 인구 비율입니다.

SEP의 공식을 도출하는 방법은 무엇입니까?

작성자의 이미지

SEM과 유사하며,

작성자의 이미지
작성자의 이미지

우리는 추정할 수 있습니다 σ 표본 표준편차를 사용하여 √p(1-p) (즉, 베르누이 분포의 표준편차)

작성자의 이미지

결론 :

표준편차와 표준오차는 둘 다 측정하는 데 사용되는 유사한 개념입니다. 가변성.

표준 편차 방법을 나타냅니다. 샘플 데이터 값 의 평균과 다릅니다. 샘플 배포.

표준 에러 방법을 나타냅니다. 샘플 데이터 통계 인구통계와는 다르다 샘플링 분포.

읽어 주셔서 감사합니다 !!!

이 글을 재미있게 읽고 싶으시다면 나에게 커피를 사주세요, 부디 여기를 클릭하세요.

가입 할 수 있습니다 회원 내 기사에 대한 전체 액세스 권한을 잠금 해제하고 Medium의 모든 항목에 무제한 액세스할 수 있습니다. 제발 가입 새 기사를 게시할 때마다 이메일 알림을 받고 싶으시다면.

표준편차와 표준오차: 차이점은 무엇인가요? 소스 https://towardsdatascience.com/standard-deviation-vs-standard-error-whats-the-difference-ae969f48adef?source=rss—-7f60cf5620c9—4에서 https://towardsdatascience.com/feed를 통해 다시 게시됨

<!–

–>

타임 스탬프 :

더보기 블록 체인 컨설턴트