08-13 t-분포의 활용 : t-검정

데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 10. 11:24

이제 t-분포를 활용해서 어떻게 가설을 검정할 수 있는지 볼까?

연구 문제

만약 약물을 투여하지 않은 모집단의 평균이 7(M=7)이고 모집단의 표준 편차는 알 수 없다고 했을 때, 모집단으로 부터 추출한 20명의 무선 표본의 평균(m)이 어느정도야 약물이 효과가 있다고 할 수 있을까?

가정과 조건

단, 표본은 무선적이고 독립적으로 추출되었으며, 약물을 투여하지 않은 모집단은 평균이 7인 정규 분포를 따른다고 가정할게.

통계적 가설

먼저 귀무 가설과 대립 가설부터 정해보면,

H0 : 표본 평균 m은 모집단의 평균 M=7으로부터 구해졌다. (= 약물이 효과가 없다.)

H1 : 표본 평균 m은 모집단의 평균 M=7으로부터 구해진것이 아니다. (=약물이 효과가 있다.)

가 될거야.

유의 수준

그리고 p95의 유의도 수준을 따른다고 할게.

임계값

대립 가설 H1이 양방적이고, 1종 오류의 확률 α가 5%가 되겠지? 그리고 표본의 표준 편차 s로 모집단의 표준 편차 S를 추정하기 때문에 5%를 반으로 쪼개서, t분포의 2.5%가 한쪽 임계값의 왼쪽에 들어가고, t분포의 나머지 2.5%는 한쪽 임계값의 오른쪽에 들어가면 될거야. 그 값은 T분포표에서 자유도가 20-1=19일 때 -2.093과 2.093인 것을 알 수 있지!

결정 규칙

즉, 구해진 t값이 -2.093 이하이거나, 2.093 이상이라면 귀무 가설을 기각할 것이고, -2.093 보다 크면서 2.093 보다 작다면 귀무 가설을 기각하지 않을거야.

만약 t≤-2.093 또는 2.093≤t 라면 H0을 기각한다.

만약 -2.093<t<2.093 라면 H0을 기각하지 않는다.

계산

t값은 표본의 평균에서 모집단의 평균을 뺀 다음 추정된 모집단의 표준 편차로 나눠주면 돼었지? 모집단의 표준 편차는 표본집단의 표준 편차로 추정할 수 있어. 표본집단의 표준 편차에서 표본의 크기의 제곱근을 나눠서 말야. 즉,

t = (표본집단의 평균 - 모집단의 평균) / (표본집단의 표준편차 / √표본의 크기) = (m-M) / (s/√n)

만약 표본 집단의 평균(m)이 8.4이고 표본집단의 표준 편차(s)가 2.3이라면,

t = (8.4-7) / (2.3/√20) ≒ 2.72

가 되는거지.

결정과 해석

그런데 2.72라는 t값은 임계값 2.093보다 크기 때문에 귀무 가설을 기각할 수 있어. 표본의 크기가 20인 표본들의 평균이라고 하기에는 8.4라는 수치가 7에서 너무 많이 벗어나 있다는거지. 즉, 약물이 효과가 있다고 할 수 있는거야.

이렇게 스튜던트의 t 분포를 활용한 가설 검정을 t-검정(t-test)라고 해!

이제 t-분포를 활용해서 가설 검정을 할 수 있게 되었지? 다음 시간에는 파이썬으로 계산해 보자구!

'데이터 분석 > 파이썬으로 배우는 데이터 분석을 위한 통계학' 카테고리의 다른 글

08-15 t-검정 1 : 기본 (파이썬) (0)	2022.05.11
08-14 t-분포의 활용 : SE로 Sm을 추정 (파이썬) (0)	2022.05.11
08-12 t-분포의 활용 : t-분포표 (0)	2022.05.09
08-11 자유도 : df (0)	2022.05.04
08-10 스튜던드의 t-분포 (feat. 윌리엄 실리 고셋) (0)	2022.05.02

ABOUT ME

학선생 블로그 학선생 블로그

'데이터 분석 > 파이썬으로 배우는 데이터 분석을 위한 통계학' 카테고리의 다른 글

티스토리툴바

ABOUT ME

'데이터 분석 > 파이썬으로 배우는 데이터 분석을 위한 통계학' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바