-
08-13 t-분포의 활용 : t-검정데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 10. 11:24
이제 t-분포를 활용해서 어떻게 가설을 검정할 수 있는지 볼까?
연구 문제
만약 약물을 투여하지 않은 모집단의 평균이 7(M=7)이고 모집단의 표준 편차는 알 수 없다고 했을 때, 모집단으로 부터 추출한 20명의 무선 표본의 평균(m)이 어느정도야 약물이 효과가 있다고 할 수 있을까?
가정과 조건
단, 표본은 무선적이고 독립적으로 추출되었으며, 약물을 투여하지 않은 모집단은 평균이 7인 정규 분포를 따른다고 가정할게.
통계적 가설
먼저 귀무 가설과 대립 가설부터 정해보면,
H0 : 표본 평균 m은 모집단의 평균 M=7으로부터 구해졌다. (= 약물이 효과가 없다.)
H1 : 표본 평균 m은 모집단의 평균 M=7으로부터 구해진것이 아니다. (=약물이 효과가 있다.)
가 될거야.
유의 수준
그리고 p95의 유의도 수준을 따른다고 할게.
임계값
대립 가설 H1이 양방적이고, 1종 오류의 확률 α가 5%가 되겠지? 그리고 표본의 표준 편차 s로 모집단의 표준 편차 S를 추정하기 때문에 5%를 반으로 쪼개서, t분포의 2.5%가 한쪽 임계값의 왼쪽에 들어가고, t분포의 나머지 2.5%는 한쪽 임계값의 오른쪽에 들어가면 될거야. 그 값은 T분포표에서 자유도가 20-1=19일 때 -2.093과 2.093인 것을 알 수 있지!
결정 규칙
즉, 구해진 t값이 -2.093 이하이거나, 2.093 이상이라면 귀무 가설을 기각할 것이고, -2.093 보다 크면서 2.093 보다 작다면 귀무 가설을 기각하지 않을거야.
만약 t≤-2.093 또는 2.093≤t 라면 H0을 기각한다.
만약 -2.093<t<2.093 라면 H0을 기각하지 않는다.
계산
t값은 표본의 평균에서 모집단의 평균을 뺀 다음 추정된 모집단의 표준 편차로 나눠주면 돼었지? 모집단의 표준 편차는 표본집단의 표준 편차로 추정할 수 있어. 표본집단의 표준 편차에서 표본의 크기의 제곱근을 나눠서 말야. 즉,
t = (표본집단의 평균 - 모집단의 평균) / (표본집단의 표준편차 / √표본의 크기) = (m-M) / (s/√n)
만약 표본 집단의 평균(m)이 8.4이고 표본집단의 표준 편차(s)가 2.3이라면,
t = (8.4-7) / (2.3/√20) ≒ 2.72
가 되는거지.
결정과 해석
그런데 2.72라는 t값은 임계값 2.093보다 크기 때문에 귀무 가설을 기각할 수 있어. 표본의 크기가 20인 표본들의 평균이라고 하기에는 8.4라는 수치가 7에서 너무 많이 벗어나 있다는거지. 즉, 약물이 효과가 있다고 할 수 있는거야.
-
이렇게 스튜던트의 t 분포를 활용한 가설 검정을 t-검정(t-test)라고 해!
이제 t-분포를 활용해서 가설 검정을 할 수 있게 되었지? 다음 시간에는 파이썬으로 계산해 보자구!
'데이터 분석 > 파이썬으로 배우는 데이터 분석을 위한 통계학' 카테고리의 다른 글
08-15 t-검정 1 : 기본 (파이썬) (0) 2022.05.11 08-14 t-분포의 활용 : SE로 Sm을 추정 (파이썬) (0) 2022.05.11 08-12 t-분포의 활용 : t-분포표 (0) 2022.05.09 08-11 자유도 : df (0) 2022.05.04 08-10 스튜던드의 t-분포 (feat. 윌리엄 실리 고셋) (0) 2022.05.02