ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 08-13 t-분포의 활용 : t-검정
    데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 10. 11:24

     이제 t-분포를 활용해서 어떻게 가설을 검정할 수 있는지 볼까?

     

    연구 문제

     만약 약물을 투여하지 않은 모집단의 평균이 7(M=7)이고 모집단의 표준 편차는 알 수 없다고 했을 때, 모집단으로 부터 추출한 20명의 무선 표본의 평균(m)이 어느정도야 약물이 효과가 있다고 할 수 있을까?

     

    가정과 조건

     단, 표본은 무선적이고 독립적으로 추출되었으며, 약물을 투여하지 않은 모집단은 평균이 7인 정규 분포를 따른다고 가정할게.

     

    통계적 가설

     먼저 귀무 가설과 대립 가설부터 정해보면,

     H0 : 표본 평균 m은 모집단의 평균 M=7으로부터 구해졌다. (= 약물이 효과가 없다.)

     H1 : 표본 평균 m은 모집단의 평균 M=7으로부터 구해진것이 아니다. (=약물이 효과가 있다.)

    가 될거야.

     

    유의 수준

     그리고 p95의 유의도 수준을 따른다고 할게.

     

    임계값

     대립 가설 H1이 양방적이고, 1종 오류의 확률 α가 5%가 되겠지? 그리고 표본의 표준 편차 s로 모집단의 표준 편차 S를 추정하기 때문에 5%를 반으로 쪼개서, t분포의 2.5%가 한쪽 임계값의 왼쪽에 들어가고, t분포의 나머지 2.5%는 한쪽 임계값의 오른쪽에 들어가면 될거야. 그 값은 T분포표에서 자유도가 20-1=19일 때 -2.093과 2.093인 것을 알 수 있지!

     

    결정 규칙

    즉, 구해진 t값이 -2.093 이하이거나, 2.093 이상이라면 귀무 가설을 기각할 것이고, -2.093 보다 크면서 2.093 보다 작다면 귀무 가설을 기각하지 않을거야.

     

    만약 t≤-2.093 또는 2.093≤t 라면 H0을 기각한다.

    만약 -2.093<t<2.093 라면 H0을 기각하지 않는다.

     

    계산

     t값은 표본의 평균에서 모집단의 평균을 뺀 다음 추정된 모집단의 표준 편차로 나눠주면 돼었지? 모집단의 표준 편차는 표본집단의 표준 편차로 추정할 수 있어. 표본집단의 표준 편차에서 표본의 크기의 제곱근을 나눠서 말야. 즉,

     

    t = (표본집단의 평균 - 모집단의 평균) / (표본집단의 표준편차 / √표본의 크기) = (m-M) / (s/√n)

     

     만약 표본 집단의 평균(m)이 8.4이고 표본집단의 표준 편차(s)가 2.3이라면,

     

    t = (8.4-7) / (2.3/√20) ≒ 2.72

     

     가 되는거지.

     

    결정과 해석

     그런데 2.72라는 t값은 임계값 2.093보다 크기 때문에 귀무 가설을 기각할 수 있어. 표본의 크기가 20인 표본들의 평균이라고 하기에는 8.4라는 수치가 7에서 너무 많이 벗어나 있다는거지. 즉, 약물이 효과가 있다고 할 수 있는거야.

     

    -

     

     이렇게 스튜던트의 t 분포를 활용한 가설 검정을 t-검정(t-test)라고 해!

     

     이제 t-분포를 활용해서 가설 검정을 할 수 있게 되었지? 다음 시간에는 파이썬으로 계산해 보자구!

Designed by Tistory.