ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 08-12 t-분포의 활용 : t-분포표
    데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 9. 12:58

    t-분포의 활용

     

     앞서 표본의 크기가 적을 때 스튜던트의 t-분포를 활용하면 좋다고 했잖아?

     생각해 볼게. 만약 파이소스티그민을 투여했을 때 기억력이 얼마나 향상되는지 알아보려고 한다면, 일단 모집단의 평균(M)과 표준 편차(S)를 알아야겠지. 그런데 모집단의 평균만 알고 표준 편차를 모른다면?

     

     20명의 피험자들을 대상으로 파이소스티그민의 효과를 알아보려고 한다고 가정해 볼게. 이 때 모집단의 평균(M)이 7이라는 것만 알고 표준 편차는 모르는거야. 그렇다면 일단 평균들의 표집 분포를 봐야겠지. 그리고 평균들의 표집 분포에서 평균들의 표준 편차(sm)로 모집단의 표준 편차(Sm)을 추정할 수 있었어. 그런데 sm은 표본의 표준 편차(s)에서 표본의 크기의 제곱근(√n)으로 나눠서 추정했었지?

     

    sm = s / √n

     

     그리고 sm으로 Sm을 추정하려면 t-분포를 활용해야 돼. t-분포에서 t값은 표본 평균에서 모집단 평균을 뺀 다음 추정된 sm으로 나눠주었지.

     

    t = (m-M) / (s/√n)

     

     그리고 t값에 대한 해석은 아래의 표를 통해 할 수 있어.

     

    https://ko.wikipedia.org/wiki/스튜던트_t_분포

     

    T분포표 - 위키백과, 우리 모두의 백과사전

    t-분포패밀리(student's t-distribution family)는 여러 t-분포들을 보여준다. T분포표(student's t-distribution table) 또는 T 테이블(T table)은 일측(1 sided) 또는 양측(2 sided) 임계 영역 범위에 대해 자유도가 ν(df)인

    ko.wikipedia.org

     

     표준 정규분포표와 비슷하지? 만약 자유도가 20-1=19이고 비방향적(양방향) 검정이라면 하위 2.5%는 -2.093 이하에 속하고, 상위 2.5%는 2.093 이상에 속할거야.

     

     

     이제 이 t-분포표(t-table)만 있으면 t값에 해당되는 수치를 쉽게 알 수 있겠어!

     

    -

     

     t-분포표를 잘 들여다보면 몇 가지 알 수 있는 사실들이 있어.

     

     일단 귀무 가설을 기각하기 위한 t값은, 자유도가 커지면 커질 수록 점점 더 작아지고 있는 것을 알 수 있어. 귀무 가설을 기각하기 위한 t값과 자유도는 반비례하는거지. 위의 표 에서도 자유도가 19일 때 2.093인데 그 보다 낮은 9라는 자유도에서는 2.262라는 것을 알 수 있잖아? 자유도가 작아지면 귀무 가설을 기각하기 위한 t값은 커지는거야.

     

     그리고 자유도가 커질수록, 그러다가 무한대에 가까워 질 수록 표준정규분포표의 값과 같아지게 돼. 비뱡항적 검정일 때 표준정규분포표에서는 p95가 1.96 이었잖아? t-분포표도 보면 무한대에서 t값이 1.960을 나타내는 것을 볼 수 있어. 즉, 자유도가 커지면 커질수록 귀무 가설을 제대로 기각할 확률 또한 커지는거야. 검정력이 커지는거지. 2종 오류의 확률이 줄어든다고도 할 수 있겠네. 그리고 자유도를 크게 만드려면 당연히 표본의 크기가 커지면 되겠지? 표본의 크기가 큰게 장땡이야. 그러니 빅데이터, 빅데이터 하는거지.

     

     또, 표준 오차가 작을수록 귀무 가설이 기각될 확률이 높아진다는 것도 알 수 있어. t-분포표를 봐서는 바로 알 수 없지만 t값을 구하는 공식을 보면 알 수 있는 사실이지.

     

    t = (m-M) / (s/√n) = (m-M) / sm

     

    위 공식에서 표준 오차(SE=sm)가 분모가 되는데, 분모가 커지면 당연히 t값이 작아질 것이고, 분모가 작아지면 t값이 커지겠지? 그런데 분모가 표준 오차이니, 표준 오차가 작아질 수록 t값이 커지게 되고, t값이 커지게 된다는 것은 귀무 가설을 기각할 확률 또한 커지게 되는 것이지.

     

     이제 t값도 구할 수 있고, 구한 t값을 가지고 t-분포표도 볼 수 있으니 본격적으로 t값을 계산해 볼까?

Designed by Tistory.