ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 08-5 통계적 가정과 가설 그리고 유의 수준
    데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 4. 25. 13:30

    가정

     

     우리는 앞서 파이소스티그민이 효과가 없을거라고 가정을 했었어. 그렇다면 통계학에서 가정이란 뭘까? 가정이 화목해야 나라가 잘 살겠지만.. 통계학에서 가정(assumption)이란, 통계적 절차의 논리가 참일 것을 요구하지만, 참이라고 증명되거나 결정될 수 없는 모집단 내 상황에 관한 진술이라고 할 수 있어. 검증이 아니라는거지. 우리가 배운 '무수히 반복하다보면 정규 분포를 따른다.'라는 것도 가정이야. 무수히 반복한다는 것은 검증할 수 없잖아? 그래서 우리는

     

    1. 표본은 무선적이고 독립적으로 추출된다.

    2. 평균의 표집 분포는 정규 분포를 따른다.

     

     이러한 가정들을 기정 사실화 한 이후에 통계적 분석을 할거야. 그래야만 통계적 분석을 하는 의미가 있거든. 만약에 인간에 대해서 연구한다고 생각해 봐. 인간에 대해 연구를 할 건데, 사실 피험자로 채택된 인간이 무선적이고 독립적으로 선발된게 아니라 실험자가 자신의 실험의 결과를 조작하기 위해 특별히 선발했다고 하면? 연구를 해서 뭐해. 이미 답은 정해져 버렸는데. 그래도 만약 무선적이고 독립적으로 피험자를 선발했는데, 알고보니 선발된 인간이 사실은 외계인이있어! 인간의 모습을 하며 지구인 사이에 숨어 살고 있었던거지! 그럼? 이 연구는 애초에 인간을 대상으로 진행해야 되는 연구였는데 외계인을 데리고 뭔 연구를 해. 망한거지.

     하지만 우리는 위 두 가지 가정을 증명할 순 없어. 실험자가 '아니다! 나는 공정하게 무선적이고 독립적으로 피험자를 선발했다!'라고 우기면 무슨 방법으로 증명할거야? 또, 외계인이 우리보다 훨씬 앞선 기술을 가지고 있어서 인간의 과학 기술로는 피험자가 정말 인간인지, 인간의 모습을 하고 있는 외계인인지 알 수 없다면 어떡하지? 그러니 우리는 위 두 가지 가정을 기정 사실화 하고 통계적 분석을 하자는거지.

     

    -

     

    가설

     

     반면 가설(hypothesis)는 검증이 가능해. 증명된 가설은 이론(theory)가 될 수 있겠지. 암튼 가설은 가정과 달리 검증이 가능해야 돼. 가설은 통계적 과정으로 검토하고 그 진위나 타당성을 결정하게 되는 모집단의 상황에 관한 진술이라고 할 수있어. '파이소스티그민은 기억력에 영향을 미칠것이다!' 라는 것이 가설이 되겠지. 왜? 검증할 수 있잖아. 실제로 우리가 검증해 봤었고 말야. 가설은 동시에 참이 되거나 거짓이 될 수 없어. 파이소스티그민이 기억력에 영향을 미치면서 미치지 않을 수 없잖아?

     이때, 잠정적으로 참이라고 간주되는 가설귀무 가설 또는 영가설(null hypothesis)이라고 하고 H0이라고 표현 해. null이 독일어로 0이니까 외우기 쉽지? (사실 영어에서는 null이 0이라는 값이 아니라, '값이 없음'이라는 의미로 쓰이지만..) 반면 이 귀무 가설의 반대편에 있는 가설을 대립 가설(alternative hypothesis)이라고 하고 H1이라고 표현 해.

     

     그럼 '파이소스티그민이 기억력에 영향을 미친다!'라는 것은 귀무 가설(H0)이 될 것이고,

     '파이소스티그민이 기억력에 영향을 미치지 않는다!'라는 것이 대립 가설(H1)이 되겠지?

     통계적으로 말하면, 귀무 가설(H0)은 '파이소스티그민을 투여한 관찰치의 평균은 모집단의 평균(M=7)에서 끌어낸 표본에서 나온 것이다!'가 될 거야. 한 마디로 약물이 효과가 없다는거지.

     또, 대립 가설(H1)은 '파이소스티그민을 투여한 관찰치의 평균은 모집단의 평균(M≠7)에서 끌어낸 표본에서 나온 것이다!'가 될 거야. 바꿔 말하면 약물이 효과가 있다는거지.

     

     즉, 우리의 목표는 귀무 가설을 부셔버리는데 있어. '모집단의 평균으 7이었는데, 약물을 투여했더니 모집단의 평균 7과 다른 수치를 보이더라! 그런데 이 관측치는 우연이 아니더라! 따라서 귀무 가설을 기각하고 대립 가설을 발탁한다!'가 우리의 목표가 되는거야.

     

    -

     

    유의 수준

     

    귀무 가설을 기각하기 위해서는 관측치가 우연이 아니라는것이 입증되어야 하잖아? 그렇다면 귀무 가설을 기각하기 위한 확률을 어떻게 잡아야 할까? 얼마나 작은 확률이 보여야 귀무 가설을 기각할 수 있을까? 에 대한 대답, 즉, 귀무 가설을 기각할 수 있는 확률치를 유의 수준(significance level) 또는 임계 수준(ciritical level)이라고 해. 유의 수준은 α(알파)로 표기돼.

     

     행동 과학 연구에서 유의 수준은 보통 0.05즉, 5%를 취해. 앞서 별 하나를 찍어 봤던 P95가 되겠지? 만약 약물을 투여한 집단의 평균(m)이 약물을 투여하지 않은 모집단의 평균(M=7)에서 얻어질 확률이 5% 이상이라면, 과학자들은 귀무 가설이 타당하다고, 즉, 귀무 가설이 맞다고 여겨. 하지만 관찰된 평균(m)이 모집단의 평균(M=7)에서 얻어질 확률이 5%보다 작다면 귀무 가설이 타당하지 않다고, 즉, 귀무 가설이 틀리다고 여겨. 그럼 귀무 가설이 기각되겠지! 야호!

     

    -

     

     이제 우리의 목표는 귀무 가설을 기각하는 것이 되었어. 만약 통계적 검증으로 귀무 가설이 기각된다면 대립 가설이 타당한 것이고 약물의 효과를 입증할 수 있는 것이지!

Designed by Tistory.