-
08-9 방향적 검정 : 일방 검정데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 4. 29. 14:41
비방향적 검정 : 양방 검정
여태 우리는 약물이 효과가 있는가? 라는 가설을 세웠었는데, 이 가설은 방향이 없었어. 비방향적 검정(nondirectional test)혹은 양방 검정(two-tailed test)이라고도 하는데, 약물이 좋은쪽으로 효과가 있는지, 아님 나쁜쪽으로 효과가 있는지 상관 없이 그냥 효과만 있으면 되는거였잖아. 모집단에서 평균 7개의 단어를 기억해 냈다면 7개보다 적은지, 많은지는 상관 없이 아무튼 7개에서 멀기만 하면 되는거였어. 그래서 비방향적 검정을 하기만 하면 됐었지. 효과가 있는지 없는지만 보면 되니까.
근데 사실 이런식으로 연구 방향을 잡진 않을거아냐? 만약 여러분들이 어떤 약을 개발하는데, '이 약은 좋은쪽으로 효과가 있을 수도 있고 나쁜 쪽으로 효과가 있을 수도 있는 복불복 약이니, 이게 내 운이다 하고 복용하십시오!'라고 할건 아니잖아. 기억력에 영향을 미치는 약을 만들거면, 기억력이 좋아지도록 약을 만들어야지! 안그래?
-
방향적 검정 : 일방 검정
그래서 비방향적 검정 보다는 방향적 검정(directional test)혹은 일방 검정(one-tailed test)를할거야. 효과가 어느 한 방향으로만 있는지 검정하자는거야. 모집단의 평균이 7이라면, 7보다 큰 놈들만 보자는거지. 다만 방향적 검정 또한 확률의 문제이기 때문에 우리가 여태까지 다뤘던 수치들이 조금을 달라질 수 있어. p95가 1.96이었잖아? 하지만 이 수치는 비방향적 검증 수치였어. 방향적 검증 수치에서는 p95는 1.645가 돼. 아래 그림을 볼까?
이 그림은 비방향적 검정에서 p95 임계 수준이라면, 정규분포표에 의해 1.96 이상이 2.5%이고, -1.96 이하 또한 2.5%이기 때문에 둘을 합치면 5%가 되잖아? 그래서 1.96이라는 점수를 썼던건데 방향적 검정에서는 임계 수준을 둘로 쪼갤 필요 없이 한 쪽으로 합쳐야 돼. 만약 좋은 효과를 기대하는 약을 개발했다면 오른쪽으로 임계 수준을 몰아 놓아야 겠지? 아래의 그림처럼 말야.
위 그림은 1.645의 임계값을 가지고 있어. 1.645는 표준정규분포표에서 0.95를 나타내고 있으니 딱이지! 반대로 음(negative)의 영역에서는 -1.645를 쓰면 될거야. 당연하지?
-
정리를 해 보면,
비방향적 검정에서는 z값이 -1.96 이하이거나, z값이 1.96 이상(-1.96≤z≤1.96)이라면 귀무 가설(H0)을 기각하겠지만,
방향적 검정에서는 z값이 1.645 이상(z≤1.645)이라면 귀무 가설(H0)을 기각하는거야.
다만 방향적 검정을 해야하는지, 아니면 비방향적 검정을 해야하는지는 가정에 대한 근거가 필요 해. 어떤 약을 개발했는데, 이 약의 성분들이 긍정적인 효과를 입증하기에 충분한 성분들로 구성 되었다던가 하는 근거 말야. 그래야 연구 결과 또한 긍정적일 것이라고 기대할 수 있을 것이고, 방향적 검정으로 결정해야 겠지. 즉, 실험을 하기 전 부터 정해야 되는거야. 이 실험의 결과를 방향적 검정할 것인가, 비방향적 검정할 것인가!를 말야.
그런데 만약 꼼수를 써서, 어떤 약이 긍정적 효과와 부정적 효과를 둘 다 나타낼 가능성이 충분한데, 이 사실을 숨기고 방향적 검정만을 할 수도 있어. 왜? 방향적 검정의 임계값(1.645)이 비방향적 검정의 임계값(1.96)보다 낮잖아! 임계값이 낮다는 뜻은 귀무 가설을 기각하기 더 쉽다는 뜻이지! 연구자들은 귀무 가설을 기각함으로써 연구의 성과를 입증하려고 하는데, 귀무 가설을 기각하기 어렵다면 연구의 성과를 입증하는 것 또한 어려운거잖아.
만약 관측값(z값)이 1.75정도가 나왔다고 해 볼게. 이 수치는 비방향적 검정으로는 기각할 수 없고, 방향적 검정으로는 기각할 수 있는 수치야. 그런데 연구자가 연구 성과에 눈이 멀어서 방향적 검정을 선택해야 하는 상황이 아닌데도 불구하고 영가설을 기각하기 위해서만 방향적 검정을 택할수도 있는거지. 어지 되었든 선택은 연구자의 몫이지만.. 검정 방법을 바꾸려는 시도 보다는 연구 자체를 향상시키려는 노력이 필요할거 같아. 그치?
'데이터 분석 > 파이썬으로 배우는 데이터 분석을 위한 통계학' 카테고리의 다른 글
08-11 자유도 : df (0) 2022.05.04 08-10 스튜던드의 t-분포 (feat. 윌리엄 실리 고셋) (0) 2022.05.02 08-8 통계적 검정력 (0) 2022.04.28 08-7 결정의 오류 : 1종 오류와 2종 오류 (0) 2022.04.27 08-6 결정 규칙 (0) 2022.04.26