-
08-7 결정의 오류 : 1종 오류와 2종 오류데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 4. 27. 13:10
1종 오류와 2종 오류
결정은 어디까지나 통계적 확률에 의한 것이야. 따라서? 결정이 틀릴 확률도 있다는거지. 약물이 효과가 없다는 귀무 가설을 통계적으로 유의한 관측값으로 인해 기각했다고 해서 약물이 정말로 효과가 없는게 아닐 수도 있다는거야. 어디까지나 확률이니까.
만약 p95즉, 유의 수준이 5%라면 약물이 95%는 효과가 있을 확률이 있지만, 나머지 5%에 대해서는 효과가 없을 확률인거잖아? 그렇다면 나머지 5%에 대해서는 결정을 잘 못 한거지. 실제로 효과가 없는 5%가 존재함에도, '효과가 없다.'라는 귀무 가설을 기각해서 소수의 사례를 묵살해 버렸으니까.
이것이 결정의 오류야. 특히 귀무 가설이 실제로는 참인데, 그 귀무 가설을 기각하는 것을 1종 오류(Type 1 error)라고 해.
1종 오류 : 귀무 가설이 실제로는 참이지만 유의 수준에 의해 귀무 가설을 기각하는 오류. 이때 오류의 확률을 α(알파)라 함.
반대로 약물이 효과가 없다는 귀무 가설을 세웠는데, 통계적 분석을 해 보니 통계적으로 유의한 관측값에 의해 기각되지 않았다고 해 봐. 유의 수준 5%에서 5%에 속하지 않고 95%에 속하는 것이지.
그런데! 알고보니 이 약물은 효과가 있었던거야. 효과가 있음에도 약물이 효과가 없다는 귀무 가설을 기각하지 않아버린거지. 이런 경우를 2종 오류(Type 2 error)라고 해.
2종 오류 : 귀무 가설이 실제로는 거짓이지만 유의 수준에 의해 귀무 가설을 기각하지 않는 오류. 이때 오류의 확률을 β(베타)라 함.
정리해 볼까?
귀무 가설(H0) : 약물이 효과가 없다.
1종 오류 : 약물이 실제론 효과가 없지만 약물이 효과가 없다는 귀무 가설을 기각.
2종 오류 : 약물이 실제론 효과가 있지만 약물이 효과가 없다는 귀무 가설을 기각하지 않음.
간단하지?
표로 보면 더 쉬워
실제 상황 결정 H0 : 참 H0 : 거짓 H0 기각 1종 오류
p = α올바른 결정
p = 1-βH0 기각하지 않음 올바른 결정
p = 1-α2종 오류
p = β그림으로 보면 더더 쉬워
왼쪽은 약물을 투여하지 않은 집단에서 추출한 20명(m=7)의 정규 분포 그래프이고, 오른쪽은 약물을 투여한 집단에서 추출한 20명(m≠7)의 정규 분포의 그래프라고 해 볼게. 1종 오류는 귀무 가설(H0 : 약물이 효과가 없다.)이 참인데도 불구하고 유의 수준을 넘어가면 기각하는 거잖아?
왼쪽 정규 분포 그래프에서 1종 오류를 일으킬 유의 수준에 대한 확률이 α는 빨간색으로 칠한 부분이야. 반대로 2종 오류는 귀무 가설이 거짓(:대립 가설(H1)이 참)임에도 불구하고 귀무 가설을 기각하지 않는 것인데, 이 확률(β의 넓이)는 딱! 알 수는 없어. 1종 오류의 확률은 유의 수준에 따라 쉽게 알 수 있지만, 2종 오류는 왼쪽 집단과 오른쪽 집단의 평균의 차이이 따라 달라질 수 있거든, 다만 두 집단의 평균의 차이가 그대로라면 1종 오류가 줄어들 수록 2종 오류가 더 커지고, 1종 오류가 커질수록 2종 오류는 줄어들게 될거야. 그림으로 보면 쉽게 이해할 수 있지?
각 오류가 일어나질 확률은 전체에서 빼주기만 하면 되니까 1에서 빼주면 돼. 제일 쉽네.
'데이터 분석 > 파이썬으로 배우는 데이터 분석을 위한 통계학' 카테고리의 다른 글
08-9 방향적 검정 : 일방 검정 (0) 2022.04.29 08-8 통계적 검정력 (0) 2022.04.28 08-6 결정 규칙 (0) 2022.04.26 08-5 통계적 가정과 가설 그리고 유의 수준 (0) 2022.04.25 08-4 가설 검증 입문 : 모집단과 단일 집단 비교 (파이썬) (0) 2022.04.22