08-16 t-검정 2 : 단일 표본 (파이썬)

데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 11. 15:06

그런데 만약 표본 집단의 데이터가 존재한다면 어떨까? 우리는 표본 집단의 평균과 표준 편차를 아예 정해 놓았지만 집단으로 존재한다면?

sample = [8.73, 4.01, 6.89, 10.52, 7.74, 11.41, 13.18, 10.83, 8.54, 8.15, 8.39, 8.66, 8.48, 7.32, 5.2, 9.01, 5.86, 8.62, 5.3, 11.26]

위의 표본 집단은 내가 임의로 만든 리스트야. 평균이 약 8.4(m≒8.4)이고 표준 편차는 약 2.3(s≒2.3)이지. 아래의 코드를 통해 확인해 볼 수 있어.

만약 이 표본 집단이 평균이 7(M=7)인 모집단으로 부터 무선적이고 독립적으로 추출되었을때, t 분포를 활용한 가설 검정, 즉 t 검정을 어떻게 할 수 있을까?

당연히 표본 집단의 표준 편차로 표준 오차를 추정한 다음 t값을 관측해서 t분포표와 비교하면 되겠지만.. 컴퓨터의 힘을 빌려 한 번에 할순 없을까?

있지! 왜 없겠어! 없으면 이런 글을 쓰지도 않았지. 하핫!

마찬가지로 scipy 라이브러리의 stats 모듈을 활용할거야. stats 모듈의 ttest_1samp() 라는 함수를 사용하면 단일 표본이 모집단의 평균으로 부터 나온것인가 바로 알 수 있어!

ttest_1samp(표본집단, 모집단평균)

ttest_1samp() 함수를 사용해서 위의 표본 집단(sample)이 평균이 7인 모집단으로부터 나온 것인지 확인해 볼까?

코드를 실행해 보면

Ttest_1sampResult(statistic=2.730285449616503, pvalue=0.013290545680919332)

가 출력되는 것을 볼 수 있어. 여기서 statistic은 t값을 뜻하고, pvalue는 t값의 확률을 뜻 해. 즉, sample이 평균이 7인 모집단으로부터 나올 확률이 1.3%밖에 되질 않는다는거야. 귀무 가설 기각이지 뭐.

코드를 좀 더 정리해서 완성해 볼까? 유의 수준에 따른 임계 값으로 귀무 가설을 기각할지 판별해 보는거야! 대신 t라는 변수에는 관측된 t값을, p라는 변수에는 그에 따른 확률을 넣어볼게.

P95 유의 수준에서는 양방 검정에서 양극단의 5%에 해당된다면 귀무 가설을 기각하기로 했잖아? 즉 p값이 0.5보다 크다면 귀무 가설을 기각하지 않지만, 0.5이하라면 귀무 가설을 기각하는거지! 코드가 아주 간결하고 검정도 편해졌지?

앞으로는 단일 표본에 대한 t 검정은 이 함수를 사용하게 될거야. 넘 편하고 좋다!

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

인기포스트