어제 만난 가장 보통의 순간을 믿어요
-
08-14 t-분포의 활용 : SE로 Sm을 추정 (파이썬)데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 11. 12:08
자, 이제는 우리가 배운 내용들을 파이썬으로 구현해 볼거야. 우리의 목표는 두 개야. ① 평균의 표집 분포에서 모집단의 표준 편차(Sm)를 알 수 없을 때, Sm은 평균의 표집 분포에서 표준 편차, 즉 표준 오차(sm, SE) = 표본의 표준 편차(s)를 표본 크기의 제곱근(√n)으로 나눠서 추정할 수 있었어. 진짜 추정되는지 파이썬으로 계산해 보자구! ② 표준 편차를 알 수 없는 모집단으로부터 표본을 추출해서 t값을 관측한 다음에 t-분포를 활용해 보자구! - ① Sm을 SE = s/√n 로 추정하는 방법. 평균의 표집 분포에서 모집단의 Sm을 알 수 없을 때, SE = s/√n 로 추정될 수 있잖아? 다만, SE가 S와 가까워 지려면 표본의 크기(n)이 커야 했지. 무한대로 커져야만 SE가 Sm이 될..
-
08-13 t-분포의 활용 : t-검정데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 10. 11:24
이제 t-분포를 활용해서 어떻게 가설을 검정할 수 있는지 볼까? 연구 문제 만약 약물을 투여하지 않은 모집단의 평균이 7(M=7)이고 모집단의 표준 편차는 알 수 없다고 했을 때, 모집단으로 부터 추출한 20명의 무선 표본의 평균(m)이 어느정도야 약물이 효과가 있다고 할 수 있을까? 가정과 조건 단, 표본은 무선적이고 독립적으로 추출되었으며, 약물을 투여하지 않은 모집단은 평균이 7인 정규 분포를 따른다고 가정할게. 통계적 가설 먼저 귀무 가설과 대립 가설부터 정해보면, H0 : 표본 평균 m은 모집단의 평균 M=7으로부터 구해졌다. (= 약물이 효과가 없다.) H1 : 표본 평균 m은 모집단의 평균 M=7으로부터 구해진것이 아니다. (=약물이 효과가 있다.) 가 될거야. 유의 수준 그리고 p95의 유..
-
08-12 t-분포의 활용 : t-분포표데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 9. 12:58
t-분포의 활용 앞서 표본의 크기가 적을 때 스튜던트의 t-분포를 활용하면 좋다고 했잖아? 생각해 볼게. 만약 파이소스티그민을 투여했을 때 기억력이 얼마나 향상되는지 알아보려고 한다면, 일단 모집단의 평균(M)과 표준 편차(S)를 알아야겠지. 그런데 모집단의 평균만 알고 표준 편차를 모른다면? 20명의 피험자들을 대상으로 파이소스티그민의 효과를 알아보려고 한다고 가정해 볼게. 이 때 모집단의 평균(M)이 7이라는 것만 알고 표준 편차는 모르는거야. 그렇다면 일단 평균들의 표집 분포를 봐야겠지. 그리고 평균들의 표집 분포에서 평균들의 표준 편차(sm)로 모집단의 표준 편차(Sm)을 추정할 수 있었어. 그런데 sm은 표본의 표준 편차(s)에서 표본의 크기의 제곱근(√n)으로 나눠서 추정했었지? sm = s ..
-
파이썬 강좌 05 - 더하기(+), 빼기(-)데이터 분석/데이터 분석을 위한 파이썬 기초 2022. 5. 4. 14:44
컴퓨터(computer)는 계산(compute)하기 위해 사용합니다. 간단한 계산부터 해 볼까요? 7과 3을 더해보겠습니다. 우리가 알고 있는 더하기 기호(+)를 그대로 사용하면 됩니다. 키보드의 백스페이스(←) 키 근처에 있습니다. 코드를 실행해 보면 10이 출력되는 것을 볼 수 있습니다. 빼기(-)도 해 볼까요? 마찬가지로 빼기 기호를 사용하면 됩니다. 키보드의 숫자 0키 근처에 있습니다. 7에서 3을 더한 10과 7에서 3을 뺀 4가 출력되는 것을 볼 수 있습니다. 간단하죠? - 그럼 이제 사용자로부터 숫자를 입력받아서 더해보겠습니다. a와 b를 각각 입력받고 출력해 볼까요? a와 b를 각각 입력하면 a와 b가 각각 출력되는 것을 볼 수 있습니다. 이제 이 두 숫자를 더해보도록 하죠. 마찬가지로 더..
-
08-11 자유도 : df데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 4. 12:47
우리는 분산(variance)에 대해 배울 때 자유도(degrees of freedom, df)에 대해 잠깐 공부 했었어. https://kimhaksung.tistory.com/entry/simtong03-3 03-3 변산성의 지표 1 : 분산과 자유도 드디어 분산과 표준편차가 등장했구나~!~! 사실 이전까지의 글들은 분산과 표준편차에 대해 설명하기 위한 빌드업이었지. 빌드업치곤 너무 긴거 아니냐고? 그만큼 분산과 표준편차가 중요하 kimhaksung.tistory.com 이번 시간에는 자유도에 대해 좀 더 다뤄볼거야. - 자유도를 처음 만난건 분산에 대해 배울 때 였지. 모집단의 분산은 편차 제곱들의 총합(Total Sum of Squares, TSS 혹은 Sum of Squares, SS : ∑(X..
-
08-10 스튜던드의 t-분포 (feat. 윌리엄 실리 고셋)데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 2. 15:31
sm으로 Sm(SE)을 추정하기 평균들의 표집 분포에서 표본 들을 가지고 구한 표준 편차 sm을 가지고 모집단의 표준 편차 Sm, 즉 표준 오차 SE를 추정 할 수 있을까? 평균들의 표집 분포에서 표준 오차 SE를 구하려면 꿈에도 잊으면 안되는 공식, 모집단의 표준 편차에서 표본 크기의 제곱근을 나눈 것으로 구할 수 있었어. 기억하지? 평균들의 표집 분포에서 표준 오차 표준 오차 = SE = 모집단의 표준 편차 / 표본 크기의 제곱근 = S / √n 그리고 가설 검증을 위한 결정 규칙에서는 평균들의 표집 분포를 표준화 해야 됐는데, 이 때 표준 오차가 쓰였었지? 평균들의 표집 분포에서 표준화 z = (표본 평균-모집단 평균) / 표준 오차 = (m-M) / SE = (m-M) / (S/√n) 결국 우리가..
-
08-9 방향적 검정 : 일방 검정데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 4. 29. 14:41
비방향적 검정 : 양방 검정 여태 우리는 약물이 효과가 있는가? 라는 가설을 세웠었는데, 이 가설은 방향이 없었어. 비방향적 검정(nondirectional test)혹은 양방 검정(two-tailed test)이라고도 하는데, 약물이 좋은쪽으로 효과가 있는지, 아님 나쁜쪽으로 효과가 있는지 상관 없이 그냥 효과만 있으면 되는거였잖아. 모집단에서 평균 7개의 단어를 기억해 냈다면 7개보다 적은지, 많은지는 상관 없이 아무튼 7개에서 멀기만 하면 되는거였어. 그래서 비방향적 검정을 하기만 하면 됐었지. 효과가 있는지 없는지만 보면 되니까. 근데 사실 이런식으로 연구 방향을 잡진 않을거아냐? 만약 여러분들이 어떤 약을 개발하는데, '이 약은 좋은쪽으로 효과가 있을 수도 있고 나쁜 쪽으로 효과가 있을 수도 있..
-
08-8 통계적 검정력데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 4. 28. 17:17
통계적 검정력 그렇다면 귀무 가설을 기각하는 1종 오류를 범하거나, 귀무 가설을 기각하지 않는 2종 오류를 범한다는 걱정에 시달리고만 있어야 할까? 아니지! 검정력, 혹은 통계적 검정력(statistical power)이라는 확률이 있어. 귀무 가설이 실제로 틀릴 때 귀무 가설을 기각할 확률, 바꿔 말하면 대립 가설이 실제로 맞을 때 대립 가설을 사실이라고 결정할 확률을 뜻해. 말이 복잡해 보일 수 있지만 '옳은 것을 보고 옳다고 말할 확률'이 통계적 검정력이야. 쉽지? 반대의 개념이 2종 오류가 될거야. 2종 오류는 귀무 가설이 틀렸음에도 불구하고 기각하지 않는 것인데, 통계적 검정력은 귀무 가설이 틀렸다면 기각하는 확률이잖아? 즉, 통계적 검정력의 확률이 90%라고 하면 나머지 10%는 2종 오류의 ..