데이터 분석
-
08-18 t-검정 4 : 대응 표본 (파이썬)데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 20. 13:26
이왕 t-검정에 대해 다루는거 대응 표본 t-검정 (paired samples t-test)까지 가 볼까? 대응 표본 t-검정은 같은 집단을 두 번 측정하는데, 첫 번째는 처치를 하지 않은 다음 측정하는 것이고, 두 번째는 처치를 한 다음에 측정하는거야. 어떻게 보면 우리가 배우는 가설 검정에 제일 적합한 검정이 되겠지? 단일 표본 t-검정에서는 알려진 모집단으로부터 표본을 추출해서 처치한 다음 알려진 모집단의 평균과 표본의 평균이 같은지 분석했잖아? 일반적으로 사람들이 7개의 단어를 회상할 수 있으니(M=7) 20명을 추출해서 파이소스티그민을 투약한 다음 관측한 평균(m)을 모집단과 비교해보자! 이거였지. 대응 표본 t-검정은 과정 하나가 추가되어서 모집단으로부터 표본을 추출하는데, 표본을 추출하자마자..
-
08-17 t-검정 3 : 독립 표본 (파이썬)데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 18. 10:59
우리는 모집단으로부터 무선적이고 독립된 단일 표본을 추출한 다음, 단일 표본이 모집단으로부터 나왔는지 알아보았어. 평균을 통해서 말야. 모집단의 평균이 7(M=7)일 때, 표본의 평균도 7(m=7)이라면 표본이 모집단과 별 차이가 없는 것이고, 이는 처치 효과가 없다는 뜻이 되겠지? 반면 표본의 평균이 7이 아니(m≠7)라면 모집단으로부터 추출한 표본에 무언가 달라진 점이 있다는거잖아? 처치 효과가 있다는 뜻이 될거야. 이런식으로 가설을 검정하였고, 특히 스튜던트의 t-분포를 활용해서 가설을 검정했는데, 이를 t-검정 이라고 했지. 그리고 이왕 t-검정에 대해 배우는 김에 이번에는 전혀 관계가 없는 두 독립 표본에 대해 비교해 볼거야. 만약 한영고등학교 학생들의 평균 키가 171.4cm이고, 배재고등학교..
-
08-16 t-검정 2 : 단일 표본 (파이썬)데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 11. 15:06
그런데 만약 표본 집단의 데이터가 존재한다면 어떨까? 우리는 표본 집단의 평균과 표준 편차를 아예 정해 놓았지만 집단으로 존재한다면? sample = [8.73, 4.01, 6.89, 10.52, 7.74, 11.41, 13.18, 10.83, 8.54, 8.15, 8.39, 8.66, 8.48, 7.32, 5.2, 9.01, 5.86, 8.62, 5.3, 11.26] 위의 표본 집단은 내가 임의로 만든 리스트야. 평균이 약 8.4(m≒8.4)이고 표준 편차는 약 2.3(s≒2.3)이지. 아래의 코드를 통해 확인해 볼 수 있어. 만약 이 표본 집단이 평균이 7(M=7)인 모집단으로 부터 무선적이고 독립적으로 추출되었을때, t 분포를 활용한 가설 검정, 즉 t 검정을 어떻게 할 수 있을까? - 단일 표본 ..
-
08-15 t-검정 1 : 기본 (파이썬)데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 11. 14:37
이번에는 두 번째 목표를 가볼까? ② 표준 편차(S)를 알 수 없는 모집단으로부터 표본을 추출해서 t값을 관측 후 활용 표준 편차를 알 수 없는 모집단은 만들수가 없으니.. 일단 우리가 만들어 놓은 평균이 7(M=7)이고 표준 편차가 2(S=2)인 모집단을 만들어 놓고 시작할게. 대신 표준 편차 2는 모른다고 가정하는거야. 알아도 모른척 하는거지~ 그런 다음 모집단으로부터 표본의 크기가 20(n=20)인 표본을 무선적으로 추출할거야. 이 표본을 가지고 가설 검정을 할건데 귀무 가설과 대립 가설을 정해놓고 시작하면 좋겠지? 통계적 가설 귀무 가설 H0 : 표본의 평균(m)은 모집단으로부터 나온것이다. 즉, 약물이 효과가 없다. 대립 가설 H1 : 표본의 평균(m)은 모집단으로부터 나온것이 아니다. 즉, 약..
-
08-14 t-분포의 활용 : SE로 Sm을 추정 (파이썬)데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 11. 12:08
자, 이제는 우리가 배운 내용들을 파이썬으로 구현해 볼거야. 우리의 목표는 두 개야. ① 평균의 표집 분포에서 모집단의 표준 편차(Sm)를 알 수 없을 때, Sm은 평균의 표집 분포에서 표준 편차, 즉 표준 오차(sm, SE) = 표본의 표준 편차(s)를 표본 크기의 제곱근(√n)으로 나눠서 추정할 수 있었어. 진짜 추정되는지 파이썬으로 계산해 보자구! ② 표준 편차를 알 수 없는 모집단으로부터 표본을 추출해서 t값을 관측한 다음에 t-분포를 활용해 보자구! - ① Sm을 SE = s/√n 로 추정하는 방법. 평균의 표집 분포에서 모집단의 Sm을 알 수 없을 때, SE = s/√n 로 추정될 수 있잖아? 다만, SE가 S와 가까워 지려면 표본의 크기(n)이 커야 했지. 무한대로 커져야만 SE가 Sm이 될..
-
08-13 t-분포의 활용 : t-검정데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 10. 11:24
이제 t-분포를 활용해서 어떻게 가설을 검정할 수 있는지 볼까? 연구 문제 만약 약물을 투여하지 않은 모집단의 평균이 7(M=7)이고 모집단의 표준 편차는 알 수 없다고 했을 때, 모집단으로 부터 추출한 20명의 무선 표본의 평균(m)이 어느정도야 약물이 효과가 있다고 할 수 있을까? 가정과 조건 단, 표본은 무선적이고 독립적으로 추출되었으며, 약물을 투여하지 않은 모집단은 평균이 7인 정규 분포를 따른다고 가정할게. 통계적 가설 먼저 귀무 가설과 대립 가설부터 정해보면, H0 : 표본 평균 m은 모집단의 평균 M=7으로부터 구해졌다. (= 약물이 효과가 없다.) H1 : 표본 평균 m은 모집단의 평균 M=7으로부터 구해진것이 아니다. (=약물이 효과가 있다.) 가 될거야. 유의 수준 그리고 p95의 유..
-
08-12 t-분포의 활용 : t-분포표데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 5. 9. 12:58
t-분포의 활용 앞서 표본의 크기가 적을 때 스튜던트의 t-분포를 활용하면 좋다고 했잖아? 생각해 볼게. 만약 파이소스티그민을 투여했을 때 기억력이 얼마나 향상되는지 알아보려고 한다면, 일단 모집단의 평균(M)과 표준 편차(S)를 알아야겠지. 그런데 모집단의 평균만 알고 표준 편차를 모른다면? 20명의 피험자들을 대상으로 파이소스티그민의 효과를 알아보려고 한다고 가정해 볼게. 이 때 모집단의 평균(M)이 7이라는 것만 알고 표준 편차는 모르는거야. 그렇다면 일단 평균들의 표집 분포를 봐야겠지. 그리고 평균들의 표집 분포에서 평균들의 표준 편차(sm)로 모집단의 표준 편차(Sm)을 추정할 수 있었어. 그런데 sm은 표본의 표준 편차(s)에서 표본의 크기의 제곱근(√n)으로 나눠서 추정했었지? sm = s ..
-
파이썬 강좌 05 - 더하기(+), 빼기(-)데이터 분석/데이터 분석을 위한 파이썬 기초 2022. 5. 4. 14:44
컴퓨터(computer)는 계산(compute)하기 위해 사용합니다. 간단한 계산부터 해 볼까요? 7과 3을 더해보겠습니다. 우리가 알고 있는 더하기 기호(+)를 그대로 사용하면 됩니다. 키보드의 백스페이스(←) 키 근처에 있습니다. 코드를 실행해 보면 10이 출력되는 것을 볼 수 있습니다. 빼기(-)도 해 볼까요? 마찬가지로 빼기 기호를 사용하면 됩니다. 키보드의 숫자 0키 근처에 있습니다. 7에서 3을 더한 10과 7에서 3을 뺀 4가 출력되는 것을 볼 수 있습니다. 간단하죠? - 그럼 이제 사용자로부터 숫자를 입력받아서 더해보겠습니다. a와 b를 각각 입력받고 출력해 볼까요? a와 b를 각각 입력하면 a와 b가 각각 출력되는 것을 볼 수 있습니다. 이제 이 두 숫자를 더해보도록 하죠. 마찬가지로 더..