어제 만난 가장 보통의 순간을 믿어요
-
01-2 기술 통계와 추론 통계 : 가설 검증데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 1. 12. 14:59
그럼 이제 본격적으로 통계학에 대해 배워볼까? 통계학이란 자료라고 불리는 양적 정보를 기술하고 해석하기 위한 방법을 연구하는 학문이야. 통계학의 정의만 보아도 4차 산업 시대에 가장 걸맞는 학문이라고 할 수 있겠지? 우리는 엄청나게 많은 양적 정보, 즉 빅 데이터(big data)의 시대에 살고 있기 때문이지. 10년 전, 아니 5년 전과 비교해도 우리가 접할 수 있는 정보들을 정말 많아 졌는데.. 빅 데이터에 대한 이야기는 나중에 다시 다뤄보도록 할게. 다시 통계학에 대해 살펴보면, 통계에는 크게 두 가지 범주가 있어. 하나는 기술 통계(descriptive statistics)이고 다른 하나는 추론 통계(inferential statistics)이지. 기술 통계는 이름에서와 같이 기술, 즉 설명하기 ..
-
01-1 기술 통계학 : 왜 통계를 공부해야 하는가?데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 1. 12. 14:54
대체 우리는 왜 통계를 공부해야 할까? 나는 종종 심리학과 통계학을 마치 전공필수 과목처럼 인류라면 반드시 배워야 할 과목으로 지정해서 모든 인류가 배워야 한다고 주장하곤 해. 심리학은 인간을, 통계학은 사회를 이해하기 위해 필수적인 학문이기 때문이지! 또, 워낙 범위가 넓은 학문이다보니 심리학을 공부하다보면 자연스럽게 생물, 의학, 체육, 학습, 발달 등 여러가지 학문에 대해 배울 수 있기도 하고.. 물론 통계학을 공부하면서도 경우의 수, 확률 등을 배우기 위한 수학적 지식을 갖춰야 하지! 하지만 이렇게만 주장한다면 그 어려운 통계학을 대체 왜 배워야 하는지 감이 잘 오지 않을거야. 그리고 나의 생각도 나이가 들면서 조금 바뀌었고 말야. 어렸을 땐 통계학을 공부하다보면서 세상을 이해하는데 도움이 된다는..
-
0. 들어가며데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 1. 12. 14:51
나는 2014년 네이버 블로그를 통해 '엑셀로 배우는 심리통계'라는 포스팅을 작성한 적이 있었다. https://blog.naver.com/khrireg/10183656520 평균치, 중앙치, 최빈치 일단 가장 기본적인 용어인 평균치, 중앙치, 최빈치에 대해서 배워볼게. 평균치는 다 알고 있을거야.. 그치... blog.naver.com 글을 쓰면서도 재미있었고, 학부 때 배웠던 내용들을 복습할 기회가 되었기 때문에 나 또한 공부가 되었다. 저 글 들이 심리통계학을 공부하는 많은 사람들에게 도움이 되었을거라 확신한다. 왜? 방문자 통계를 열람할 수 있었기 때문이다. 블로그의 방문자수만 보고도 대학교의 시험기간이 다가 온 것을 알 수 있을 정도로 인기가 좋은 포스팅이었다. 아직도 구글에서 심리통계를 검색했..
-
04-4 정규분포와 표준정규분포데이터 분석/스프레드시트로 배우는 데이터 분석을 위한 통계학 2021. 12. 21. 15:55
앞서 우리는 원점수를 표준화하여 표준점수를 구해봤어. 그리고 표준점수를 활용한다면 다양한 척도의 다양한 값들을 비교하는것이 매우 용이하다는 것을 알게 되었지! 오예~! 세상에는 엄청 많은 수치들이 존재할거야. 바둑판만해도 우주의 별 보다 많은 경우의 수 들이 존재하잖아. 이러한 숫자들에 어떠한 규칙은 없을까? 우리의 뇌로 이 세상의 존재하는 모든 숫자들을 다 고려할 수 없기 때문에 한 가지 상상을 해 볼거야. 여러분이 원하는 한 가지 분야를 골라서 가상의 평균을 구해보는거야. 예를 들어 '모든 한국인들의 키'라고 해 볼까? 전 국민의 신장을 실시간으로 조사하는 방법은 존재하지 않기 때문에 상상을 해 보자는거지. 그리고 상상한 모든 키 들의 평균도 정할 수 있을거야. 어차피 내 상상일 뿐이니 정확하지 않아..
-
04-3 표준점수의 평균과 표준편차데이터 분석/스프레드시트로 배우는 데이터 분석을 위한 통계학 2021. 12. 15. 16:14
이전 시간에 표준점수에 대해 배웠어. 표준점수가 필요한 이유는? 점수들의 척도가 다 다르니까 하나의 표준화된 척도로 맞춰주기 위해! 하나의 표준화된 척도로 맞추려면 다 다른 점수를 하나의 표준화된 점수로 맞춰주면 좋잖아? 척도는 상수를 더하거나 곱해서 변화시킬 수 있으니까! 기억나지? 그리고 원점수와 평균점수가 같다면 표준점수는 0이 될 수 밖에 없었지! 이 이야기를 조금 더 해볼게. 먼저 점수들을 볼까? 1학기 2학기 원점수 표준점수 원점수 표준점수 40 -1.15 40 -1.10 50 -0.69 45 -0.88 60 -0.23 65 0.00 85 0.92 85 0.88 90 1.15 90 1.10 우리는 원점수에서 평균을 뺀 다음 표준편차로 나눠서 표준점수를 구할 수 있었지. 그런데 혹시.. 이런 생..
-
04-1 척도데이터 분석/스프레드시트로 배우는 데이터 분석을 위한 통계학 2021. 12. 7. 15:42
'척도(scale)'란 말 그대로 대상을 관측한 속성값을 타나내는 도구야. 그런데 관찰 대상이 같더라도 관측한 속성값은 다를 수 있어. 다양한 국가와 인종이 있는 만큼 척도도 다양 할 수 있지! 그래서 '표준척도(standard scale)'가 필요해. 척도의 표준을 맞춰야만 상대적으로 비교하기 쉽겠지? 그러나 미국 사람들은 표준척도에 대해서 아는 척도 하면 안 돼. 거기는 척도가 개판이거든. 미터법에서 물 1mL의 부피가 1cm³이고, 질량이 1g이며, 온도를 1℃ 올리는 데 에너지 1 cal가 필요해. 여기서 1℃는 물의 어는점과 끓는점 간극의 1%를 말하지. 또한, 수소 1g에 들어있는 수소원자의 양은 정확히 1 mol이야. 반면 미국의 단위계에서 '물 1갤런을 끓이기 위해 얼마나 많은가?'라는 질..
-
03-5 모집단과 표본집단 : 모수치와 통계치데이터 분석/스프레드시트로 배우는 데이터 분석을 위한 통계학 2021. 12. 2. 15:54
모집단에서 표본집단을 추출하는 이유가 뭐라고했지? 시간과 돈과 노력과이 많이 드니까, 오래걸리고 돈도 많이 들고 귀찮으니까! 나는 베짱이! 우리는 전에 주의력결핍과잉행동장애(ADHD)를 앓고있는 학생들에게 리탈린이라는 약을 투여해서 학업 향상에 효과가 있는지 알아보기 위한 이야기를 했잖아. https://kimhaksung.tistory.com/entry/simtong01-2 01-2 기술 통계와 추론 통계 : 가설 검증 그럼 이제 본격적으로 통계학에 대해 배워볼까? 통계학이란 자료라고 불리는 양적 정보를 기술하고 해석하기 위한 방법을 연구하는 학문이야. 통계학의 정의만 보아도 4차 산업 시대에 가장 kimhaksung.tistory.com 기억나지? 이 실험에서 모집단은 ADHD를 앓고 있는 전 세계 ..
-
03-4 변산성의 지표 2 : 분산과 표준편차데이터 분석/스프레드시트로 배우는 데이터 분석을 위한 통계학 2021. 11. 25. 15:12
이제 표준편차(standard deviation)에 대해서 배울건데, 표준편차를 배우기에 앞서 분산과 편차에 대해 다시 생각해 볼 필요가 있어. 편차 제곱의 합이 분산이었고, 편차는 점수가 평균으로부터 떨어진 정도였지? 제곱을 한 이유는 편차들을 다 더하면 0이 되어버리기 때문이었고. 기억하지? 그리고 초등학교 때 배웠던 것을 떠올려보면 제곱을 통해 정사각형의 면적을 구할 수 있잖아? 편차 제곱도 마찬가지야. 편차를 제곱 하면 편차의 면적을 구할 수 있지. 그리고 그것들을 다 더해서 나눠주면 편차 면적들의 평균을 구할 수 있어. 결국 분산은 편차 면적들의 평균이 되는거야. 그럼 편차의 면적을 다시 편차로 되돌려놓으려면 어떻게 하면 될까? 간단해! 루트를 씌우면 되지! 분산, 즉 편차 면적들의 평균에 루트..