-
04-3 표준점수의 평균과 표준편차데이터 분석/스프레드시트로 배우는 데이터 분석을 위한 통계학 2021. 12. 15. 16:14
이전 시간에 표준점수에 대해 배웠어. 표준점수가 필요한 이유는? 점수들의 척도가 다 다르니까 하나의 표준화된 척도로 맞춰주기 위해! 하나의 표준화된 척도로 맞추려면 다 다른 점수를 하나의 표준화된 점수로 맞춰주면 좋잖아? 척도는 상수를 더하거나 곱해서 변화시킬 수 있으니까! 기억나지?
그리고 원점수와 평균점수가 같다면 표준점수는 0이 될 수 밖에 없었지!
이 이야기를 조금 더 해볼게. 먼저 점수들을 볼까?
1학기 2학기 원점수 표준점수 원점수 표준점수 40 -1.15 40 -1.10 50 -0.69 45 -0.88 60 -0.23 65 0.00 85 0.92 85 0.88 90 1.15 90 1.10 우리는 원점수에서 평균을 뺀 다음 표준편차로 나눠서 표준점수를 구할 수 있었지.
그런데 혹시.. 이런 생각 안해봤어? '표준점수를 또 표준점수로 만들면 어떻게 될까?'라는 생각. 변환된 표준점수도 점수치니까 이 표준점수들의 평균과 표준편차를 구한 다음에 표준점수의 표준점수를 만드는거야. 어떨거 같아? 한 번 해보면 되지!
1학기 2학기 표준점수 표준점수의 표준점수 표준점수 표준점수의 표준점수 -1.15 (-1.15-0)/1=-1.15 -1.10 (-1.10-0)/1=-1.10 -0.69 (-0.69-0)/1=-0.69 -0.88 (-0.88-0)/1=-0.88 -0.23 (-0.23-0)/1=-0.23 0.00 (0.00-0)/1=0 0.92 (0.92-0)/1=0.92 0.88 (0.88-0)/1=0.88 1.15 (1.15-0)/1=1.15 1.10 (1.10-0)/1=1.10 N=5, m=0
∑(Xi-m)²=SS=4s²=SS/(N-1)=4/4=1
s=1N=5, m=0,
∑(Xi-m)²=SS=4s²=SS/(N-1)=4/4=1
s=1원점수를 표준점수로 변환했던 방법과 마찬가지로 표준점수를 표준점수로 변환해봤어. 어?! 그런데?!
1학기와 2학기 표준점수의 평균은 0, 표준편차는 1로 똑같네! 심지어 표준점수를 표준점수로 변환했는데도 값이 바뀌지 않고 그대로야! 띠용?!
왜 이런 신기한 일이 일어났을까?
사실 원점수를 표준점수로 변환하기 위한 공식에 답이 있었어. 원점수를 평균으로 뺀 다음 표준편차를 나누는 공식 말야. 어?! 상수를 더하거나 빼는 것 혹은 곱하거나 나누는 것?! 어디서 많이 본건데?!
우리가 척도를 변환 할 때 봤던 그 내용 그대로지! 상수를 더하거나 빼면 원점이 바뀌고 곱하거나 나누면 단위가 바뀌는데 표준화 또한 비슷한 과정을 거쳐. 다만 상수가 평균과 표준편차 일 뿐이지.
먼저 평균이 0인 이유를 볼까? 표준점수의 평균은 원점수들에서 평균점수를 뺀 다음 표준편차를 나누어서 구하잖아? 바꿔 말하면 표준점수의 평균은 원점수의 평균에서 원점수의 평균을 뺀 다는 것과 같아. 같은 값에서 같은 값을 빼면 당연히 0이지! 분자가 0이니 분모에는 무엇이 와도 상관없어. 무조건 0이야. 척도 변환에서 상수를 빼거나 더하는 것과 같지만 그 상수가 평균일 뿐이지.
표준점수의 평균 = m(원점수의 평균) - c c = m ∴ 표준점수의 평균 = m - m = 0 이제 표준편차를 볼게. 원점수들에서 상수를 더하거나 빼는 것이 원점들의 표준편차를 변화시키지 않는다는 것을 기억하고 있지? 출제 오류로 인해 정답 처리가 되어서 내 점수와 다른 학생들의 점수가 다 같이 오른다고 해도 표준편차는 변하지 않았잖아. 기억나지? 표준편차에서는 상수를 더하거나 빼는 것은 영향을 미치지 않아. 표준편차를 변경하기 위해서는 상수를 곱하거나 나눠주어야 되는데, 표준점수의 공식에서 이 상수는 원점수의 표준편차가 돼. 따라서 표준점수의 표준편차를 구하기 위해서는 원점수의 표준편차에서 원점수에 표준편차를 나눠주어야 하는게 되지! 그럼 당연히 1이 나올 수 밖에 없어. 그치?
표준점수의 표준편차 = s(원점수의 표준편차) / c c = s ∴ 표준점수의 표준편차 = s / s = 1 그래서 표준점수의 평균은 0, 표준편차는 1이 나왔던거야. 표준화의 목적이지. 다 다른 점수들을 하나의 기준으로 비교하자는게 표준화의 목적이었고, 그 때 사용되는 점수가 표준점수였어. 표준점수의 기준이 이렇게 명료하니 서로 다른 척도를 비교하는데 얼마나 좋겠어? 그치?
마지막으로 정리해보면, 원점수에서 평균을 뺀 다음 표준편차로 나눠주면 표준점수가 되고, 이렇게 만든 표준점수들은 평균이 0이고 표준편차가 1이 돼. 당연히 표준점수가 0보다 작은 놈들은 원점수가 원점수의 평균보다 작을 것이고, 표준점수가 0보다 큰 놈들은 원점수가 원점수의 평균보다 클 거야. 표준점수가 0일 때 원점수가 원점수의 평균과 같다는 것은 말해 뭐해. 입만 아프지.
이제 표준점수에 대해 배워봤으니 이 표준점수가 의미하는 것을 더 자세하게 배워볼까?
다음시간에! 안뇽!
'데이터 분석 > 스프레드시트로 배우는 데이터 분석을 위한 통계학' 카테고리의 다른 글
04-4 정규분포와 표준정규분포 (0) 2021.12.21 04-1 척도 (0) 2021.12.07 03-5 모집단과 표본집단 : 모수치와 통계치 (0) 2021.12.02 03-4 변산성의 지표 2 : 분산과 표준편차 (0) 2021.11.25 03-3 변산성의 지표 1 : 분산과 자유도 (0) 2021.11.25