-
05-3 회귀상수와 회귀선데이터 분석/파이썬으로 배우는 데이터 분석을 위한 통계학 2022. 3. 29. 20:01
우리가 회귀를 배우려는 목적은 뭘까? 회귀란, 평균으로 돌아간다는 뜻이었잖아. 찰스 다윈의 진화론으로부터 시작해서 프랜시스 골턴으로 이어지는 회귀에 대한 개념은 통계학에서 굉장히 큰 비중을 차지하는 중요한 것이지! 그럼 회귀를 배우려는 목적은? 평균으로 돌아가려고?
다시, 통계학을 배우려는 원론적인 목적에 대해 생각해 보면, 부분에서 전체를, 과거에서 미래를 엿보려는 인간의 수학적 시도가 되겠지. 회귀가 그래. 과거에서 미래를 엿보려는 시도지. 그럼 어떻게 하면 과거로부터 미래를 엿볼 수 있을까? 우리는 아래의 사례를 가지고 한 참 동안 회귀에 대해 배우면서 어떻게 하면 과거로부터 미래를 엿볼 수 있는지 배워볼 거야.
-
SAT 점수와 GPA의 관계
대학교에 입학하고자 하는 열의는 비단 한국에만 존재하는 것은 아니지. 일본이나 중국도 한국만큼 입시경쟁이 치열한 편이고, 미국도 마찬가지야. 한국의 수능이라 할 수 있는 미국의 SAT(Scholar Assessment Test)는 대학에 가고자 하는 학생들에게 가장 중요한 관문이지! (나의 이쁜 제자 수연이가 담달에 SAT를 보는데 노력한 만큼 좋은 성과를 거뒀음 좋겠네! 화이팅!)
미국의 연구자들은 SAT 성적과 1학년 학생들의 학점(대학교 성적, GPA : Grade Point Average)의 관계가 궁금했어. 대학교에 들어오려면 SAT를 봐야하는데, 과연 SAT를 잘 본 놈들이 대학교에 들어와서도 학교 성적이 좋을지 궁금했던 것이지. 그리고 대학교에 들어올 학생들의 SAT 점수를 가지고 1학년 성적을 예측하고 싶었어. 왜?
여러분이 생각하기에는 SAT 점수와 대학교 성적 중에서 무엇이 더 중요해? 아마 대학교에 들어가기 위한 SAT 점수가 더 중요하다고 생각할거야. 나도 마찬가지구. 하지만 그 사람의 인생 전체로 봤을 땐? 자신이 선택한 전공의 전문성으로 인생을 살아가려면 대학교 성적도 SAT 점수만큼 중요할거야. 만약 어떤 회사가 해당 업무 능력을 갖춘 직원을 뽑는다고 했을 때 SAT 점수 보다는 회사 업무에 적합한 전공의 성적이 더 중요할것이 분명하니까. (그치만 요즘은 전공의 전문성은 그렇게 중요한거 같지 않드라.. 심리학도는 자진 뜨끔 합니다..)
암튼, SAT를 아무리 잘 봤다고 해도 대학교 들어와서 성적이 낮다면 SAT 점수가 그 학생의 대학교 성적을 대표하지 못한다는 뜻이잖아. 반대로, SAT를 엄청 못보고 겨우 턱걸이로 대학교에 입학했다고 해도, 막상 대학교 성적이 굉장히 좋게 나온다면 마찬가지로 SAT 점수가 그 학생의 대학교 성적을 대표하지 못한다는 뜻이 돼. SAT가 별로 의미가 없어지는 것이지. 하지만 대체로 공부는 잘 하는 놈들이 잘 하니까 SAT 점수가 높은 학생들이 대학교 성적도 좋겠지? 하핫!
그런데 만약 위의 예시 처럼 SAT가 학점을 대표하지 못한다고 하면 대학교는 어떻게 해야될까? 어서 빨리 대처 방안을 마련해야겠지. SAT 점수만 높은 학생들을 뽑았더니 학점은 그렇지 못했다면, 그 학생들은 취업도 힘들 것이고 사회에서 필요한 전공 전문성도 낮아질 것이며 학교의 평판이나 명성도 추락하겠지. 다른 수단을 마련해야 돼. 예를 들어 입학을 위한 SAT 점수의 비중을 좀 낮추고 면접을 추가해서 면접 비율을 입학 사정에 포함시킨다던가, SAT 점수만이 아니라 고등학교 때의 성적도 입학 사정에 포함시킨다던가.. 여러가지 방안이 있겠어. 사실 단 한번의 시험으로 그 사람을 평가한다는 것은 너무하잖아? 여러가지 차원에서 사람을 평가해도 모자른디..
그러니 SAT 점수와 GPA간의 관계가 연구자들에겐 중요한 문제가 된거야. 관계를 알아내야겠지! 목표는 두 가지야.
① SAT 점수를 통해 GPA를 예측하기.
② SAT 점수와 GPA간의 관계를 조사하기.
과연 연구자들은 두 가지 목표를 이룰 수 있을까?
-
산포도
당연히 연구자들은 목표를 이뤘겠지. 하핫! 이제는 우리가 목표를 이뤄야할 차례야. 어떻게. 회귀분석을 통해!
회귀 분석이란 하나의 변인이 또 다른 변인과 어떤 관계가 있는지 분석하는 것이라고 할 수 있어. 우리의 목적은 SAT 점수라는 변인과 GPA라는 변인이 어떤 관계가 있는지 분석하는 것이야! 엄청 재밌겠지? (실제로 재밌음.)
미리 스포를 좀 하자면 SAT 점수와 GPA는 '선형적 관계'를 가지고 있어. 그래서 저번 시간에 선형적 관계에 대해 배운거야. 왜 선형적 관계를 가지고 있을까? 여러분들이 예상했듯이, 공부는 하는 놈들이 잘 하기 때문에 SAT 점수를 잘 받은 학생들이 대체로 GPA도 좋거든. 우리가 다룰 데이터는 아래와 같아.
SAT = [1010, 1033, 1058, 1065, 1069, 1080, 1081, 1090, 1103, 1110, 1112, 1115, 1118, 1130, 1133, 1139, 1143, 1145, 1151, 1154, 1159, 1163, 1170, 1178, 1179, 1180, 1187, 1188, 1193, 1198, 1200, 1210, 1210, 1218, 1224, 1234, 1239, 1250, 1267, 1278] GPA = [1.3, 0.1, 0.8, 2.4, 1.1, 0.1, 1.3, 2.6, 1.5, 1.3, 0.9, 2.0, 3.0, 2.9, 1.1, 3.3, 1.1, 0.9, 1.5, 2.2, 2.1, 1.7, 1.8, 2.1, 2.9, 2.3, 1.8, 3.2, 1.8, 2.4, 3.6, 2.5, 2.2, 3.1, 2.3, 2.9, 3.8, 3.9, 1.7, 2.6]
총 40명의 SAT 점수와 GPA를 리스트로 나타낸거야. 여러분들은 위의 리스트를 복사해서 코드에 가져다 쓰면 돼. (나는 책을 보고 따라 치느라 개고생함.)
위의 값들을 가지고 그래프를 만들어 보면 아래의 그림처럼 나타낼 수 있을거야.
일단 위 그래프를 만들어 내는 것이 여러분들의 첫 번째 목표야. 저번 시간에 배운 내용들을 복습할 겸 위와 같은 도표를 만들어 볼까? 되도록이면 스스로의 힘으로 해봤음 좋겠네! 구현한 코드는 아래와 같아.
위의 코드를 구현하는 것에 대해서는 저번 시간의 내용이랑 똑같기 때문에 생략할게! 넘나리 쉬운것~
암튼 점수들을 살펴보니 대체로 SAT 점수가 높은 놈들이 GPA 또한 높은 것을 알 수 있어. 이 대학교는 4.0이 만점인가 보다. 4.0을 넘는 학점이 하나도 없는거 보이~
도표를 보면 알 수 있듯이 꼭 SAT 점수가 높다고 해서 GPA 또한 높은 것은 아니야. 이렇게 점수쌍들을 도표로 나타낸 것을 '산포도(scatterplot)'라고 해. SAT는 1267점인데 학점은 1.7인 놈도 있고, 반대로 SAT는 1118점인데 GPA는 3.0인 친구도있거든. 어느 한 부분에 몰려있는 것이 아니라 점수들이 퍼져있는 는 것을 볼 수 있지? 만약 점수들이 퍼져있는 범위가 넓지 않고 좁다면 선형적 관계가 강하다는 뜻이고, 반대로 점수들이 퍼져있는 정도가 넓다면 선형적 관계가 약하다는 뜻이야. 아래의 그림을 보면 쉽게 이해할 수 있을거야.
심지어 정말 선형적 관계가 강하다면 어느 한 선 위에 점수치들이 몰려있는 경우도 있겠지? 그리고 위와 같이 X값이 증가할 수록 Y값도 증가한다면 '정적(positive)' 혹은 '정비례 관계(direct relationship)'라고 해. 정비례라면 기울기는 당연히 양수가 되어야겠지? 반대로 기울기가 음수라면 '부적(negative)' 혹은 '반비례 관계(inverse relationship)'라고 해.
산포도를 통해 두 변인의 관계가 얼마나 약한지, 강한지 알 수 있다면 우리가 원했던 '②SAT 점수와 GPA간의 관계를 조사하기.'라는 목표를 달성할 수 있을거야.
그 전에! 회귀상수와 회귀선에 대해 알아볼까? 이 강좌의 제목이기도 한데.. 굉장히 늦게 등장한 것은 기분탓은 아니겠지..
-
회귀선
회귀 분석을 하기 위해서는 '회귀선(regression line)'을 그려야 돼. 회귀 분석에서 제일 중요한 부분이야. 회귀선 그리기. 회귀선이란 점수치들을 예측하는 단 하나의 선을 말해. 우리의 첫 번째 목표였지! '① SAT 점수를 통해 GPA를 예측하기.'말야. 회귀선을 그릴 수 있다면 첫 번째 목표를 달성할 수 있을거야.
그럼 회귀선이란 뭘까? 모든 점수치들을 가장 잘 대표하는 단 하나의 직선을 말 해. 이 선을 통해 하나의 변인으로 다른 변인을 예측하는 것이지! 아래의 그림은 내가 대충 손으로 그린 회귀선이 될 수도 있고 안될 수도 있는 선들이야.
막 그래프를 넘어가는 것을 보니 진짜 대충 그었네; 암튼 점수들을 잘 대표한다고 할 수 있는 직선은 어느 놈일까? 빨간색? 노란색? 초록색? 파란색?
이 질문에 대답하기 위해서는 '대체 어떻게 하면 점수들을 대표하는 회귀선을 그을 수 있는가!' 라는 것 부터 시작해야돼. 여러분들의 생각은 어때?
물론 회귀 상수를 이용해 회귀선을 그리기 위한 공식이 존재 해. 여러분들은 그 공식을 배우려고 지금 이 글을 읽고 있는 것이겠지? 하지만 공식보다 중요한게 있어. '추상적 이해'야. 어떻게 하면 모든 점수들을 잘 대표하는 하나의 회귀선을 그을 수 있을지 여러분들이 스스로 생각해 봤음 좋겠어. 공식을 외우고 회귀상수를 구해서 회귀선을 그리는 것 보다 훨씬 중요한 일이야. 글을 계속 읽어 나가기 전에 꼭! 여기서 잠시 멈추고, 여러분들 스스로 생각해 보는 시간을 갖길 바랄게! (나는 제자들에게 이러한 시간을 엄청나게 많이 제공하면서 스스로 도전하게 해. 이로인해 커리큘럼 상의 다른 진도에 차질이 생겨도 상관없어. 그 무엇보다 중요한 지점이 이곳이니까!)
답에 앞서, 힌트를 줄게!
여러분들이 처음 배운 기술 통계적 지표는 뭐였지? 바로! 평균! 이었지!
그렇다면 평균에 대해 알게 된 것은 언제일까? 평균을 구하려면 점수치들을 다 더해서 점수치들의 개수로 나눠야 하니 적어도 덧셈과 나눗셈은 알아야 할까? 그렇다면 초등학교 4학년 이상이 되어야만 평균에 대해 알 수 있는 것일까?
기술적으로는 그래. 하지만 우리는 아주~ 아주~ 어렸을 때 부터. 평균에 대해 알고 있었어.
예를 들어 볼게. 학성이가 어렸을 때 학성이의 친구들과 함께 선생님에게 사탕을 받게 되었어. 선생님께서는 학성이와 다른 친구 셋에게 사탕이 들어있는 주머니를 주셨는데, 욕심이 많은 학성이는 사탕을 5개 가져갔고, 다른 친구 셋은 각각 4개, 2개, 1개 밖에 가져가질 못했어. 공평하지 못한거지. 그래서 선생님은 학성이에게 '너 혼자 사탕을 다섯 개나 먹으면 다른 친구들은 많이 먹질 못하니, 네 사탕을 다른 친구들에게 나눠주는 것이 어떻겠니?'라고 하셨어. 학성이는 욕심이 났지만 다른 친구들을 위해 사탕을 나눠주기로 했지. 그런데 보니까 이미 4개를 가지고 있는 친구에게는 사탕을 나눠줄 필요가 없는거야. 이미 많이 가지고 있으니까. 그래서 사탕을 하나 밖에 가져가지 못한 친구에게 2개의 사탕을 주기로 했어. 그러면 학성이도 3개, 그 친구도 3개가 될 테니까. 학성이가 사탕을 나눠주는 모습을 보더니 4개를 가지고 있는 친구 또한 2개를 가지고 있는 친구에게 사탕 1개를 나눠주었어. 마침내 모두가 사탕 3개씩을 갖게 되었지. 참 공평하지?
이것이 평균의 개념이야. 여러분들은 이미 동심을 잃어서 5와 4와 2와 1을 더한 다음 4로 나눌 생각을 했겠지만 학성이와 친구들은 서로 공평하게 사탕을 나눠 가졌고 3이라는 숫자를 만나게 되었지! 두 가지 방법은 다르지만 평균을 알게 되었다는 것은 같아. 평균은 많은 놈이 부족한 놈에게 좀 나눠주고, 또, 부족한 놈은 많은 놈에게 나눠 받으면서 서로 평등해 지자는 것이니까!
사실 이 개념은 우리가 배웠던 '편차(deviation)'의 개념으로 이어졌어. 기억나지?
회귀선도 마찬가지야. 모든 점들의 입장에서 공평한 하나의 선을 그리는게 목적이야. 그럼 어떻게 하면 모든 점들의 입장에서 공평한 지점을 찾느냐 인데.. 평균과 달리 회귀는 변인이 두 개 이기 때문에 생각하기 쉽지가 않아. 그렇다면 회귀를 배우는 목적에 대해 다시 생각해 볼 필요가 있어.
지금 우리가 배우는 길에서 나는 어디쯤 와 있는가. 공부를 하면서 끊임없이 생각해야 하는 중요한 것이지만 종종 놓치고 말지. 우리가 회귀를 공부하는 이유는 하나의 변인으로 부터 다른 변인을 예측하고, 그러면서 두 변인의 관계를 알아보자는 거였어. 그치?
SAT 성적과 GPA로 생각해 보면 SAT 성적으로 GPA를 예측해 보는 것이 우리의 목표지. 그럼 SAT 성적과 GPA중에서 더 중요한 변인은 무엇일까?
당연히! GPA지! 왜? GPA를 예측하려고 회귀분석을 하려는거 아냐! 우리의 목표는 GPA를 예측하는거잖아! X를 통해 Y를 예측할 땐 Y가 목표가 되는거야. 힌트가 됐어? 두 변인을 모두 생각할 필요 없이 Y 변인만 생각해 보자고. 그리고 Y 변인에 대해 고려할 땐 앞서 예를 들었던 '학성이와 친구들의 사탕 이야기.'가 도움이 될거야.
-
편차
자, 이제 본격적으로 회귀선을 그어 볼 텐데, X(SAT 성적)와 Y(GPA)의 데이터가 너무 많으니 임의로 다섯 개 정도만 뽑아 볼게. (사실 내가 뽑은게 아니라 책이 뽑음.)
SAT 점수 (X) 1010 1033 1103 1170 1250 GPA (Y) 1.3 0.1 1.5 1.8 3.9 하필 3.9 짜리 과탑이 뽑혀버렸네.. 암튼 우리는 위 다섯명의 점수들을 가지고 회귀선을 그어 볼 거야. 이번에도 내가 그림판으로 대~충~ 회귀선을 그어 볼게.
여러분 생각에는 초록색과 주황색 선 중에 어느것이 점수들을 더 잘 대표한다고 생각해? 대충 봤을 땐.. 초록색 선인가? 아니, 주황색 선 인거 같기도 하고.. 모르겠다!
이럴 땐 Y축을 들여다 보면 돼. 아래의 그림을 볼까?
두 개의 그림 중에서 위에 있는 그림은 초록색 선을 기준으로 Y값과 얼마나 차이가 나는지 선으로 나타낸 것이고, 아래의 그림은 주황색 선을 기준으로 Y값과 얼마나 차이가 나는지 선으로 나타낸거야.
모든 점들을 잘 대표한다는 것은 이 편차들이 더 작다는 것을 뜻하지 않을까? 그럼 편차들이 가장 작은 선을 회귀선으로 정하면 되겠네! (그래도 아직 그림만 봐서는 잘 모르겠다.)
편차를 구하기 위해서는 점수와 직선이 얼마나 떨어져있는지 거리를 구해야 돼. 그런데 거리를 구하려고 직선의 Y값에서 점수의 Y값을 빼려고 보니 직선을 기준으로 했을 때 직선보다 위에 있는 것들은 양수가 나올 것이고, 직선보다 아래에 있는 것들은 음수가 나올거야. 당연하지?
이 편차들의 길이를 다 더해서 비교하고 싶은데, 양수와 음수가 섞여있다보니 쉽지 않..은.. 것.. 같.. 아앗! 이것은?!
https://kimhaksung.tistory.com/entry/pytong03-1
우리가 평균을 배우면서 보았던 그 편차와 개념이 똑같네! 평균에서의 편차를 그냥 더해서 비교하면 0이 나오기 때문에 다른 방법을 썼었지! 제곱하는 것 말야! 바꿔 말하면, 길이를 비교하는 것이 아니라 면적을 비교하는 것이지. 우리가 배웠던 '최소제곱법(method of least squares)'말야. 아래의 그림을 볼까?
그림으로 나타낸 정사각형들의 넓이를 비교하기만 하면 초록색과 주황색 선 중에서 어느것이 더 점수치들을 잘 대표하는지 알 수 있을거야. 면적들의 총 합이 더 작은 놈이 더 점수치들을 잘 대표한다는 거니까!
이 원리를 사용하면 모든 점수치들을 잘 대표하는 하나의 선을 그을 수 있을것이고, 그 선이 바로 회귀선이 되는거야.
-
회귀선의 방정식 구하기
회귀선을 그을려고 보니 직선으로 되어있는 것을 알 수 있어. 간단한 일차 방정식이라는거지. 일차 방정식은 Y=aX+b의 꼴로 되어있었지? 회귀선도 마찬가지 일거야. 대신 Y를 'Ŷ'라 할게. Y에 모자처럼 생긴 ^를 씌운 모습이야. 그래서 Ŷ를 'Y-hat(와이-햇)'이라고 해. Ŷ는 '예측된 Y(predicted Y)'라는 뜻이야.
그런데 컴터로 Ŷ 입력하는게 힘들어서 앞으로는 'Yh'이라고 할게.
Yh = aX+b
결국 최소제곱법은 Yi(각 점수들의 Y값)에서 Ŷ을 뺀 다음 제곱을 해서 다 더해주면 되는거야. 참 쉽지?
∑(Yi-Yh)²
이게 회귀선을 그을 때 필요한 열쇠야. 그리고 회귀 방정식은
Yh = aX+b 일때,
a (기울기) = {N(∑XY)-(∑X)(∑Y)} / {N∑X²-(∑X)²}
b (회귀 상수) = Ym-aXm
(Ym은 Y평균, Xm은 X평균)
로 구할 수 있어. 엄청 복잡하지? 그래도 잘 살펴 보면 우리가 구해야 될 것들은
∑X, ∑X²,∑Y, ∑XY
이것들 밖에 없어. 반복문을 사용하면 쉽게 구할 수 있는 것들이지! 안그래? 회귀선을 그을 수 있는 회귀방정식에 대해 알아봤으니 본격적으로 회귀방정식을 계산해 볼까?
-
회귀방정식의 계산
앞서 5명의 SAT 점수 (X)와 GPA (Y)를 뽑아 놨었지? 이 점수들을 가지고 회귀방정식을 만들기 위한 재료들을 준비해 볼게! 재료들에는 '∑X, ∑X²,∑Y, ∑XY'가 있었어. X와 Y의 평균과 함께 계산해 볼까? 파이썬을 사용하면 쉽게 구할 수 있을거야. 여러분이 스스로 파이썬으로 코드를 작성해 보고 아래의 표와 비교해 보면 좋겠어!
SAT 점수 (X) 1010 1033 1103 1170 1250 GPA (Y) 1.3 0.1 1.5 1.8 3.9 Xm Ym ∑X ∑X² ∑Y ∑XY 1113.2 1.72 5566 6235198 8.6 10051.8 이 표는 여러분의 코드가 제대로 답을 내었는지 그렇지 않은지 판단하기 위한 자료일 뿐이야! 코드는 아래 처럼 구현할 수 있겠지?
만약 sum() 함수를 사용하지 않고 반복문 하나로 끝내고 싶다면 아래의 코드가 낫겠지?
아! 나는 반복문도 싫다! 어차피 리스트의 모든 항목들에 똑같은 짓을 해야되니까 한 번에 끝내고 싶다! 하는 친구들은 저번 시간에 배웠던 numpy 배열을 사용하면 돼! 아래처럼 구현할 수 있을거야.
어때? 깔끔해 보이는 것은 가장 마지막 방법인거 같지 않아? 동작 횟수는 차치 하더라도 일단 반복문이 눈에 안보이니 좋잖아! 하핫!
'∑X, ∑X²,∑Y, ∑XY'들을 다 구했으니 본격적으로 회귀방정식을 만들어 볼까? 먼저 기울기 a를 구해볼게. a는 {N(∑XY)-(∑X)(∑Y)}에서 {N∑X²-(∑X)²}을 나눠서 구할 수 있었어. (∑X)²는 구해놓은 ∑X를 제곱하면 되겠지? 그 다음에는 회귀상수 b를 구해볼건데, b는 Y의 평균에서 a와 X의 평균을 곱한 다음 빼주면 돼.
a는 약 0.012, b는 약 -11.89가 나오는 것을 알 수 있어. 그렇다는 것은! 다섯명의 SAT 점수와 GPA에 대한 회귀방정식은!
Yh = 0.012X-11.888
라는 것을 알 수 있는거야! 이 뜻이 뭐겠어! 우리는 미래를 예측할 수 있다는거야!
만약 학성이의 SAT 점수가 1200점이라면 학성이가 대학에 입학해서 1학년때 받을 성적이 약 2.78이라고 예측할 수 있는거야! 여러분들도 SAT 점수를 아래의 코드를 실행시켜서 SAT 점수를 입력할 수 있겠지? 예측된 Y는 Yp라고 할게.
우리에게 예측력이 생겼어. 여러분들은 이제 과거를 통해 미래를 예측할 수 있게 된거야.
-
더 많은 데이터
위의 실습은 40명의 학생들 중에서 5명만 뽑은거였지? 하지만 우리는 40명의 데이터를 이미 갖고 있으니 40명의 데이터로 회귀방정식을 구해볼까?
이번에는 좀 더 보기 좋으라고 회귀방정식을 예쁘게 출력해 봤어. round() 함수를 사용해서 소수점 아래 세 번째 자리에서 반올림했고, print() 함수 안에 sep=''는 출력될 것들 사이의 공백을 없앤다는 뜻이야. 그랬더니!
Yh = 0.009X+(-8.157)
라는 회귀방정식을 볼 수 있었어. 아까 다섯명의 데이터로 구한 값과 차이가 있네! 당연히 5명과 40명은 차이가 있을 것이고, 데이터가 많으면 많아질 수록 정확도 또한 높아지겠지? 이번에 구한 회귀방정식으로 SAT 점수를 1200으로 입력해 보면 약 2.46점이 출력되는 것을 볼 수 있어. 점수가 더 낮아졌네! 또르르..
-
마무리
이제 여러분들에게 미래를 예측할 수 있는 능력이 생겼어. 중요한 것은 방법이 아냐. '무엇을 예측할 것인가. 어떤 변인으로 어떤 변인은 예측할 것인가.'이지 않겠어?
또, 우리가 앞서 목표 했던 '② SAT 점수와 GPA간의 관계를 조사하기.'는 아직 달성하지 못 한거 같아. 과연 회귀선이 얼마나 예측력이 좋을 것인가, SAT 점수와 GPA는 얼마만큼의 관계를 가지고 있는가! 라는 문제가 남아 있는거야.
이 문제에 대한 대답은.. 다음 시간에.. 안뇽!
'데이터 분석 > 파이썬으로 배우는 데이터 분석을 위한 통계학' 카테고리의 다른 글
05-5 추정 표준오차 그리고 자유도 (0) 2022.03.31 05-4 회귀선 그리기 : matplotlib를 활용한 데이터 시각화 (0) 2022.03.30 05-2 회귀 분석 시각화를 위한 matplotlib (0) 2022.03.28 05-1 회귀 : 선형적 관계성 (0) 2022.03.23 04-7 정규분포 그래프 그리기 : matplotlib를 활용한 데이터 시각화 그리고 확률 밀도 함수 (0) 2022.03.22