본문 바로가기
머신러닝 이론 (지도학습)/로지스틱 회귀분석

[손으로 푸는 로지스틱 회귀분석] 3. 로지스틱 모형

by bigpicture 2022. 12. 10.
반응형

우리가 다루고 있는 데이터는 아래와 같습니다. 

 

지난 시간에 사용했던 데이터를 가져오겠습니다. 

 

번호 공부시간 시험점수 통과여부
1 1.5 50 0
2 1.8 65 0
3 2.3 85 1
4 3.3 75 0
5 4.6 90 1
6 6.5 98 1

 

로지스틱 회귀분석에 사용될 열(column)만 남기겠습니다. 

 

번호 공부시간 통과여부
1 1.5 0
2 1.8 0
3 2.3 1
4 3.3 0
5 4.6 1
6 6.5 1

 

공부시간과 통과여부를 이용하여 그래프를 그려보았더니 아래와 같았습니다. 

 

 

일차식으로 선형회귀분석을 하기에는 적합하지 않았습니다. 사람들은 위 그림의  빨간 곡선과 같은 형태의 함수를 찾아보았고, 몇개의 함수를 찾아냈습니다. 위 빨간 곡선과 같은 형태의 S자 모양 함수를 시그모이드함수라고 합니다. 대표적인 시그모이드 함수는 아래와 같습니다. 

 

$f(x)=\frac{1}{1+e^{-(\beta_{0}+\beta_{1}x)}}$

 

$\beta_{0}$가 0이고, $\beta_{1}$이 10인 함수의 그래프를 그려보면 아래와 같습니다. 

 

 

앞으로 우리가 해야할 일은 우리가 가진 데이터와 가장 잘 일치하는 로지스틱 함수를 찾아내는 것입니다. 아래 함수에서 $\beta_{0}$가 0이고, $\beta_{1}$ 를 찾는 것과 같습니다. 

 

$f(x)=\frac{1}{1+e^{-(\beta_{0}+\beta_{1}x)}}$

 

다음시간부터 우리 데이터에 가장 잘 맞는 로지스틱 함수를 찾아봅시다. 

반응형

댓글