반응형
우리가 다루고 있는 데이터는 아래와 같습니다.
지난 시간에 사용했던 데이터를 가져오겠습니다.
번호 | 공부시간 | 시험점수 | 통과여부 |
1 | 1.5 | 50 | 0 |
2 | 1.8 | 65 | 0 |
3 | 2.3 | 85 | 1 |
4 | 3.3 | 75 | 0 |
5 | 4.6 | 90 | 1 |
6 | 6.5 | 98 | 1 |
로지스틱 회귀분석에 사용될 열(column)만 남기겠습니다.
번호 | 공부시간 | 통과여부 |
1 | 1.5 | 0 |
2 | 1.8 | 0 |
3 | 2.3 | 1 |
4 | 3.3 | 0 |
5 | 4.6 | 1 |
6 | 6.5 | 1 |
공부시간과 통과여부를 이용하여 그래프를 그려보았더니 아래와 같았습니다.
일차식으로 선형회귀분석을 하기에는 적합하지 않았습니다. 사람들은 위 그림의 빨간 곡선과 같은 형태의 함수를 찾아보았고, 몇개의 함수를 찾아냈습니다. 위 빨간 곡선과 같은 형태의 S자 모양 함수를 시그모이드함수라고 합니다. 대표적인 시그모이드 함수는 아래와 같습니다.
$f(x)=\frac{1}{1+e^{-(\beta_{0}+\beta_{1}x)}}$
$\beta_{0}$가 0이고, $\beta_{1}$이 10인 함수의 그래프를 그려보면 아래와 같습니다.
앞으로 우리가 해야할 일은 우리가 가진 데이터와 가장 잘 일치하는 로지스틱 함수를 찾아내는 것입니다. 아래 함수에서 $\beta_{0}$가 0이고, $\beta_{1}$ 를 찾는 것과 같습니다.
$f(x)=\frac{1}{1+e^{-(\beta_{0}+\beta_{1}x)}}$
다음시간부터 우리 데이터에 가장 잘 맞는 로지스틱 함수를 찾아봅시다.
반응형
'머신러닝 이론 (지도학습) > 로지스틱 회귀분석' 카테고리의 다른 글
[손으로 푸는 로지스틱 회귀분석] 5. 비용함수 (2) log loss (0) | 2023.07.28 |
---|---|
[손으로 푸는 로지스틱 회귀분석] 4. 비용함수 (1) 오차제곱합을 쓰지 않는 이유 (0) | 2023.07.26 |
[손으로 푸는 로지스틱 회귀분석] 2. 회귀분석의 한계 (0) | 2022.12.02 |
[손으로 푸는 로지스틱 회귀분석] 1. 소개 (0) | 2021.06.16 |
댓글