-
Logistic regression #2머신러닝 기초 2019. 11. 3. 00:05반응형
이제 linear classifier를 시각화해보자. 우선 아래와 같이 feature가 3개인 경우 (즉 1차인 경우)
위와 같이 dicision boundary가 결정된다. 위와 같은 상황에서는 dicision boundary가 데이터를 적절히 나누지는 못했다. 이제 차수를 높여 2차인 경우에는 아래와 같다.
feature수가 증가하니 dicision boundary가 데이터를 적절히 나누기 시작했다. 이제 차수를 더 높이면
이렇게 데이터를 과도하게 나누는 dicision boundary가 발생하며 이를 overfitting이라 한다. 위와 같이 coefficient들이 커지기 시작하면 overfitting을 의심해 봐야한다.
반응형'머신러닝 기초' 카테고리의 다른 글
Nearest neighbor regression (0) 2019.11.03 Stochastic gradient descent (0) 2019.11.03 Logistic regression #1 (0) 2019.11.02 Geometric intuition of solution (0) 2019.10.12 Lasso Regression #3 (0) 2019.10.11