
KNN 알고리즘에 대해 알아보고, 실습을 통해 KNN 알고리즘의 파라미터, 최적의 k를 찾아본다. KNN(K-Nearest Neighbors)KNN은 데이터로부터 가까운 거리에 있는 k개의 다른 데이터에 의한 결과로 예측하는 알고리즘을 말한다.회귀 문제와 분류 문제 모두 해결 가능한 Memory-based learning이다. k 결정 과정너무 큰 k를 선택하면, 미세한 경계부분의 분류 정확도가 떨어지게 되며,너무 작은 k를 선택하면, 과적합이 될 가능성이 생기며, 이상치의 영향을 크게 받고, 패턴이 직관적이지 못한다. Majority voting데이터의 갯수가 균일하지 않다면, 거리에 반비례하는 Weight를 주어 편향성의 영향을 줄일 수 있다. 종속변수범주형 변수KNN 중 가장 많이 나타나는 범주로 ..
B.D.A
2024. 6. 3. 19:41
공지사항
최근에 올라온 글
- Total
- Today
- Yesterday