본문 바로가기
데이터 어쩌구/ML DL 공부

[ML] 지도학습 - KNN

by annmunju 2022. 3. 2.

* 지도학습 알고리즘

1. k-최근접 이웃(K-Nearest Neighbor) : from sklearn.neighbors import KNeighborsClassifier

    1) 회귀 : k개 근접한 결과들의 평균을 결과로 예측

    2) 분류 : k개 근접해 있는 분류에서 다수결 결과로 분류 예측

 * k값이 크면 과소적합, k값이 작으면 과대적합 될 수 있음.

 * 근접의 기준 = 거리 (맨하탄 거리, 유클리디안 거리, 민코위스키 거리 등)

 

* 모델 검증 : 홀드-아웃 방식

 : 훈련 데이터와 테스트 데이터 분리

방법 1. index 생성해서 np.random.shuffle(index) 후 인덱스로 train, test 분리

방법 2. from sklearn.model_selection import train_test_split

 


[KNN 분류 분석 실습]

728x90