* 지도학습 알고리즘
1. k-최근접 이웃(K-Nearest Neighbor) : from sklearn.neighbors import KNeighborsClassifier
1) 회귀 : k개 근접한 결과들의 평균을 결과로 예측
2) 분류 : k개 근접해 있는 분류에서 다수결 결과로 분류 예측
* k값이 크면 과소적합, k값이 작으면 과대적합 될 수 있음.
* 근접의 기준 = 거리 (맨하탄 거리, 유클리디안 거리, 민코위스키 거리 등)
* 모델 검증 : 홀드-아웃 방식
: 훈련 데이터와 테스트 데이터 분리
방법 1. index 생성해서 np.random.shuffle(index) 후 인덱스로 train, test 분리
방법 2. from sklearn.model_selection import train_test_split
[KNN 분류 분석 실습]
728x90
'데이터 어쩌구 > ML DL 공부' 카테고리의 다른 글
[ProDS] 통계 이론 및 데이터 시각화 (0) | 2022.03.15 |
---|---|
[ML] 지도학습 : 평가지표 (0) | 2022.03.07 |
[ML] 기계학습 개요 (0) | 2022.03.02 |
[이론] 데이터의 분석과 모델의 학습 (0) | 2021.11.10 |
[setting] 학습 환경 소개 및 정리 (Colab, kaggle) (0) | 2021.11.09 |