k-NN 분류 (Nearest Neighbors)
새로운 데이터가 들어왔을 때, 가장 가까운 이웃들을 보고 무엇인지 예측합니다.
모델 설정
k=1k=15
Data Source
학습 데이터 업로드
k-NN 시각화
데이터를 업로드하고 변수를 선택해주세요.
모델 개념 (Model Concept)
새로운 데이터를 분류할 때 가장 가까운 k개의 이웃 데이터를 참조하여 다수결로 결과를 결정하는 가장 직관적이고 강력한 분류 알고리즘입니다.
머신러닝 용어 가이드
k-NN (최근접 이웃)
"유유상종"의 원리입니다. 나와 가장 가까운 k개의 데이터를 보고, 다수결로 나의 정체를 파악하는 알고리즘입니다.
k (이웃의 수)
k가 너무 작으면 잡음(Noise)에 민감하고, 너무 크면 경계가 모호해질 수 있습니다. 적절한 k를 찾는 것이 핵심입니다.
Label (정답지)
우리가 분류하고자 하는 목표입니다. (예: 품종, 합격여부, 등급 등) 학습을 위해서는 정답이 있는 데이터가 필요합니다.