k-NN 분류 (Nearest Neighbors)

새로운 데이터가 들어왔을 때, 가장 가까운 이웃들을 보고 무엇인지 예측합니다.

모델 설정

k=1k=15

Data Source

학습 데이터 업로드

k-NN 시각화

데이터를 업로드하고 변수를 선택해주세요.

모델 개념 (Model Concept)

새로운 데이터를 분류할 때 가장 가까운 k개의 이웃 데이터를 참조하여 다수결로 결과를 결정하는 가장 직관적이고 강력한 분류 알고리즘입니다.

머신러닝 용어 가이드

k-NN (최근접 이웃)

"유유상종"의 원리입니다. 나와 가장 가까운 k개의 데이터를 보고, 다수결로 나의 정체를 파악하는 알고리즘입니다.

k (이웃의 수)

k가 너무 작으면 잡음(Noise)에 민감하고, 너무 크면 경계가 모호해질 수 있습니다. 적절한 k를 찾는 것이 핵심입니다.

Label (정답지)

우리가 분류하고자 하는 목표입니다. (예: 품종, 합격여부, 등급 등) 학습을 위해서는 정답이 있는 데이터가 필요합니다.