k-NN 분류 (Nearest Neighbors)

새로운 데이터가 들어왔을 때, 가장 가까운 이웃들을 보고 무엇인지 예측합니다.

모델 설정

이웃의 수 (k)3

k=1k=15

학습 데이터 업로드

첫 행을 변수명으로 사용

데이터를 업로드하고 변수를 선택해주세요.

새로운 데이터를 분류할 때 가장 가까운 k개의 이웃 데이터를 참조하여 다수결로 결과를 결정하는 가장 직관적이고 강력한 분류 알고리즘입니다.

"유유상종"의 원리입니다. 나와 가장 가까운 k개의 데이터를 보고, 다수결로 나의 정체를 파악하는 알고리즘입니다.

k가 너무 작으면 잡음(Noise)에 민감하고, 너무 크면 경계가 모호해질 수 있습니다. 적절한 k를 찾는 것이 핵심입니다.

우리가 분류하고자 하는 목표입니다. (예: 품종, 합격여부, 등급 등) 학습을 위해서는 정답이 있는 데이터가 필요합니다.