나이브 베이즈 분류 (Naive Bayes)
데이터의 확률 분포를 학습하여 새로운 데이터의 범주를 예측합니다.
Data Source
학습 데이터 업로드
나이브 베이즈 학습 및 시각화
데이터를 업로드하고 변수를 선택해주세요.
모델 개념 (Model Concept)
모든 특징(Feature)이 독립적이라는 가정 하에 베이즈 정리를 적용하여 새로운 데이터의 범주별 소속 확률을 계산하는 매우 효율적인 확률적 분류기입니다.
알고리즘 가이드
사전 확률 (Prior)
아무런 특징이 주어지지 않았을 때, 특정 범주일 기초 확률입니다. 데이터셋 내 각 클래스의 비중을 바탕으로 계산됩니다.
가우시안 분포 (Gaussian)
연속적인 숫자 데이터를 처리하기 위해 각 특징이 정규 분포(종 모양 곡선)를 따른다고 가정하고 확률 밀도를 계산합니다.
독립성 가정 (Naive)
모든 변수들이 서로 영향을 주지 않고 독립적이라고 '순진하게(Naive)' 가정하여 계산 속도를 극대화한 알고리즘입니다.
모델 적용 및 보강 사항
언더플로우(Underflow) 방지
매우 작은 확률들이 계속 곱해져 0이 되는 현상을 막기 위해 모든 확률 연산에 로그(Log) 변환을 적용했습니다.
7:3 데이터 검증 시스템
데이터를 자동으로 무작위 분할하여 학습에 사용되지 않은 평가셋으로 정밀한 성능(Accuracy, F1)을 리포트합니다.
실시간 연산 피드백
데이터 청크 분할 처리를 통해 대용량 분석 시에도 브라우저가 멈추지 않고 실시간 진행 상태를 프로그레스 바로 보여줍니다.