다중회귀분석(Multiple Regression)

변수 간의 인과관계를 통계적으로 규명하고 미래 수치를 예측하세요.

1. 데이터 업로드

엑셀/CSV 드래그 & 드롭첫 행은 반드시 변수 명(Header)이어야 합니다.

!문자 깨짐 현상 발생 시 CSV 인코딩 변환기를 사용하여 UTF-8로 변환 후 업로드해 주세요.

분석 결과가 여기에 표시됩니다.

왼쪽 패널에서 엑셀 파일을 업로드한 뒤,
분석하고 싶은 결과값(Y)과 원인값(X)을 선택해 주세요.

모델 개념 (Model Concept)

여러 개의 독립 변수들이 하나의 종속 변수에 미치는 영향력을 동시에 분석하고, 변수 간의 상관관계를 통해 수치적인 미래 예측을 수행하는 회귀 분석의 가장 기본적이고 강력한 기계학습 모델입니다.

회귀분석 핵심 가이드

다중회귀분석(Multiple Regression)

두 개 이상의 독립변수가 하나의 종속변수에 미치는 영향을 분석하는 기법입니다. 예: 광고비, 할인율이 매출에 미치는 영향.

결정계수 (R²)

독립변수들이 종속변수의 변동을 얼마나 잘 설명하는지(0~1)를 나타냅니다. 0.7 이상이면 우수하다고 봅니다.

t-통계량 & p-value (유의성)

해당 변수가 통계적으로 유의미한지 판단합니다. 보통 |t| > 1.96 또는 p-value < 0.05일 경우 유의하다고 봅니다.

다중공선성 주의

독립변수들끼리 너무 밀접하게 상관되어 있으면 결과가 왜곡될 수 있습니다. VIF 지수가 10 이상이면 주의가 필요합니다.

데이터 행렬의 조건

데이터에 결측치가 없어야 하며, 독립변수들 간에 선형 독립(Rank가 충분함)이 유지되어야 역행렬 계산이 가능합니다.

잔차 분위수(1Q, Median, 3Q) 계산

R의 기본 알고리즘(Type 7)과 동일한 선형 보간법을 사용합니다. 단순히 위치를 찾는 것이 아니라 인접 데이터 간의 가중치를 계산하여 정밀한 분위수를 산출합니다.

설명적 vs 예측적 모델

회귀분석은 과거의 데이터를 통해 관계를 '설명'하거나, 새로운 값을 대입하여 미래를 '예측'하는 데 모두 사용됩니다.