로그 변환기 (Log Transformer)

데이터의 왜도를 줄이거나 정규성을 확보하기 위해 다양한 로그 변환을 수행하세요.

데이터 입력

엑셀/CSV 드래그 & 드롭

수동 입력

변환 설정

* 로그 변환 시 0이나 음수가 포함된 경우 데이터 유실을 막기 위해 1 등의 상수를 더해주는 것이 일반적입니다.

원본 데이터 (Original)

N=10

평균

55.0000

왜도 (Skewness)

0.0000

변환 후 데이터 (Transformed)

자연로그 (ln)

평균

3.8130

왜도 (Skewness)

-1.0412

분포 비교 (Histogram)

Original Distribution

Transformed Distribution

* 로그 변환(Log Transform)은 보통 오른쪽으로 꼬리가 긴(Right-skewed) 양수 데이터의 왜도를 줄이는 데 효과적입니다.

변환 관계 시각화

데이터 미리보기 (Top 20)

No.Original (x)Constant (c)Transformed (y)
11002.302585
22002.995732
33003.401197
44003.688879
55003.912023
66004.094345
77004.248495
88004.382027
99004.49981
1010004.60517

데이터 변환 가이드

왜 로그 변환을 하나요?

데이터가 한쪽으로 쏠려있고 분산이 일정하지 않을 때, 로그 변환을 통해 정규분포에 가깝게 만들 수 있습니다. 이는 회귀 분석 등 많은 통계 기법의 전제 조건을 충족하는 데 도움을 줍니다.

상수 가산(x + c)의 필요성

로그(ln) 함수는 0이나 음수에서 정의되지 않습니다. 데이터에 0이 포함된 경우 log(x+1) 등을 계산하여 수학적 오류를 방지하고 정보를 보존합니다.

왜도(Skewness)의 이해

분포의 비대칭성을 나타냅니다. 양수 왜도는 오른쪽으로 꼬리가 긴 분포를 의미하며, 로그 변환은 이 꼬리 부분을 중앙으로 모으는 역할을 합니다.

지수 변환(Exponential)

로그 변환과 반대로, 데이터 간의 간격을 벌리거나 이미 로그 변환된 값을 원래 스케일로 돌려놓을 때 사용됩니다.

제곱근(Sqrt) 변환

로그 변환보다는 약하지만, 카운트 데이터(Poisson 분배) 등의 변동성을 안정화하는 데 자주 사용됩니다.

해석의 주의점

변환된 데이터로 계산된 평균이나 상관계수는 원래 스케일에서의 값과 다르게 해석해야 합니다. 분석 후에는 필요에 따라 역변환(Back-transformation) 과정이 필요할 수 있습니다.