로그 변환기 (Log Transformer)
데이터의 왜도를 줄이거나 정규성을 확보하기 위해 다양한 로그 변환을 수행하세요.
데이터 입력
엑셀/CSV 드래그 & 드롭
수동 입력
변환 설정
* 로그 변환 시 0이나 음수가 포함된 경우 데이터 유실을 막기 위해 1 등의 상수를 더해주는 것이 일반적입니다.
원본 데이터 (Original)
평균
55.0000
왜도 (Skewness)
0.0000
변환 후 데이터 (Transformed)
평균
3.8130
왜도 (Skewness)
-1.0412
분포 비교 (Histogram)
Original Distribution
Transformed Distribution
* 로그 변환(Log Transform)은 보통 오른쪽으로 꼬리가 긴(Right-skewed) 양수 데이터의 왜도를 줄이는 데 효과적입니다.
변환 관계 시각화
데이터 미리보기 (Top 20)
| No. | Original (x) | Constant (c) | Transformed (y) |
|---|---|---|---|
| 1 | 10 | 0 | 2.302585 |
| 2 | 20 | 0 | 2.995732 |
| 3 | 30 | 0 | 3.401197 |
| 4 | 40 | 0 | 3.688879 |
| 5 | 50 | 0 | 3.912023 |
| 6 | 60 | 0 | 4.094345 |
| 7 | 70 | 0 | 4.248495 |
| 8 | 80 | 0 | 4.382027 |
| 9 | 90 | 0 | 4.49981 |
| 10 | 100 | 0 | 4.60517 |
데이터 변환 가이드
왜 로그 변환을 하나요?
데이터가 한쪽으로 쏠려있고 분산이 일정하지 않을 때, 로그 변환을 통해 정규분포에 가깝게 만들 수 있습니다. 이는 회귀 분석 등 많은 통계 기법의 전제 조건을 충족하는 데 도움을 줍니다.
상수 가산(x + c)의 필요성
로그(ln) 함수는 0이나 음수에서 정의되지 않습니다. 데이터에 0이 포함된 경우 log(x+1) 등을 계산하여 수학적 오류를 방지하고 정보를 보존합니다.
왜도(Skewness)의 이해
분포의 비대칭성을 나타냅니다. 양수 왜도는 오른쪽으로 꼬리가 긴 분포를 의미하며, 로그 변환은 이 꼬리 부분을 중앙으로 모으는 역할을 합니다.
지수 변환(Exponential)
로그 변환과 반대로, 데이터 간의 간격을 벌리거나 이미 로그 변환된 값을 원래 스케일로 돌려놓을 때 사용됩니다.
제곱근(Sqrt) 변환
로그 변환보다는 약하지만, 카운트 데이터(Poisson 분배) 등의 변동성을 안정화하는 데 자주 사용됩니다.
해석의 주의점
변환된 데이터로 계산된 평균이나 상관계수는 원래 스케일에서의 값과 다르게 해석해야 합니다. 분석 후에는 필요에 따라 역변환(Back-transformation) 과정이 필요할 수 있습니다.