로그 변환기 (Log Transformer)

데이터의 왜도를 줄이거나 정규성을 확보하기 위해 다양한 로그 변환을 수행하세요.

데이터 입력

엑셀/CSV 드래그 & 드롭

변환 유형

상수 가산 (x + c)

* 로그 변환 시 0이나 음수가 포함된 경우 데이터 유실을 막기 위해 1 등의 상수를 더해주는 것이 일반적입니다.

N=10

평균

55.0000

왜도 (Skewness)

0.0000

자연로그 (ln)

평균

3.8130

왜도 (Skewness)

-1.0412

Original Distribution

Transformed Distribution

* 로그 변환(Log Transform)은 보통 오른쪽으로 꼬리가 긴(Right-skewed) 양수 데이터의 왜도를 줄이는 데 효과적입니다.

No.	Original (x)	Transformed (y)
1	10	2.302585
2	20	2.995732
3	30	3.401197
4	40	3.688879
5	50	3.912023
6	60	4.094345
7	70	4.248495
8	80	4.382027
9	90	4.49981
10	100	4.60517

데이터가 한쪽으로 쏠려있고 분산이 일정하지 않을 때, 로그 변환을 통해 정규분포에 가깝게 만들 수 있습니다. 이는 회귀 분석 등 많은 통계 기법의 전제 조건을 충족하는 데 도움을 줍니다.

로그(ln) 함수는 0이나 음수에서 정의되지 않습니다. 데이터에 0이 포함된 경우 log(x+1) 등을 계산하여 수학적 오류를 방지하고 정보를 보존합니다.

분포의 비대칭성을 나타냅니다. 양수 왜도는 오른쪽으로 꼬리가 긴 분포를 의미하며, 로그 변환은 이 꼬리 부분을 중앙으로 모으는 역할을 합니다.

로그 변환과 반대로, 데이터 간의 간격을 벌리거나 이미 로그 변환된 값을 원래 스케일로 돌려놓을 때 사용됩니다.

로그 변환보다는 약하지만, 카운트 데이터(Poisson 분배) 등의 변동성을 안정화하는 데 자주 사용됩니다.

변환된 데이터로 계산된 평균이나 상관계수는 원래 스케일에서의 값과 다르게 해석해야 합니다. 분석 후에는 필요에 따라 역변환(Back-transformation) 과정이 필요할 수 있습니다.