
[머신러닝/사이킷런] 회귀: 데이터 변환(로그 변환), 로지스틱 회귀, 회귀 트리
·
ML
학습 자료: 파이썬 머신러닝 완벽 가이드(개정2판), 위키북스 선형 회귀 모델을 위한 데이터 변환개요선형 회귀 모델은 피처값(X)과 타깃값(Y)의 분포가 정규 분포 형태를 매우 선호한다.특히 타깃값의 경우 정규 분포 형태가 아니라 특정값의 분포가 치우친 왜곡(Skew)된 형태의 분포도일 경우 예측 성능에 부정적인 영향을 미칠 가능성이 높다.따라서 선형 회귀 모델을 적용하기 전에 먼저 데이터에 대한 스케일링/정규화 작업을 수행하는 것이 일반적이다. 일반적으로 피처(X) 데이터셋에 적용하는 변환 작업은 다음과 같은 방법이 있을 수 있다.1. StandardScaler을 이용해 표준화를 수행하거나 MinMaxScaler을 이용해 정규화를 수행2. (1번 방법을 통한 성능 향상이 없을 경우)스케일링/정규화를 수..