본문 바로가기
데이터 노하우

[데이터 가공] 데이터 스케일링 MinMaxScaler()

by whdgus928 2022. 11. 21.
# 스케일링
from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

MinMaxScaler는 컬럼의 값들을 0과 1사이의 값으로 변환하는 작업입니다.

각 컬럼별로 최솟값은 0, 최댓값은 1로 만들고 모든 값들이 이 구간 사이에 존재하게 됩니다.

 

단점:  이상치가 존재한다면, 이상치가 극값이 되어 데이터들이 아주 좁은 범위에 분포하게 됩니다.

반응형

댓글