# 스케일링
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
MinMaxScaler는 컬럼의 값들을 0과 1사이의 값으로 변환하는 작업입니다.
각 컬럼별로 최솟값은 0, 최댓값은 1로 만들고 모든 값들이 이 구간 사이에 존재하게 됩니다.
단점: 이상치가 존재한다면, 이상치가 극값이 되어 데이터들이 아주 좁은 범위에 분포하게 됩니다.
반응형
'데이터 노하우' 카테고리의 다른 글
빅데이터, 데이터 분석 경진대회 정보 얻기 (0) | 2022.11.22 |
---|---|
[데이터 가공] 레이블 인코딩 (0) | 2022.11.21 |
[데이터 시각화] matplotlib 한글 폰트 오류 해결하기 (0) | 2022.11.15 |
[데이터 활용하기] 시계열 데이터 다루기 & datetime으로 불러오기 & datetime 형변환 (0) | 2022.11.08 |
[데이터 시각화] folium map 시각화 및 Marker 표시 (0) | 2022.11.07 |
댓글