본문 바로가기
반응형

IT188

[데이터 가공] 데이터 스케일링 MinMaxScaler() # 스케일링 from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() X_train = scaler.fit_transform(X_train) X_test = scaler.transform(X_test) MinMaxScaler는 컬럼의 값들을 0과 1사이의 값으로 변환하는 작업입니다. 각 컬럼별로 최솟값은 0, 최댓값은 1로 만들고 모든 값들이 이 구간 사이에 존재하게 됩니다. 단점: 이상치가 존재한다면, 이상치가 극값이 되어 데이터들이 아주 좁은 범위에 분포하게 됩니다. 2022. 11. 21.
[데이터 시각화] matplotlib 한글 폰트 오류 해결하기 matplotlib을 사용하다보면 한글이 안나오는 경우가 많아요 해결방법 알려드리겠습니다 1. 설치하기 pip install koreanize-matplotlib 2. 불러오기 import koreanize_matplotlib 이 두 단계만 하시면 한글이 잘 나옵니다 2022. 11. 15.
[데이터 활용하기] 시계열 데이터 다루기 & datetime으로 불러오기 & datetime 형변환 날짜가 들어가 있는 df 테이블이 있습니다. df.head() df.info() Date 컬럼의 타입이 object입니다. # datetime으로 type변경 df['Date'] = pd.to_datetime(df['Date']) df.info()​ 타입을 datetime으로 변경했습니다. # 새로운 컬럼 추가 (년, 월, 일) df['year'] = df['Date'].dt.year df['month'] = df['Date'].dt.month df['day'] = df['Date'].dt.day #요일: 월화수목금토일(0~6) df['dayofweek']=df['Date'].dt.dayofweek 시계열 데이터는 년,월,일,요일을 뽑아서 새 컬럼으로 만들어 사용하면 편리합니다. #weekend 컬럼에 .. 2022. 11. 8.
[데이터 시각화] folium map 시각화 및 Marker 표시 folium을 사용해 데이터를 시각화하고 map에 marker 표시하는 방법을 배워보겠습니다. # 설치가 안되어있으면 pip install folium 해야함 import folium #지도 만들기, location으로 처음 위치 지정, zoom_start으로 줌배율 설정 map=folium.Map(location=[df["위도"].mean(),df["경도"].mean()], zoom_start=8) #df에 원하는 데이터프레임 지정 for n in df.index: name = df.loc[n, "상호명"] address = df.loc[n, "도로명주소"] #마커 클릭하며 나올 팝업 popup = f"{name}-{address}" #마커 표시할 위치, 위도나 경도 따오기 location = [df... 2022. 11. 7.
[데이터 시각화] matplotlib 한글 깨짐 현상 matplotlib 시각화를 하다보면 한글이 깨지는 경우가 생겨요. 이 때는 한글이 되는 폰트를 넣어주셔야합니다. plt.rcParams['font.family'] ='Malgun Gothic' plt.rcParams['axes.unicode_minus'] =False 두코드 넣어주시면 해결됩니다. 처음 돌리셨는데 안되시는분들은 한 번 더 돌려주시면 됩니다. 감사합니다. 2022. 11. 3.
[데이터 불러오기] read_csv에서 컬럼 지정해서 불러오기(usecols=[]) read_csv을 할때 파일 용량이 작은 경우에는 속도차이가 미미하지만, 파일이 커지게되면 몇 분이상 소요됩니다. 그래서 처음부터 원하는 컬럼만 지정해서 읽으면 시간과 메모리를 절약 할 수 있어요. df= pd.read_csv('C:\\Users\\user\\Downloads\\data.csv',header=0,usecols=["col1", "col2"]) 파일경로 지정해주시고 usecols=["col1", "col2"]에 원하는 컬럼 입력하시면 됩니다. 감사합니다. 2022. 11. 3.
[데이터 시각화] matplotlib 이미지 잘리는 문제 해결하기 matplotlib을 시각화 하는 과정에서 아래와 같이 이미지가 잘리는 현상이 발생합니다. plt.savefig('C:\\Users\\Downloads\\file.png',facecolor='#ffffff',bbox_inches = 'tight')​ 위 코드를 통해 해결할 수 있습니다. 자세하게 설명 드리자면 1. 'C:\\Users\\Downloads\\file.png' -> 파일 경로 입력 2. facecolor='#ffffff' -> 원하는 배경색 입력, ffffff=흰색 3. bbox_inches = 'tight' -> 여백 tight 하게 2022. 11. 3.
[window] CMD에서 서버 접근 및 서버에 있는 파일 다운받기 1. cmd 창을 켠다 2. sftp ID@IP ID: 서버 아이디 입력, IP: ip 주소 입력 3. ID@IP's password: ----- 비밀번호를 입력하라는 메시지가 나온다 4. cd / 명령어를 통해서 파일로 접근하거나 dir을 입력하면 현재경로기준 폴더 리스트가 출력된다. 5. get filename ---- 입력해주면 다운이 된다. filename=파일이름 6. 파일이 다운된다. 2022. 10. 27.
728x90