본문 바로가기
반응형

데이터 노하우14

[크롤링] 셀레니움 키보드 입력 아래 코드와 키별 코드 참고해서 키보드 입력 가능 SearchInput.send_keys('\ue007') NULL = '\ue000' CANCEL = '\ue001' # ^break HELP = '\ue002' BACKSPACE = '\ue003' BACK_SPACE = BACKSPACE TAB = '\ue004' CLEAR = '\ue005' RETURN = '\ue006' ENTER = '\ue007' SHIFT = '\ue008' LEFT_SHIFT = SHIFT CONTROL = '\ue009' LEFT_CONTROL = CONTROL ALT = '\ue00a' LEFT_ALT = ALT PAUSE = '\ue00b' ESCAPE = '\ue00c' SPACE = '\ue00d' PAGE_UP .. 2022. 12. 12.
[크롤링] 크롬 드라이버 최신 버전으로 자동 업데이트하기 크롬 드라이버를 자동으로 업그레이드 해주는 방법을 알아봅니다 from selenium import webdriver import os import chromedriver_autoinstaller as AutoChrome def driver_downloader(): chrome_ver = AutoChrome.get_chrome_version().split('.')[0] # 현재 버전의 앞 두숫자 current_list = os.listdir(os.getcwd()) #현재 디렉토리 내 파일/폴더의 리스트 if not chrome_ver in current_list: # 버전명으로 된 폴더가 있는지 확인. print("크롬드라이버 다운로드 실행") AutoChrome.install(True) print("크롬.. 2022. 12. 6.
[데이터 분석] 데이터 타입 변경 원하는 컬럼의 타입을 바꾸는 방법입니다. 컬럼 이름과 원하는 타입을 딕셔너리 타입으로 작성해주시면 됩니다. df=df.astype({'col1' : 'int}) 2022. 11. 25.
[데이터 분석] object 타입 구분해서 불러오기 # object 타입을 제외하고 불러오기 df = df.select_dtypes(exclude=['object']) # object 타입만 불러오기 df = df.select_dtypes(include=['object']) 2022. 11. 22.
[데이터 분석] Pandas Groupby 와 unstack 활용 df.groupby(['col1','col2'])['value'].mean() col, col2: 그룹으로 묶기를 원하는 컬럼 value : 값으로 들어가길 원하는 컬럼 mean(): 원하는 집계에 따라 sum(), median() 으로 변경해서 사용 2022. 11. 22.
빅데이터, 데이터 분석 경진대회 정보 얻기 데이터 분석과 관련해서 경진대회에 나가보고싶은데 정보가 없으셔서 못 하시는 분들이 계실거같아요. 몇몇 사이트들 알려드릴게요. 1. kaggle https://www.kaggle.com/ Kaggle: Your Machine Learning and Data Science Community Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals. www.kaggle.com 2. 데이콘 https://dacon.io/ 데이터사이언티스트 AI 컴피티션 6만 AI팀이 협업하는 인공지능 플랫폼 dacon.io 3. 링커리어 https://.. 2022. 11. 22.
[데이터 가공] 레이블 인코딩 # 레이블인코딩 from sklearn.preprocessing import LabelEncoder le = LabelEncoder() df = df.apply(le.fit_transform) df 레이블 인코딩은 카테고리 타입의 값들을 숫자의 의미가 없는 코드형 숫자 값으로 변환하는 작업입니다 2022. 11. 21.
[데이터 가공] 데이터 스케일링 MinMaxScaler() # 스케일링 from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() X_train = scaler.fit_transform(X_train) X_test = scaler.transform(X_test) MinMaxScaler는 컬럼의 값들을 0과 1사이의 값으로 변환하는 작업입니다. 각 컬럼별로 최솟값은 0, 최댓값은 1로 만들고 모든 값들이 이 구간 사이에 존재하게 됩니다. 단점: 이상치가 존재한다면, 이상치가 극값이 되어 데이터들이 아주 좁은 범위에 분포하게 됩니다. 2022. 11. 21.
[데이터 시각화] matplotlib 한글 폰트 오류 해결하기 matplotlib을 사용하다보면 한글이 안나오는 경우가 많아요 해결방법 알려드리겠습니다 1. 설치하기 pip install koreanize-matplotlib 2. 불러오기 import koreanize_matplotlib 이 두 단계만 하시면 한글이 잘 나옵니다 2022. 11. 15.
728x90