날짜가 들어가 있는 df 테이블이 있습니다.
df.head()
df.info()
Date 컬럼의 타입이 object입니다.
# datetime으로 type변경
df['Date'] = pd.to_datetime(df['Date'])
df.info()
타입을 datetime으로 변경했습니다.
# 새로운 컬럼 추가 (년, 월, 일)
df['year'] = df['Date'].dt.year
df['month'] = df['Date'].dt.month
df['day'] = df['Date'].dt.day
#요일: 월화수목금토일(0~6)
df['dayofweek']=df['Date'].dt.dayofweek
시계열 데이터는 년,월,일,요일을 뽑아서 새 컬럼으로 만들어 사용하면 편리합니다.
#weekend 컬럼에 주말이면 True, 평일이면 False
df['weekend']=df['dayofweek'].apply(lambda x: x>=5, 1, 0)
#2022년 11월 주말
weekend_cond=(df['year']==2022)&(df['month']==11)&(df['weekend'])
#2022년 11월 평일
weekday_cond=(df['year']==2022)&(df['month']==11)&(~df['weekend'])
#2022년 11월 주말의 col 컬럼의 평균 구하기
weekend=df.loc[weekend_cond,'col'].mean()
원하는 날짜를 조건으로 입력해서 사용하면 됩니다.
다음은 처음부터 datetime으로 불러오는 방식입니다.
# 데이터 불러오기 (datetime컬럼 지정)
df = pd.read_csv("/data.csv", parse_dates=['Date'])
['Date']에 원하는 컬럼 입력하시면 됩니다.
dates에 다른 타입도 넣어서 활용 가능하겠네요.
반응형
'데이터 노하우' 카테고리의 다른 글
[데이터 가공] 데이터 스케일링 MinMaxScaler() (0) | 2022.11.21 |
---|---|
[데이터 시각화] matplotlib 한글 폰트 오류 해결하기 (0) | 2022.11.15 |
[데이터 시각화] folium map 시각화 및 Marker 표시 (0) | 2022.11.07 |
[데이터 시각화] matplotlib 한글 깨짐 현상 (0) | 2022.11.03 |
[데이터 불러오기] read_csv에서 컬럼 지정해서 불러오기(usecols=[]) (0) | 2022.11.03 |
댓글