본문 바로가기
데이터 노하우

[데이터 활용하기] 시계열 데이터 다루기 & datetime으로 불러오기 & datetime 형변환

by whdgus928 2022. 11. 8.

날짜가 들어가 있는 df 테이블이 있습니다.

df.head()

df.info()

Date 컬럼의 타입이 object입니다.

# datetime으로 type변경
df['Date'] = pd.to_datetime(df['Date'])
df.info()​

타입을 datetime으로 변경했습니다.

# 새로운 컬럼 추가 (년, 월, 일)
df['year'] = df['Date'].dt.year
df['month'] = df['Date'].dt.month
df['day'] = df['Date'].dt.day
#요일: 월화수목금토일(0~6)
df['dayofweek']=df['Date'].dt.dayofweek

시계열 데이터는 년,월,일,요일을 뽑아서 새 컬럼으로 만들어 사용하면 편리합니다.

#weekend 컬럼에 주말이면 True, 평일이면 False
df['weekend']=df['dayofweek'].apply(lambda x: x>=5, 1, 0)

#2022년 11월 주말
weekend_cond=(df['year']==2022)&(df['month']==11)&(df['weekend'])

#2022년 11월 평일
weekday_cond=(df['year']==2022)&(df['month']==11)&(~df['weekend'])

#2022년 11월 주말의 col 컬럼의 평균 구하기
weekend=df.loc[weekend_cond,'col'].mean()

원하는 날짜를 조건으로 입력해서 사용하면 됩니다.

 

 

다음은 처음부터 datetime으로 불러오는 방식입니다.

# 데이터 불러오기 (datetime컬럼 지정)
df = pd.read_csv("/data.csv", parse_dates=['Date'])

['Date']에 원하는 컬럼 입력하시면 됩니다.

dates에 다른 타입도 넣어서 활용 가능하겠네요.

반응형

댓글