본문 바로가기

Data Handling/Data Preprocessing

시계열 특징(년, 월, 일, 주말 등) 쉽게 추출하기 - to_datetime()

'2018. 05. 01 12:12:30' 라는 데이터에서 계절, 요일, 주중/주말, 오전/오후인 특성을 어떻게 추출할 수 있을까요?

 

저는 x[:4] 을 사용해서 '연도'를 분리하고, 같은 방법으로 '월'을 분리하고, '일'을 분리해서 if 문을 이용해 여름인지, 주말인지, 오전인지 등을 파악했습니다.

좀 더 나아가서 def 을 사용하여 이 모든 것을 해주는 함수를 만들어 사용했었는데요, 

 

알고보니 5줄 이내로 처리해주는 함수가 있다고 합니다 !! 

 

 

pandas의 to_datetime()

1. 다음과 같은 데이터가 있다고 합시다.

data['date']

 

2. 직관적으로 해석하자면, 'pandas 의 datetime으로 바꿔주는 함수' 가 되겠네요.

이렇게 datetime 형태로 바꿔주고,

import pandas as pd
pd.to_datetime(data['date'])

 

3. .dt와 원하는 정보(year, month 등)를 입력하면 됩니다.

data['year'] = data['date'].dt.year #연도
data['month'] = data['date'].dt.month #월
data['day'] = data['date'].dt.day #일
data['dayofweek'] = data['date'].dt.dayofweek #요일 (월 = 0)

 

4. 이제 if문을 사용하여 계절, 주말/주중의 특성을 추가하면 되겠네요!

정말 간단하네요 :)