'2018. 05. 01 12:12:30' 라는 데이터에서 계절, 요일, 주중/주말, 오전/오후인 특성을 어떻게 추출할 수 있을까요?
저는 x[:4] 을 사용해서 '연도'를 분리하고, 같은 방법으로 '월'을 분리하고, '일'을 분리해서 if 문을 이용해 여름인지, 주말인지, 오전인지 등을 파악했습니다.
좀 더 나아가서 def 을 사용하여 이 모든 것을 해주는 함수를 만들어 사용했었는데요,
알고보니 5줄 이내로 처리해주는 함수가 있다고 합니다 !!
pandas의 to_datetime()
1. 다음과 같은 데이터가 있다고 합시다.
data['date']
2. 직관적으로 해석하자면, 'pandas 의 datetime으로 바꿔주는 함수' 가 되겠네요.
이렇게 datetime 형태로 바꿔주고,
import pandas as pd
pd.to_datetime(data['date'])
3. .dt와 원하는 정보(year, month 등)를 입력하면 됩니다.
data['year'] = data['date'].dt.year #연도
data['month'] = data['date'].dt.month #월
data['day'] = data['date'].dt.day #일
data['dayofweek'] = data['date'].dt.dayofweek #요일 (월 = 0)
4. 이제 if문을 사용하여 계절, 주말/주중의 특성을 추가하면 되겠네요!
정말 간단하네요 :)
'Data Handling > Data Preprocessing' 카테고리의 다른 글
피쳐 스케일링 (Feature Scaling) (0) | 2020.07.27 |
---|---|
범주형 변수 처리 - 인코딩(Encoding) (0) | 2020.06.20 |
훈련, 테스트 데이터 통합하기 (0) | 2020.06.18 |
시간별 데이터를 일자별 데이터로 변환하기 (0) | 2020.06.02 |
결측치 처리하기 (삭제 / 대체) (0) | 2020.06.02 |