본문 바로가기

Project/Dacon

[Dacon] 전력수요 및 SMP 예측 AI 경진대회 - 결과분석

3. 결과 분석

 

5월 25일부터 현재(5월 31일)까지의 점수로는 17등을 기록하고 있습니다.

시간이 지날수록 실제 데이터 값이 공개되면서 등수가 변경되는데, 

supply를 예측할때 22일 이후를 기점으로 모델에 변화(학습데이터 60개 -> 90개)를 주었기 때문에

6월 9일을 기점으로 등수가 떨어지거나 오르거나 할 것 같습니다. 

 

- 아쉬운 점

Part 1에서도 언급했듯 유가 데이터가 SMP 예측에 가장 큰 영향을 주는 요인입니다.

하지만 유가데이터의 예측 모델을 보면 정확하게 예측하고 있지 못하고 있음을 확인할 수 있는데

이는 모델이 최근 코로나 사태나 사우디와 러시아 사이 관계를 고려할수 없기 때문입니다.

 

그래서 생각한 방법이 딥러닝인데 (특히 LSTM),

딥러닝 지식이 전무할 뿐만아니라 텐서플로우 설치부터 오류가 많아 시도조차 못해봤습니다.

 

블로그가 정리되는대로 딥러닝 공부에 매진하고 포스팅해보겠습니다. 


 

이번 대회에 제출한 코드와 아이디어 대부분이 다른 분들의 코드를 바탕으로 수정한 것이기 때문에

코드를 자세히 분석하며 학습하는 시간이 필요합니다.

 

그래서 코드 속에서 생소했던 문법과 라이브러리등을 '데이터 전처리' 카테고리에 정리하며 기록하려고 합니다. 

이번 대회를 통해 정리해 볼 주제는 다음과 같습니다.

- 문법

  • .apply(lambda x: )
  • concat vs merge
  • loc vs iloc

- 방법

  • 결측치 처리
  • 시계열 정보 추출
  • 시간별 데이터 -> 일자별 데이터

- 외부 데이터 가져오기

  • API 사용법
  • 크롤링 / pandas.read_html

최종순위

최종 순위는 20등으로 마무리 되었습니다.

첫 대회치고 나름 좋은 성적을 거둔 것 같아 뿌듯하네요 !!