2차 대회 2과제 : 기상에 따른 혈관질환 발생 예측 모델 개발
- 기상청에서 제공하는 기상 데이터와 예보 데이터를 바탕으로 일별, 지역별 혈관 질환으로 인한 입원 빈도를 예측하는 과제입니다.
- 최종공모안 파일에 EDA, 모델링, 활용 방안에 대한 설명이 있습니다.
최종 순위 : 입선 (4위)
- RMSE (Validation set) : 1.2085
Base Learner
The most common choice is Decision Trees, which tend to work well on structured inputs.
Probability Distribution
The distribution needs to be compatible with the output type. For e.g. Normal distribution for real valued outputs, Bernoulli for binary outputs.
Scoring rule
Maximum Likelihood Estimation is an obvious choice. More robust rules such as Continuous Ranked Probability Score are also suitable.
The above choices can be mixed and matched to be customized for the specific prediction problem at hand.