18. 実験: Late Submission で検証
RMSEで最適化した通常の LightGBM と比較
◦ Feature, Seed, ハイパラを揃える(時間が無かったので決め打ち)
◦ Test Set (の過去) も学習に用いる
◦ もちろん Validation Set の切り方も揃える
◦ Installation_id を group id と見た StratifiedGroupKFold
◦ Validation Metric は Loss と同一のものを使用し、early stopping を行う
◦ ※学習の設定は冒頭で紹介した solution と同じ. metric のみが異なる.
比較する内容
◦ 予測値の分布は RMSE で最適化した場合と比べて変化するか?
◦ local cv score(oof prediction) と (public,) private score (k-fold Averaging)
DSB2019 振り返り会 18
19. DSB2019 振り返り会 19
Out-Of-Fold Prediction の分布の比較(全体)
RMSE
Custom
Loss
RMSE が 0~3 の範囲に固まっているのに対し、CustomLoss は分布が広がる
次ページで class ごとに確認 ☞
20. DSB2019 振り返り会 20
Out-Of-Fold Prediction の分布の比較(class 別)
RMSE
Custom
Loss
class 0 class 1 class 2 class 3
CustomLoss の方がラベルの値を中心に分布している?(1, 2は怪しいが.)
※そういう風に最適化してるからそれはそう