学習データ、検証データ、テストデータについて
2時間程度の残業ならスーパーに寄ってから帰っても余裕があることがわかった
ただ明日は帰宅後スクワット、飲酒の予定なので自習はしない
Pythonでプログラム書くのにVSCodeを使ってるけど、なかなかいい感じ
使う上でのストレスが少ない
ほぼデフォルトでこれなので、カスタマイズの記事を漁ればよりよい使い勝手になりそう
学習データの分割
- データセットを学習データとテストデータに分割し、学習データだけで識別におけるパラメータを調整することで性能を評価する
- ロジスティック回帰のパラメータを調整する実践
- ロジスティック回帰のCというパラメータを複数作成、Cの値を変えながら10-fold CVでどの値のCが最も精度が良いか確認する
- 最も良かったCの値を利用し、学習データすべてで学習
- 最後に学習した識別器でテストデータの精度を確認
- テストデータは最後に評価する際にだけ使う、そうでないとそのテストデータのみに適合しすぎてしまう