347

勉強のこと、酒のことを書いていく

学習データ、検証データ、テストデータについて

2時間程度の残業ならスーパーに寄ってから帰っても余裕があることがわかった

ただ明日は帰宅後スクワット、飲酒の予定なので自習はしない

 

Pythonでプログラム書くのにVSCodeを使ってるけど、なかなかいい感じ

使う上でのストレスが少ない

ほぼデフォルトでこれなので、カスタマイズの記事を漁ればよりよい使い勝手になりそう

 

学習データの分割
  • データセットを学習データとテストデータに分割し、学習データだけで識別におけるパラメータを調整することで性能を評価する
  • ロジスティック回帰のパラメータを調整する実践
  • ロジスティック回帰のCというパラメータを複数作成、Cの値を変えながら10-fold CVでどの値のCが最も精度が良いか確認する
  • 最も良かったCの値を利用し、学習データすべてで学習
  • 最後に学習した識別器でテストデータの精度を確認
  • テストデータは最後に評価する際にだけ使う、そうでないとそのテストデータのみに適合しすぎてしまう