機械学習 識別について
今日は夜間作業につき勤務時間まで余裕があるので勉強します
教材は以前も利用していたUdemy、ある程度進めていたけど、最初からやり直し
教材はこれ
識別とは
入力:何らかのデータ(画像、音声、テキストなど)
出力:種類、ラベル、カテゴリ、クラス
出力の種類はカテゴリ数が有限、かつ離散的
例:入力はメール、出力は普通のメールまたは迷惑メール として識別を行う
教師あり学習、教師なし学習
教師あり学習:各データに対し、それらがどのクラスに分類されるかという教師データが付属しているデータセットを使用した機械学習
教師なし学習:上記の教師データがないデータセットを使用した機械学習、クラスタリング等に使用される
2次元データの識別例
散布図を利用し様々な識別器を利用した識別、
この学習中に時間切れ
matplotlibの関数について細かな疑問、あとサンプルプログラムを理解していなくて変に時間がかかった
yという変数に教師データ(0,1)を格納した上で
# 2次元散布図でプロット
plt.scatter(X[:,0], X[:,1], c=y, s=50)
plt.show()
とするとこんな図が出るプログラム、散布図の各点をどこで色分けしているのか
変につまずいてしまった
c=y の部分でカラーマップとして教師データを採用しているのに気が付かなった
というよりyというカラーマップ指定があるものと思い込んで時間がかかった
勉強継続します