347

勉強のこと、酒のことを書いていく

機械学習 識別について

今日は夜間作業につき勤務時間まで余裕があるので勉強します

教材は以前も利用していたUdemy、ある程度進めていたけど、最初からやり直し

 

教材はこれ

www.udemy.com

 

識別とは

入力:何らかのデータ(画像、音声、テキストなど)

出力:種類、ラベル、カテゴリ、クラス

出力の種類はカテゴリ数が有限、かつ離散的

 

例:入力はメール、出力は普通のメールまたは迷惑メール として識別を行う

 

教師あり学習教師なし学習

教師あり学習:各データに対し、それらがどのクラスに分類されるかという教師データが付属しているデータセットを使用した機械学習

教師なし学習:上記の教師データがないデータセットを使用した機械学習クラスタリング等に使用される

 

2次元データの識別例

散布図を利用し様々な識別器を利用した識別、

この学習中に時間切れ

matplotlibの関数について細かな疑問、あとサンプルプログラムを理解していなくて変に時間がかかった

 

yという変数に教師データ(0,1)を格納した上で

# 2次元散布図でプロット
plt.scatter(X[:,0], X[:,1], c=y, s=50)
plt.show()
 
とするとこんな図が出るプログラム、散布図の各点をどこで色分けしているのか
変につまずいてしまった
c=y の部分でカラーマップとして教師データを採用しているのに気が付かなった
というよりyというカラーマップ指定があるものと思い込んで時間がかかった

f:id:geva:20180927152118p:plain

勉強継続します