機械学習③~教師あり学習の流れ~

こんばんは。

機械学習の教師あり学習の流れをまとめてみました。
大体こんな感じかなといった程度のものですが、私の備忘録的な意味でのっけて置きます。

以下簡単に解説。

①は必須のライブラリをインポートする。

②は機械学習に用いるデータなので、手作りでも別のところからcsvを読み込んできても、なんでもいいので、データを用意する。

③はデータを訓練データとテストデータに分割しているが、ここも他のやり方で分割する方法もある。
分割する目的は②で用意したデータ全てを使って機械学習した場合、正しく機能するのかがわからない。そのため、あらかじめ検証するためのデータを確保しておく。
train_test_splitメソッドでは以下のようにデータを分割してくれる。
X_train →75%の訓練データ
X_test   →75%の訓練データの正解ラベル
y_train →25%のテストデータ
y_test   →25%のテストデータの正解ラベル

④は機械学習アルゴリズムをインポートしている。

⑤は③で分割したデータを機械学習させている。

⑥は⑤での機械学習後のX_testとy_testを比較して、どのくらいの精度が出ているかを確認する。

⑦は実際の何かしら予測してほしいデータを機械学習後のデータと比較し、予測を行う。

 

ざっとこんな感じですか。
今後も間違いであったり、気付きがあれば、ちょくちょくこの記事を修正していこうと思います。

スポンサーリンク
広告1
広告1

シェアする

  • このエントリーをはてなブックマークに追加

フォローする

%d人のブロガーが「いいね」をつけました。