5~7日目:scikit-learnの基礎学習

Python

学習教材

「Pythonによるあたらしいデータ分析の教科書」の第4章4節のscikit-learn

学習まとめ

第4章3節の「sckit-learn」は56ページありました。

分類や回帰で紹介されているアルゴリズムは、代表的なアルゴリズムのみでした。また、他の節と比べてページ数は多いのですが、sckit-learnの基本を駆け足で説明した感がありました。
混合行列、ROC曲線、k-meansなどは、本書だけでは理解できなかったので、下記の書籍で情報を補足しました。

  • やさしく学ぶ機械学習を理解するための数学のきほん

sckit-learnの全体像を把握でき、Webサイトや他の書籍で初見になる単語は減ると思います。

第4章3節 scikit-learn
学習時間 6時間(起床後の1時間学習と就寝前の1時間学習を、3日間続けました)
学習スタイル JupyterNotebookでトレース、不明な点をWebサイトや他の書籍で確認
学習した内容 データの前処理(欠損値への対応、変数を分類ごと数値変換する、特徴量の正規化)
分類(サポートベクターマシン、決定木、ランダムフォレスト)
回帰(線形回帰)
次元削減(主成分分析)
モデルの評価(適合率、再現率、F値、正解率、混合行列、交差検証)
予測確率の正確さ(ROC曲線、AUC)
ハイパーパラメータの最適化(グリッドサーチ、ランダムサーチ)
クラスタリング(k-means、階層的クラスタリング)

次の学習

「Pythonによるあたらしいデータ分析の教科書」の第5章1節のスクレイピング

 

コメント

タイトルとURLをコピーしました