学習教材
「Pythonによるあたらしいデータ分析の教科書」の第4章4節のscikit-learn
学習まとめ
第4章3節の「sckit-learn」は56ページありました。
分類や回帰で紹介されているアルゴリズムは、代表的なアルゴリズムのみでした。また、他の節と比べてページ数は多いのですが、sckit-learnの基本を駆け足で説明した感がありました。
混合行列、ROC曲線、k-meansなどは、本書だけでは理解できなかったので、下記の書籍で情報を補足しました。
- やさしく学ぶ機械学習を理解するための数学のきほん
sckit-learnの全体像を把握でき、Webサイトや他の書籍で初見になる単語は減ると思います。
第4章3節 | scikit-learn |
学習時間 | 6時間(起床後の1時間学習と就寝前の1時間学習を、3日間続けました) |
学習スタイル | JupyterNotebookでトレース、不明な点をWebサイトや他の書籍で確認 |
学習した内容 | データの前処理(欠損値への対応、変数を分類ごと数値変換する、特徴量の正規化) 分類(サポートベクターマシン、決定木、ランダムフォレスト) 回帰(線形回帰) 次元削減(主成分分析) モデルの評価(適合率、再現率、F値、正解率、混合行列、交差検証) 予測確率の正確さ(ROC曲線、AUC) ハイパーパラメータの最適化(グリッドサーチ、ランダムサーチ) クラスタリング(k-means、階層的クラスタリング) |
次の学習
「Pythonによるあたらしいデータ分析の教科書」の第5章1節のスクレイピング
コメント