公式チュートリアル:H2O.ai Self-Paced Courses
- Introduction to Machine Learning with H2O-3 - Classificationに沿った内容
- 2値分類モデル作成のステップ(データのロード、データ分割、モデル学習、結果の確認、スコアリング)の詳細、ドキュメントへのリンク
- GLM, Random Forest, Gradient Boosting Machine
- 上記モデルのハイパーパラメータチューニング(ランダムサーチ、グリッドサーチ)
- Introduction to Machine Learning with H2O-3 - Regressionに沿った内容
- 回帰モデルの作成
- XGBoost, Deep Learning (Neural Network)
- 上記モデルのハイパーパラメータチューニング(ランダムサーチ、グリッドサーチ)
- Introduction to Machine Learning with H2O-3 - AutoMLに沿った内容
- 2値分類モデル、回帰モデルの作成
- AutoMLの詳細
- Isolation Forestによる異常検知実施例
- 不均衡なラベルありデータに対し教師なし学習(Isolation Forest)を実施、精度検証。代理モデルを用い特徴量の貢献度を分析(GLM,決定木を、Isolation Forestのスコアリング結果をターゲット変数としてあてはめ)
- H2O Flow(GUI操作)による実施例: ../docs/IsolationForest_Flow.pdf
- Autoencoderによる異常検知
- k-means
- 日本語テキストに対するWord2vec
- テキストのトークン化、ストップワード除去、分散表現の実施(Word2vec)、分散表現を特徴量として教師あり学習(GBM)を実施
- Rulefitモデルに関して
- デモ用Notebook - 教師あり学習の実施プロセスと機能紹介
- H2O-3の起動
- データのロード
- データ分割
- モデルのあてはめ(GBM)
- 機械学習の解釈可能性(Glogal,Local)
- スコアリング(予測値,SHAP)
- モデルの保存とロード
- ハイパーパラメータチューニング
- AutoML
- H2O-3の終了
- 機械学習の解釈可能性(Machine Learning Interpretability)
- モデルの比較
- H2O-3のk分割交差検証法の仕様に関して
- Target Encoding(H2OTargetEncoderEstimator)の実施例
- 多水準カテゴリカルデータにTarget Encodingを実施した場合としなかった場合で比較
- 手組みでの各種Feature Engineering(変数変換や結合、Target Encoding)の実施、効果の比較
- AutoML