Skip to content

Latest commit

 

History

History

examples_python

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

H20-3 Example Jupyter Notebooks

Document
Python API Reference


H2O.ai Self-Paced Coursesの内容(教師あり学習、AutoML)

公式チュートリアル:H2O.ai Self-Paced Courses

  • Introduction to Machine Learning with H2O-3 - Classificationに沿った内容
  • 2値分類モデル作成のステップ(データのロード、データ分割、モデル学習、結果の確認、スコアリング)の詳細、ドキュメントへのリンク
  • GLM, Random Forest, Gradient Boosting Machine
  • 上記モデルのハイパーパラメータチューニング(ランダムサーチ、グリッドサーチ)

教師なし学習と異常検知

  • Isolation Forestによる異常検知実施例
  • 不均衡なラベルありデータに対し教師なし学習(Isolation Forest)を実施、精度検証。代理モデルを用い特徴量の貢献度を分析(GLM,決定木を、Isolation Forestのスコアリング結果をターゲット変数としてあてはめ)
  • H2O Flow(GUI操作)による実施例: ../docs/IsolationForest_Flow.pdf
  • Autoencoderによる異常検知
  • k-means

テキストデータ

  • 日本語テキストに対するWord2vec
  • テキストのトークン化、ストップワード除去、分散表現の実施(Word2vec)、分散表現を特徴量として教師あり学習(GBM)を実施

教師あり学習

  • Rulefitモデルに関して

  • デモ用Notebook - 教師あり学習の実施プロセスと機能紹介
    • H2O-3の起動
    • データのロード
    • データ分割
    • モデルのあてはめ(GBM)
    • 機械学習の解釈可能性(Glogal,Local)
    • スコアリング(予測値,SHAP)
    • モデルの保存とロード
    • ハイパーパラメータチューニング
    • AutoML
    • H2O-3の終了
  • 機械学習の解釈可能性(Machine Learning Interpretability)
  • モデルの比較
  • H2O-3のk分割交差検証法の仕様に関して
  • Target Encoding(H2OTargetEncoderEstimator)の実施例
  • 多水準カテゴリカルデータにTarget Encodingを実施した場合としなかった場合で比較
  • 手組みでの各種Feature Engineering(変数変換や結合、Target Encoding)の実施、効果の比較
  • AutoML