1. ReNomRG GUIの使い方

1.1. アプリケーションの起動

ReNomRGはシングルページウェブアプリケーションです。 ReNomRGのbetaバージョンはReNomRGディレクトリの中でアプリケーションを起動する必要があります。

cd workspace # Workspace can be any directory.
renom_rg # This command will starts ReNomRG GUI server.

`` renom_rg``コマンドは、次の引数を与えることができます。

  • --host : サーバのIPアドレス
  • --port : サーバのポート番号

例えば、ReNomRGを8888ポートで起動する場合は次のコマンドを入力します。

renom_rg --port 8888 # Running ReNomRG with port 8888

サーバが起動できると、webブラウザを開き、 サーバのアドレスを入力してください。

../_images/server_start.png ../_images/browser.png

するとアプリケーションの画面が表示されます。

1.2. データセットの置き方

サーバが起動すると、サーバを起動したディレクトリに datasrcディレクトリとstorageディレクトリが作成されます。

以下のようなディレクトリが作成されます。

<server_start_directory>
    └── alembic.ini        # database setting file.
    └── alembic
    |   └── versions       # database migration files.
    |   └── env.py         # database environment file.
    └── storage
    |   └── storage.db     # default database(sqlite3).
    |   └── trained_weight # weights for regression models.
    └── datasrc
    |   └── data.pickle    # pickle data for train & validation.
    |   └── prediction_set
    |       └── pred.pickle # pickle data for prediction.
    └── scripts
        └── userdefmodel.py # scripts for user defined model.(available any name.)

ReNomRGのbetaバージョンで読み込みが可能なデータは"data.pickle"と"pred.pickle"と名付けてください。

1.2.1. データのフォーマット

入力するファイルはpandas.DataFrameをpickle化したものでなければいけません。

1.3. 回帰モデルの作成

これで、サーバとデータセットが準備できました。それではモデルを開発しましょう。 モデルを作成するには、データセットとハイパーパラメータを設定します。

1.3.1. データセットの作成

回帰モデルの学習には、学習データとバリデーションデータの作成が必要です。 データセットは学習とモデルの評価のためのバリデーションに用いられます。 ReNomRGでは、学習データセットとバリデーションデータセットはdatasrcディレクトリのデータからランダムにサンプリングされます。

../_images/dataset.png

上図のように、datasrcからデータセットを作成します。データセットは作成すると変更できません。 Newボタンを押してください。

../_images/add.png

次のようなページが現れます。

../_images/setting_dataset.png

データセット名、説明、学習データの比率、前処理方法、説明・目的変数を選択することができます。 フォームを入力し、confirmボタンを押すと、データセットの確認画面が表示されます。

../_images/setting_dataset_confirm.png

上のようなグラフが表示されます。データセットに含まれるデータ数や学習データの比率、目的変数のヒストグラムを確認することができます。 データセットを保存するにはsaveボタンを押してください。 データセットページでは、作成したデータセットを確認することができます。データセットページに移動するには次のような操作を行います。

../_images/menu_dataset.png ../_images/dataset_page.png

データセット名をクリックすると、データセット内のデータ数や、目的変数のヒストグラムを確認することができます。

1.3.2. ハイパーパラメータの設定

それでは学習を開始しましょう。 モデルを作成するには、Newボタンを押してください。 ハイパーパラメータの設定モーダルが表示されます。

../_images/setting_params.png

次のパラメータを設定することができます。

Dataset Name: データセット名。

Architecture: 回帰手法。 C-GCNNは変数同士の相関係数を用いたインデックス行列を使って畳み込む変数を取得します。 Kernel-GCNNはガウスカーネルを用いた変数の類似度からインデックス行列を取得し、畳み込む変数を取得します。 DBSCAN-GCNNは変数間のユークリッド距離からインデックス行列を取得し、畳み込む変数を取得します。 Random Forestは、複数のモデル(決定木)を用いたアンサンブル学習(機械学習アルゴリズム)です。 XGBoostは、Gradient BoostingとRandom Forestsを組み合わせたアンサンブル学習(機械学習アルゴリズム)です。

Training loop setting: バッチサイスと学習回数。 (Batch Size, Total Epoch)

Graph Comvolution Params: Number of neighborsはグラフコンボリューションのパラメータです。 近傍の数はインデックス行列を取得する際に使います。

Random Forest (XGBoost) Params: Number of treesは作成する決定木の数です。 Maximum Depthは決定木の深さです。

1.3.3. 学習モデル

ハイパーパラメータの設定が完了したらRunボタンを押してください。 学習が始まると、進捗が表示されます。

../_images/progress.png

1.4. ReNomRGのアンインストール

ReNomRGは次のコマンドでアンインストールすることができます。

pip uninstall renom_rg

(その他の詳しい操作方法は、Productページをご確認ください。) https://www.renom.jp/ja/notebooks/product/renom_rg/about_renom_rg/notebook.html