ReNom TDA GUIの使い方

ReNom TDA GUIの使い方

このチュートリアルではReNom TDA GUIの使い方を説明します. 次の点を学習できます.

  • ReNom TDA GUIの起動方法

  • ReNom TDA GUIの使い方

ReNom TDA GUIの起動方法

ReNom TDA GUIを起動するため,ReNomをインストールしたディレクトリに移動します.

そしてReNom TDA GUIのサーバを起動します.

cd path to ReNom directory/
python gui/server.py

起動したら, http://0.0.0.0:8080 をブラウザ(IE以外)で開いてください.

すると次のような画面が表示されます.
このページでは,データの統計量とヒストグラムを表示できます.
gui1

gui1

csvファイルの読み込み

次にcsvファイルからデータを読み込みます。

読み込みが可能なcsvファイルは,ReNom/gui/data ディレクトリ以下にあるファイルとなります.

このディレクトリにはサンプルとしてfinance.csvとhitter.csv, digit.csvという,3つファイルがあります.

このチュートリアルでは,digit.csvというファイルを読み込みます.

gui2

gui2

計算に用いるカラムと色付けに用いるカラムの選択

次に,計算に用いるカラムと色付けに用いるカラムを選択します.

今回は,ターゲットというカラムは計算から除き, 色付けはすべてのカラムを使用します.

選択したら次のページへ進んでください.

gui3

gui3

可視化のページ

すると次のような画面が表示されます。

このページでは,可視化を行います.

gui4

gui4

パラメータの設定

次に,データを可視化するためにパラメータを設定します.

Column 0というタブを選択すると3つのセレクトボックスが表示されます.ここでは次元削減アルゴリズムと分析の種類,色付けの変数を選択できます.

gui5

gui5

gui6

gui6

gui7

gui7

散布図

例えば,PCA, Scatter Plot, targetを選択します.

すると以下のような散布図が表示されます.

分析のモードがScatter Plotのとき,ポイントクラウドのデータを可視化することができます.

gui8

gui8

教師なしクラスタリング

次に,PCA, Clustering(教師なし), クラスタリング手法でK-meansを選択します.

すると次のような画面が表示されます。

この時,教師なしクラスタリングの結果が表示されます.

gui9

gui9

教師ありクラスタリング

次に,PCA, Clustering(教師あり), クラスタリング手法をK-Nearestneighborを選択します.

すると次のような画面が表示されます。

この時,教師あり学習の結果を可視化できます.

教師あり学習では,データを学習データとテストデータに分割します.

学習データの数を比率で選択することができます.また、学習データは透過した色で表示されます.

gui10

gui10

TDA

次に,PCA, TDA, targetを選択します.

すると次のような画面が表示されます。

この時,TDAの結果を表示することができます.

gui11

gui11

画面分割

可視化ウィンドウを分割することができます.

このモードでは,変数による色の違いやアルゴリズムによる形状の違いなど様々な比較が可能です.

gui12

gui12

ヒストグラムの表示とTDAの3D表示

色付けに用いたデータのヒストグラムを表示したり,TDAの結果を立体的に表示できます.

このモードではTDAのノードをドラッグすることができます.

こうすることで,見た目は近いノード同士が実際につながっているか確認することができます.

gui13

gui13

データの検索

次にデータの検索を行います。

テキストデータの検索や数値データの検索ができます.また’=’,’>’,’<’などの比較演算子が使えます.

gui14

gui14

例えば,target変数が3に等しいデータを検索します.

すると以下のように結果が表示されます.

gui15

gui15