3.7.8.3. renom.utility.preprocess.standardization package

class Standardization ( x , axis=None )

データを標準化することにより、機械学習のパフォーマンスを向上させることができる。この関数は入力データを標準化、すなわち平均を0に、分散を1にする。

パラメータ:
  • x ( ndarray ) – 標準化するデータ
  • axis ( 0_or_1_or_None ) – どの軸に沿って標準化するかを決める。1ならそれぞれの行ごとに、0なら列ごとに標準化する。もしNoneなら、データ全体を対象にする。
Example:
>>> from utility.preprocess import Standardization
>>> import numpy as np
>>> x = np.array([[0, 1, 2],
                  [3, 4, 5],
                  [6, 7, 8]])
>>> hoge = Standardization(x, axis = 0)
>>> standardized_data = hoge.transform()
>>> print standardized_data
array([[-1.22474487, -1.22474487, -1.22474487],
       [ 0.        ,  0.        ,  0.        ],
       [ 1.22474487,  1.22474487,  1.22474487]])
>>> np.mean(standardized_data[:,1])
0.0
>>> np.std(standardized_data[:,1])
1.0
transform ( )

標準化されたデータを返す

Return ndarray:

標準化されたデータ

Example:
>>> from utility.preprocess import Standardization
>>> import numpy as np
>>> x = np.array([[0, 1, 2],
                  [3, 4, 5],
                  [6, 7, 8]])
>>> hoge = Standardization(x, axis = 0)
>>> standardized_data = hoge.transform()
>>> print standardized_data
array([[-1.22474487, -1.22474487, -1.22474487],
       [ 0.        ,  0.        ,  0.        ],
       [ 1.22474487,  1.22474487,  1.22474487]])
>>> np.mean(standardized_data[:,1])
0.0
>>> np.std(standardized_data[:,1])
1.0
get_keynumber ( )

self.stdとself.avrの値を得る

Return ndarray:

入力データの標準偏差と平均

Example:
>>> from utility.preprocess import Standardization
>>> import numpy as np
>>> x = np.array([[0, 1, 2],
                  [3, 4, 5],
                  [6, 7, 8]])
>>> hoge = Standardization(x, axis = 0)
>>> hoge.transform()
array([[-1.22474487, -1.22474487, -1.22474487],
       [ 0.        ,  0.        ,  0.        ],
       [ 1.22474487,  1.22474487,  1.22474487]])
>>> std, mean = hoge.get_keynumber()
>>> print std
[ 2.44948974  2.44948974  2.44948974]
>>> print mean
[ 4.  5.  6.]
standardize ( x , axis=None )

データを標準化することにより、機械学習のパフォーマンスを向上させることができる。この関数は入力データを標準化、すなわち平均を0に、分散を1にする。

パラメータ:
  • x ( ndarray ) – 標準化するデータ
  • axis ( 0_or_1_or_None ) – どの軸に沿って標準化するかを決める。1ならそれぞれの行ごとに、0なら列ごとに標準化する。もしNoneなら、データ全体を対象にする。
Return ndarray:

標準化されたデータ

Example:
>>> from utility.preprocess.standardization.standardization import standardize
>>> import numpy as np
>>> x = np.array([[0, 1, 2],
                  [3, 4, 5],
                  [6, 7, 8]])
>>> standardized_data = standardize(x, axis = 0)
>>> print standardized_data
array([[-1.22474487, -1.22474487, -1.22474487],
       [ 0.        ,  0.        ,  0.        ],
       [ 1.22474487,  1.22474487,  1.22474487]])
>>> np.mean(standardized_data[:,1])
0.0
>>> np.std(standardized_data[:,1])
1.0
standardize_reverse ( x , axis=None )

標準化されたデータを元に戻す

パラメータ:
  • x ( ndarray ) – 元に戻すデータ
  • axis ( 0_or_1_or_None ) – Set (0 or 1 or None) which you set when you ran ‘standardization’ function.
Return ndarray:

元のデータ

Example:
>>> from utility.preprocess import Standardization,standardize,standardize_reverse
>>> import numpy as np
>>> data = np.array([[1, 2, 3],
                     [4, 5, 6],
                     [7, 8, 9]])
>>> standardized_data = standardize(data, axis = 1)
>>> standardize_reverse(standardized_data, axis = 1)
array([[ 1.,  2.,  3.],
       [ 4.,  5.,  6.],
       [ 7.,  8.,  9.]])