3.7.8.1. renom.utility.preprocess.binarizer package

class Binarizer ( neg_label=0 , pos_label=1 , single_dim=True )

ラベル付けられたデータをencodingする。

パラメータsingle_dimがTrueの時はラベルは自動的に数えあげられ、各次元が対応する整数を含んだ1次元ndarray[n_sample]が返される。そうでない場合は各行がone-hot vectorとなるような2次元ndarray[n_sample][n_label]が返される。

パラメータ:
  • neg_label ( int ) – 対応しないラベルの位置がこの値になる。
  • pos_label ( int ) – 対応するラベルの位置がこの値になる。
  • single_dim ( boolean ) – transformメソッドの出力の形を制御する。
Example:
>>> from renom.utility.preprocess import Binarizer
>>> lb = Binarizer(single_dim=True)
>>> x = ['foo', 'bar', 'foo']
>>> lb.register_labels(x)
>>> lb.transform_dict
array(['bar', 'foo'],
      dtype='|S3')
>>> lb.binarize(x)
array([[ 0,  1],
       [ 1,  0],
       [ 0,  1]])
>>> x = [100, 2000, 40, 2]
>>> lb.transform(x)
array([[ 0,  0,  1,  0],
       [ 0,  0,  0,  1],
       [ 0,  1,  0,  0],
       [ 1,  0,  0,  0]])
>>> lb.transform_dict
array([   2,   40,  100, 2000])
register_labels ( x )

内部辞書にラベルを登録する。

パラメータ: x ( array ) – ラベルの1次元配列またはシーケンス
戻り値: self
Example:
>>> from renom.utility.preprocess import Binarizer
>>> lb = Binarizer()
>>> lb.register_labels(['RNN', 'CNN', 'GAN', 'RNN'])
>>> lb.transform_dict
array(['CNN', 'GAN', 'RNN'],
      dtype='|S3')
binarize ( x )

入力を内部の辞書を使ってencodingする。

パラメータ: x ( array ) – ラベルの1次元配列またはシーケンス
Return ndarray:

エンコードされた入力

Example:
>>> from renom.utility.preprocess import Binarizer
>>> lb = Binarizer()
>>> x = ['RNN', 'CNN', 'GAN', 'RNN']
>>> lb.register_labels(x)
>>> lb.transform_dict
array(['CNN', 'GAN', 'RNN'],
      dtype='|S3')
>>> lb.binarize(x)
array([2, 0, 1, 2])
transform ( x )

自動でラベル抽出とエンコードを行う。

パラメータ: x ( array ) – ラベルの1次元配列またはシーケンス
Return ndarray:

エンコードされた入力

Example:
>>> from renom.utility.preprocess import Binarizer
>>> lb = Binarizer(single_dim=True)
>>> lb.transform(['Python', 'Go', 'Ruby', 'Python', 'Ruby'])
array([1, 0, 2, 1, 2])
>>> lb = Binarizer(neg_label=-1, pos_label=2, single_dim=False)
>>> lb.transform(['Python', 'Go', 'Ruby', 'Python', 'Ruby'])
array([[-1,  2, -1],
       [ 2, -1, -1],
       [-1, -1,  2],
       [-1,  2, -1],
       [-1, -1,  2]])
reverse ( y )

binarizeメソッドの逆関数

パラメータ: y ( array ) – transformメソッドの出力
Return ndarray:

内部辞書を元にデコードされた入力

Example:
>>> from renom.utility.preprocess import Binarizer
>>> lb = Binarizer()
>>> x = lb.transform(['polymorphism', 'type operator',        ...     'polymorphism', 'dependent type'])
>>> x
array([1, 2, 1, 0])
>>> lb.reverse(x)
['polymorphism', 'type operator', 'polymorphism', 'dependent type']
get_params ( )

パラメータを返す。

Return dict: parameters
Example:
>>> from renom.utility.preprocess import Binarizer
>>> lb = Binarizer(neg_label=-10, pos_label=3, single_dim=False)
>>> lb.get_params()
{'neg_label': -10, 'pos_label': 3, 'single_dim': False}
set_params ( **params )

パラメータを設定する

パラメータ: params ( dict ) – セットされるパラメータ
Example:
>>> from renom.utility.preprocess import Binarizer
>>> lb = Binarizer()
>>> lb.get_params()
{'neg_label': 0, 'pos_label': 1, 'single_dim': True}
>>> lb.set_params(neg_label=-2)
>>> lb.get_params()
{'neg_label': -2, 'pos_label': 1, 'single_dim': True}
binarize ( x , transform_dict , neg_label=0 , pos_label=1 , single_dim=True )

label binarizer

パラメータ:
  • x ( array ) – ラベルの1次元配列
  • transform_dict ( ndarray ) – 各エントリがラベルである配列
Return ndarray:

エンコードされた入力

Example:
>>> from binarizer import binarize
>>> x = ['SVM', 'SVM', 'RVM', 'L1VM', 'RVM']
>>> tdict = ['L1VM', 'SVM', 'RVM']
>>> binarize(x, tdict, neg_label=-2, pos_label=3, single_dim=False)
array([[-2,  3, -2],
       [-2,  3, -2],
       [-2, -2,  3],
       [ 3, -2, -2],
       [-2, -2,  3]])
reverse_binarize ( x , transform_dict , neg_label=0 , pos_label=1 , single_dim=True )

関数binarizeの逆関数

パラメータ:
  • x ( ndarray ) – 関数binarizeの出力
  • transform_dict ( ndarray ) – 関数binarizeで使用した辞書
Return ndarray:

デコードされた入力

Example:
>>> from binarizer import binarize, reverse_binarize
>>> x = ['tanh', 'sigm', 'relu', 'relu', 'tanh']
>>> tdict = ['tanh', 'sigm', 'relu']
>>> y = binarize(x, tdict)
>>> y
array([0, 1, 2, 2, 0])
>>> reverse_binarize(y, tdict)
array(['tanh', 'sigm', 'relu', 'relu', 'tanh'],
      dtype='|S4')