renom.reinforcement package

class DAC ( actor_net , critic_net , action_space_size=None , state_space_size=None , batch_size=32 , g=0.99 , buffer_size=100000.0 )

ベースクラス: renom.reinforcement.reinforcement.Reinforcement

DDPG _[ref] クラス 連続値をアクションに取る強化学習を行う。

パラメータ:
  • actor_net ( Optimiser , Model ) – Actorとして使用するニューラルネットワーク
  • critic_net ( Optimiser , Model ) –
  • action_space_size ( int , tuple ) –
  • state_space_size ( int , tuple ) –
  • batch_size
  • g
  • buffer_size
class DQN ( q_network , action_space_size=None , state_space_size=None , batch_size=64 , g=0.99 , buffer_size=100000.0 )

ベースクラス: renom.reinforcement.reinforcement.Reinforcement

パラメータ:
  • q_nwtwork
  • action_space_size
  • state_space_size
  • batch_size
  • g
  • buffer_size