Introduction

昨今, 画像認識や音声認識の分野において, 過去のデータから学習する技術は大きく進化しており, 写真の中に写っている物体を認識することや, 多言語間の翻訳等の認識性能を向上させた深層学習と呼ばれる手法が話題となっています. その性能は, 専門的な知見をもつ人間の能力と同等か超えている分野もある程です. 一方で, 人間は, データを与えなくとも自ら経験から学び, スキルを上達させることができます. 機械学習の中でも, このようなアプローチで試行錯誤をしながら行動を最適化する手法をとるものが強化学習(Reinforcement Learning)と呼ばれる分野です.

../_images/01-rl_intro.png

強化学習とは, 報酬を与えることで自動的に報酬を得るための最適入力を生成してくれる学習方法であり, 更に深層学習と組み合わせることで, 画像やセンサデータ等, 強化学習のみで適用できなかった高度な課題に対して, 取り組むことが可能となり近年注目されています.

近年では様々な文献がインターネット上に公開されていますが, これらを実ビジネスの課題に適用させ, 且つ, 強化学習の知識が浅い状態でゼロから実装しようとすると, 文献リサーチ等に時間が費やされてしまい, 結果的に取り組みたくても取り組めないのが現状だと考えています. そのような状況において, 少しでも実装が容易になり, 様々な人々が躊躇なく強化学習を取り組めるような仕組みを整えたいと考え, ReNomRL という API を提供することになりました.