Evolution Strategies

OpenAI：強化学習に有望な"新"解法、並列化で学習高速に

米非営利団体のOpenAIはロボット制御などに使う強化学習の手法として、「進化戦略*1」と呼ぶアルゴリズムが有望であることを明らかにした。従来の一般的手法に比べて多数のCPU（中央演算処理装置）を利用した並列処理がしやすく、短時間で学習できる。ヒュー…