Evolution Strategies
米非営利団体のOpenAIはロボット制御などに使う強化学習の手法として、「進化戦略*1」と呼ぶアルゴリズムが有望であることを明らかにした。従来の一般的手法に比べて多数のCPU(中央演算処理装置)を利用した並列処理がしやすく、短時間で学習できる。ヒュー…
米非営利団体のOpenAIはロボット制御などに使う強化学習の手法として、「進化戦略*1」と呼ぶアルゴリズムが有望であることを明らかにした。従来の一般的手法に比べて多数のCPU(中央演算処理装置)を利用した並列処理がしやすく、短時間で学習できる。ヒュー…