強化学習

スタンフォード大：映像から“次の場面”を予測、強化学習と深層学習を活用

強化学習 GAN 逆強化学習 CNN

米スタンフォード大学と台湾の国立清華大学は、映像に映っている内容から次の場面を予測できる技術を開発した。強化学習の一手法である「逆強化学習*1」を応用し、正解となる映像を模擬できるように学習する。連続的に変化し、かつ複雑な*2映像データを扱う…

強化学習 Evolution Strategies

米非営利団体のOpenAIはロボット制御などに使う強化学習の手法として、「進化戦略*1」と呼ぶアルゴリズムが有望であることを明らかにした。従来の一般的手法に比べて多数のCPU（中央演算処理装置）を利用した並列処理がしやすく、短時間で学習できる。ヒュー…