強化学習
米スタンフォード大学と台湾の国立清華大学は、映像に映っている内容から次の場面を予測できる技術を開発した。強化学習の一手法である「逆強化学習*1」を応用し、正解となる映像を模擬できるように学習する。連続的に変化し、かつ複雑な*2映像データを扱う…
米非営利団体のOpenAIはロボット制御などに使う強化学習の手法として、「進化戦略*1」と呼ぶアルゴリズムが有望であることを明らかにした。従来の一般的手法に比べて多数のCPU(中央演算処理装置)を利用した並列処理がしやすく、短時間で学習できる。ヒュー…