AIの最新論文を数式ゼロで要約するブログ

AI(機械学習/深層学習/強化学習など)の最新論文を数式や専門用語なしで解説するブログ

米NY大とFacebook:学習しやすい「GAN」、新規アルゴリズムを開発

 米ニューヨーク大学クーラント数理科学研究所とFacebook AI Researchは、深層学習の一手法であるGAN(敵対的生成ネットワーク)を学習しやすくする新たなアルゴリズムを開発した。通常のGANとは異なり、「ワッサースタイン距離*1」と呼ばれる指標を最小化するように学習を進める。同指標を使うと従来に比べて学習結果を改善するための方策を検討しやすくなるうえ、学習が安定する。

論文

 Wasserstein GAN, Arjovsky et al., arXiv:1701.07875, Dec 2017

研究の背景

 GANは本物の写真と見分けのつかない画像などを生成できる深層学習の重要技術だ。実際のデータがある確率分布から生成されていると考え、その確率分布を再現するようなニューラルネットワーク(コンピューター上に作成した仮想的な神経回路網)を学習を通じて構築する。ただ、学習がうまく進んでいるかを的確に測る指標がないなど、実用上の課題が残されている。

今回のポイント

 研究チームは今回、ニューラルネットワークが作る確率分布が実際のデータを生成している確率分布とどの程度近いかを測る手法として、「ワッサースタイン距離」と呼ばれる指標を採用した。ワッサースタイン距離は、学習の収束性など複数の数学的な性質が従来のGANで利用する指標よりも優れていることが理論的に示せる。

 ワッサースタイン距離を使ってGANを学習する新たなアルゴリズムを開発した。実際に画像生成に応用してみたところ、同指標が改善するにつれて人間が目で判断した画像の質も改善する傾向が確認できた。これにより、学習結果を改善するための戦略が立てやすくなる。さらに、通常のGANでよくみられる学習失敗に結びつく現象*2も大幅に低減できた。

応用可能性

 研究チームは新技術をWGAN(ワッサースタインGAN)と名付けた。GANは画像や動画の生成をはじめ幅広い応用が期待されている分野であり、WGANはその学習を円滑にできる技術として有望視される。

 

*1:WassersteinまたはEM(Earth Mover) Distance

*2:具体的にはmode collapse