Facebook：機械翻訳を10倍高速に、「CNN」採用で計算並列化 - AIの最新論文を数式ゼロで要約するブログ

　Facebook AI Researchは、深層学習による機械翻訳を大幅に高速化できる手法を開発した。自然言語処理で一般的に使われるRNN（再帰型ニューラルネットワーク）の代わりに、画像認識などで主流のCNN（畳み込みニューラルネットワーク）を利用する。複数の計算を並列して処理できるため、従来より約10倍の速度かつ高精度で翻訳文の生成が可能になる。

論文

　Convolutional Sequence to Sequence Learning, Gehring et al., arXiv:1705.03122, Jul 2017

研究の背景

　深層学習を使った機械翻訳や文章要約のシステムは、ある文章をニューラルネットワーク（コンピューター内に仮想的に作った神経回路網）に入力すると、別の文章に自動的に変換して出力する。入力文を読み込んで処理*1したり、出力文を生成*2したりするのには通常、RNNというタイプのニューラルネットワークが使われる。ただ、RNNは文章中に含まれる単語を1つずつ順番に処理するため、計算が遅くなる課題があった。

今回のポイント

　Facebookは今回、RNNを使わず、CNNという別タイプのニューラルネットワークで文章の変換や出力ができる仕組みを考案した。CNNは主に画像に写った物体の認識などに使われており、複数の処理を同時に実行しやすい特徴がある。研究チームはこの強みを生かし、翻訳や要約に不可欠な文脈の把握を効率的に実行できるようにした。入力文の語順に関する情報も利用する*3などの工夫も加えた。

　新手法は、英語からドイツ語、英語からフランス語への翻訳精度でGoogleなどの性能を上回った。未知の文章を翻訳するのにかかる時間は約10倍短くできた。

応用可能性

　今回の手法は、文章の要約など自然言語処理を利用する他の応用分野でも、効率よく精度の高い結果を得るのに役立つ可能性がある。

*1:Decoderの役割

*2:Encoderの役割

*3:Attentionで利用する