AIの最新論文を数式ゼロで要約するブログ

AI(機械学習/深層学習/強化学習など)の最新論文を数式や専門用語なしで解説するブログ

Microsoft:"気が利く"会話AI、場所や状況に即して情報提示

 米南カリフォルニア大学情報科学研究所(ISI)とMicrosoft Research(MSR)の研究チームは深層学習を応用して、場所や状況に応じて有用な情報を提供できる会話システムを開発した。ユーザーの発言に含まれる地名や商品名などを分析し、役に立つ関連情報を自然な会話文で返してくれる。音声アシスタントに使われる質問応答(QA)システムや、個人の好みに合った商品を提示するレコメンド技術の高度化につながる可能性がある。

論文

 A Knowledge-Grounded Neural Conversation Model, Ghazvininejad et al., arXiv:1702.01932, Feb 2017

研究の背景

 AlexaやSiri、Cortanaなどの音声アシスタントでは、人間の問いかけに自然で適切な応答ができる会話システムが欠かせない。特に近年は、深層学習を利用した研究開発が活発になっている。過去の大量の会話データをもとにニューラルネットワーク(コンピュータ内に仮想的に再現した神経回路網)の変数を調整し、優れた会話システムを作り出す手法だ。

 ただこの方法では、過去の会話データに含まれていない外部の知識やデータは参照することができない。このため会話文としては正確でも、ユーザーが本当に知りたい具体的な情報を提示するのが難しいという課題があった。

今回のポイント

 ISIとMSRの研究チームは深層学習を利用した会話システム*1を改良し、現在の文脈と関係の深い外部情報を参照できるようにした。

 例えば、あるユーザーが特定の飲食店に関する発言をした場合、位置情報に基づくSNSFoursquareからその店に関連した多数のコメントを抽出。ユーザーの発言に加え、発言と各コメントとの関連度を加味*2した上で、ニューラルネットワークが応答文を出力する*3

 これにより、自然で正確なだけでなく、場面や状況に応じて具体的に役に立つ情報の提示が可能になったという*4

応用可能性

 今回の成果は、QAシステムやレコメンド機能への応用が期待できる。外部の情報を応答文にどう反映するかを深層学習に担わせているため、データの量や種類が増えても人手による調整の手間がかからないメリットがある。

*1:SEQ2SEQ

*2:Memory Networkに似た仕組みを利用

*3:Multi-Task Learningを利用

*4:学習にはTwitterの会話データ2300万件とFoursquareのコメント110万件を使用した