目次
NTTの対話AI
「IoT “Internet of Things”」と「AI “artificial intelligence”」が私達の生活の中に浸透し、より豊かな生活が送れる世の中になりつつあります。スマートフォンはもちろん生活家電など多岐にわたります。
こうしたシステムにアクセスする方法との一つに対話がありますが、NTTは移動体(車など)で景色や周辺情報に基づいて雑談を行う対話AIを実現しています。
クルマなどの移動体から見える移り変わる景色を話題として、パートナーのように知識応答や共感応答をする対話AIを実現。常に自己位置が変化する状況下で、自己の周囲の景色やそこに紐づく情報に基づく雑談対話を行う対話AIは、世界で初めて実現された成果とのことです。
こんな感じです。(対話例)
ポイント
世界最大規模の対話データで学習した深層学習ベース対話モデルの利用
- 超大規模Web対話データ・高品質対話データと、近年進展が著しい深層学習技術を組み合わせることで、日本語最大規模の対話モデルを構築
自己位置周辺の景色画像・外部知識の同時導入
- 画像内の物体の情報と、自己位置周辺のスポット情報を大規模対話モデルに導入する技術を開発。画像内に写っている物体群については、物体検出と呼ばれる技術を用いて抜き出し、それぞれを大規模対話モデルで扱える数値情報(埋め込みベクトル)に変換して入力します。またスポット情報については、自己位置近傍のレストラン等のスポットに関する情報(ジャンル・名称等)をテキスト形式で取り出し、対話の文脈と同様の形式で入力します。大規模対話モデルはこれらの入力情報に基づき、それらを反映した対話AIの発話を出力します。
連続的に変化する画像情報に基づくリアルタイム対話制御
- ドライブ中の自己位置は逐次的・連続的に変化します。対話AIは、人がどの時点の画像やスポット情報を話題としているのかを理解しつつ、新規に入力された情報にも適切なタイミングで触れながら対話する必要があります。本成果では、対話文脈からの話題画像推定と、逐次的に入力される画像に対する発話の話題強度の推定技術を開発し、それらを適切にタイミング制御に組み込むことで、上記課題を解決しました。ユーザの発話に自然に応じながら、ユーザが強く興味を惹かれるであろう情報を適切なタイミングで提供する、新感覚のドライビング・パートナーとなる対話AIを実現しています。
居眠り運転・漫然運転の防止
今後の展開としてNTTは「日常的なドライブのパートナーをめざして、繰り返される対話への適用や、外部知識のさらなる利用に取り組みます。また、長距離運転時の居眠り運転・漫然運転の防止や、自由な会話で検索可能な音声ナビゲータの実現をめざし、実車・VR等での実証実験を進めて参ります。」としています。
せっかくなので、音声を好きな声優さんとかにできたら最高なんですけど、無理でしょうね。
昔、ナイトライダーというドラマがあったのですが、ナイト2000(車)の人工知能「K.I.T.T(キット)」を思い出しました。