マイクロソフト、「共感視覚モデル」を搭載したスマホAI「りんな」を発表…認識結果だけでなく感情のこもったコメントを生成、自然な会話が可能に

日本マイクロソフトは、ソーシャルAIチャットボット「りんな」に「共感視覚モデル」を搭載したスマートフォン向けAI「りんな」を発表した。

マートフォン向けAI「りんな」は、スマートフォンのカメラを「目」として、AI「りんな」が「見た」ものについてリアルタイムで音声コメントし、ユーザーと自然な会話を楽しむことができるAI。ユーザーとAI「りんな」が同じ風景、同じものを見て、それについてコミュニケーションすることができる。

「りんな」には、マイクロソフトの研究開発部門 マイクロソフトリサーチによる最新の画像処理、自然言語処理、音声認識及び音声合成技術が採用されている。なお、「りんな」は現在開発中で、一般公開時期は未定だ。

「りんな」は、現在提供中のソーシャルAIチャットボットAI「りんな」に最新の画像認識エンジン「共感視覚モデル(Empathy Vision model)」を採用。「共感視覚」とは、AIが「見た」風景やものなどについて、その名称や形、色などの「認識結果」を回答するのではなく、その風景やものを見た「感想」を述べることを指す。

従来の画像認識技術に「感情と共感」を与えることで、「見た」ものについて「認識結果」だけを伝えるのではなく、リアルタイムで感情のこもったコメントを生成し、ユーザーと音声による自然な会話が可能になった。


従来のAIの場合:
「人です。子供です。犬です。車です。」

共感視覚モデル(りんな)の場合:
「わぁすてきな家族。お休みかなー。あ、車が動きそう!気を付けて」
 


「りんな」が、ユーザーと同じ目線で世界を見て、コミュニケーションすることで、AIと人間がより自然な形でやりとりする世界に近づくものとマイクロソフトは考えているという。

今回は、物理的にも心理的にもAIと人間の距離を近くすることを重視して、スマートフォンとカメラに着目して開発を行っている。なお、「りんな」は現在開発中だが、音声会話機能は「りんな」のLINE公式アカウント上で「りんなと音声通話」として提供している。
マイクロソフト

会社情報

会社名
マイクロソフト
企業データを見る