今年に入ってから、急激に盛り上がりつつある音声アシスタント内蔵デバイス。スマートスピーカーを中心に、声で操作するインテリジェントな家電製品が人気を博しています。ソニーでは、音声アシスタント技術を駆使した、これまでにないコミュニケーションロボット『Xperia Hello!』を発表。その開発背景と狙いを、開発陣が語ります。
『Xperia Hello!』が
実現する3つの新体験
まずは「Xperia Hello!」がどういう製品なのかを教えてください。
- ソニーモバイルコミュニケーションズ株式会社
- スマートプロダクト部門 商品企画課
- 城井 学
城井:『Xperia Hello!』は、いわゆるコミュニケーションロボットというカテゴリーに分類される製品で、我々がここ数年Xperiaブランドで展開してきた「スマートプロダクト」の3製品目となります。一般的にこうした製品はユーザーの話し相手になるとか、役に立つことが基本機能となるのですが、『Xperia Hello!』はそれをさらに一歩先に進め、「家族の一員」となることを目指しました。ソニーはこれまでさまざまな製品をリリースしてきましたが、こうした“生きている(ように感じられる)もの”として価値を提供できる製品は本当に久しぶりですね。
『Xperia Hello!』ではどんな体験が得られるのでしょうか?
城井:『Xperia Hello!』には3つのキーフィーチャーがあります。1つはもちろん「コミュニケーション」。今までのスマートプロダクトである『Xperia Ear』は、“ハンズフリー”という新しいスタイルを提案し、『Xperia Touch』では“家族の集まる場所を新しく生み出すことで”コミュニケーションを変えてきましたが、『Xperia Hello!』では特に人とモノのコミュニケーションを変えたいと考えています。
ロボットがユーザーを認識して、向こうから能動的に話しかけてくるというのはユニークですよね。今、話題のスマートスピーカーは、基本的にこちらからの話しかけに対して動作するものでしたから。
城井:『Xperia Hello!』では、「家族の一員」となるために、人間が必要とした時だけ動作するのではなく、あたかも人間同士がやり取りしているような関係性を構築したいと考えました。話しかける頻度やタイミング、その空気を読むのはとても難しいところなのですが、今回はあえてそこにチャレンジしています。
話しかけてきてくれることでより自然なコミュニケーションができますし、買ってすぐは使うけれど、いつのまにか使わなくなってしまうという心配はなさそうですね。
城井:そのほか、誕生日などの記念日情報やスケジュール情報などをふまえて、家族間のコミュニケーションを促進・活性化させるといった機能も用意しています。テレビ電話やLINEのメッセージ送受信などにも対応しているので、幅広く、コミュニケーションのハブとしてご利用いただけます。
残る2つのフィーチャーについても教えてください。
城井:2つ目は「見守り」。LINEのメッセージ機能と連動させて、外から家の様子を知るということが可能です。外からスマートフォンで「家の様子を教えて」と聞くと、「15分前に学さんを見かけました」といったふうに、顔認識機能を使って把握した在宅者の名前を教えてくれるのです。さらに内蔵カメラを使った室内撮影にも対応。『Xperia Hello!』のおいてある部屋の状態を外にいながら写真で確認できるようにしています。普段使うことが多いLINEで確認できるのもポイントです。
そして最後の1つは人の顔を覚えて、その人に最適化された情報を提供する「インフォテインメント」機能。ニュースや交通情報など、その人に必要な情報を選んで提供する機能を備えています。お父さんが山手線で、お母さんが京浜東北線で通勤するのなら、山手線の遅延情報はお父さんにだけ伝えるといったイメージです。もちろんニュースは音声読み上げに対応。関連する写真を前面ディスプレイに表示することもできます。
『Xperia Hello!』が実現する3つの新体験 にいいね
“動き”が、モノを
「ある」から「いる」にする
- ソニーモバイルコミュニケーションズ株式会社
- スマートプロダクト部門
- エージェント企画開発室 室長
- 倉田 宜典
『Xperia Hello!』が企画された背景について教えてください。
倉田:2012年に対話型ソリューションのキーテクノロジーの1つである音声認識の技術に大きなブレイクスルーがありました。それまでスタンドアローンで処理していた音声認識が、クラウドを活用することで、携帯電話などでも利用できるようになったのです。これを活用すれば、かつてできなかった対話型ソリューションが実現できるのではないかということで、開発を再開。まずは腕時計型ウェアラブルデバイス『SmartBand Talk』のボイスコントロール機能などを実現してきました。
これまでのスマートプロダクト製品群も、そうした流れの中にありますよね。
倉田:はい。その上で、今回『Xperia Hello!』で重視したのが“動き”です。これは、かつてロボット開発をやっていたときから分かっていたのですが、人とのコミュニケーションにおいて、“音声”と同じくらい、“動き”が感じ方に大きな影響を及ぼすのです。モノが“動く”ことで、それが「ある」のではなく「いる」に変わる。そこにはきっと価値があるだろうと考えました。
そして、その“動き”は、ことコミュニケーションの分野においては「顔」と「目」に行き着きます。『Xperia Hello!』の開発段階では手のあるバージョンも試してみたのですが、そうした身振り手振り的な“動き”よりも、実はアイコンタクトできることの方が効果的なのです。ユーザーと目をあわせることで、あなたの話をちゃんと聞いていますよということが伝わりますし、目を見て「お帰りなさい」と言ってくれた方がうれしいですよね。
なるほど! 言われてみるとそうですね。
倉田:こうした現象を、いくつかの実証実験で確認できたので、『Xperia Hello!』はユーザーの顔を追いかけ、目を合わせて話してくれるものにしようと考えました。結果、最もシンプルな形状として、このかたちに行き着いたのです。
- ソニーモバイルコミュニケーションズ株式会社
- ソフトウェア開発5部
- エージェント技術開発課
- 石原 厚志
『Xperia Hello!』の“動き”で、こだわった点を教えてください。
石原:まずは静音性ですね。実際に動いているところを間近で見たことがある人には分かっていただけると思うのですが、ロボットってモーター音がうるさいんですよ。でも、それって、ロボットとの音声インタラクションにおいては非常に邪魔なんです。声がモーター音でかき消されてしまいますから。そこで『Xperia Hello!』では、ハードとソフトの双方を工夫することで、静かな動作音の実現を目指しています。
確かに、『Xperia Hello!』はモーターで動いているとは思えないほど静かですし、それでいて動きもキビキビしています。これはどのようにして実現したのでしょうか?
繁田:実際の開発においては、まずアクションの大きさに応じてギア比を決め、そこから細かなチューニングを行い、キビキビとした動きと静かな動作音という相反する要素を両立させることができました。
アクチュエーター以外の点で、静音化に貢献した工夫はありますか?
倉田:意外に思われるかも知れませんが、デザインです。実はこのシンプルな形状は極めて論理的なものなんですよ。例えば手足があると本体を動かした際に慣性が働いて、細かな動きの制御が難しくなるんです。モーターにパワーが求められますし、クルッと回して止めるだけでもギアに大変な負担がかかります。しかし、『Xperia Hello!』の場合は、回転軸線上に全ての要素がコンパクトに詰め込まれているので、こうした負担がかかりません。そして、これは故障率の低減にも貢献。一見、単純に見えるデザインなのですが、そこにはさまざまな意図が込められています。
“動き”が、モノを「ある」から「いる」にする にいいね
ソニーテクノロジーを結集して
「感情」を表現
そうして実現した滑らかな動作で表現するアクションについては、どのように作り込んでいったのでしょうか?
倉田:対話に必要な認識能力が、CPUやアルゴリズムの進化、クラウドやディープラーニングといった技術の登場で大きく伸長。その成果を上手く生かしながら、その状況に相応しい、かわいらしい、分かりやすいアクションを作り込んでいっています。専門のクリエイターに参加してもらい、ソニークリエイティブセンターも交えて、たった3個しかないモーターで、まるで生きているかのように感じられる“動き”を追求しています。
城井:具体的には、こういう気持ちの時には、こうした動きになるだろうということを、エンジニアが自分の身体で実演し(笑)、それをクリエイターが見て『Xperia Hello!』の動きに落とし込んでいくということを繰り返しています。喜んでいる時は上の方を向いて、ウキウキと顔を左右に振る、寂しい時は顔を下の方に向けてしょんぼりするなど、たくさんの動きを仕込みました……というか、現在進行形でまだ作り込んでいます。『Xperia Hello!』との付き合いが長くなっていくと、いろいろな動きを見せてくれるようになりますので、ご期待ください。
倉田:ユニークなものでは三三七拍子などもありますね(笑)。もちろん、ただ動きが面白いというのでは駄目。そこからユーザーとの新たなコミュニケーションが生まれていくことが理想です。
動きももちろんですが、ウインクなどといった目の動きもかわいらしいですよね。
繁田:はい、目にも動きと同じくらいこだわりました。実はこの目の部分には5灯×2のLEDが組み込まれていて、消す順番をコントロールすることで、さまざまな表情を創り出せるようにしているんですよ。単なるオン/オフではないんです。
倉田:目の表情がコミュニケーションにおいて大切だと言うことは、逆に言うと、それを1つ間違えると不気味に見えてしまうということでもあります。そこで、目の形状や、どのようにして表情を出すかなど、多くの点を試行錯誤しています。例えば、まばたきなどは非常に苦心したところ。当初はシャッターを上げ下げさせるなどという方法も検討したのですが、最終的には繁田のお話したよう、5灯×2のLEDを制御して表現するかたちとしました。パチパチッとした感じではなく、ふわっとした感じにしたかったんですよね。実はこれ、10年以上前からやりたかったことなので、今回やっと実現できてうれしく思っています。
ユーザーとの豊かなやり取りを実現するために活用している各種センサー類についても教えてください。
- ソニーモバイルコミュニケーションズ株式会社
- スマートプロダクト開発部
- システム1課
- 繁田 悠
繁田:『Xperia Hello!』には、4つの人感センサーと7つのマイクが内蔵されており、それによって、どの方向に人がいるか、どの方向から話しかけられたかを正確に判別できるようにしています。「ハイ エクスぺリア」と話しかけると、クルッと自分の方を向いてくれるのは、けっこう気持ち良いですよ。ちなみにこの7つのマイクは、最終的には工場で一つひとつチューニングするなど、とても手間をかけて精度を高めています。
また、自宅の見守りやビデオメッセージの撮影などで使う、頭部カメラもより広い範囲に動かせるよう、設計の限界に挑戦しています。具体的には、首左右120度・頭上下70度の2軸回転の中に信号を通すため、ケーブルの引き回しに伴う品質設計、屈曲耐久性のある構造作りに工夫しています。
石原:同様に、340度回転するベース部分に関しても、そこを通るケーブルの耐久性・品質をしっかり確保するように努めました。
城井:そのほか、温度・湿度センサー、照度センサーなど、置かれている部屋の状況を把握するための各種センサーが内蔵されています。こうした多種多様なハードウェアをコンパクトに実装するノウハウは、ソニーモバイルコミュニケーションズの得意とするところ。「Xperia」で培ってきた技術が惜しげもなく盛りこまれています。
ソニーテクノロジーを結集して「感情」を表現 にいいね
家族の一員として
『Xperia Hello!』を
迎えてあげてください
最後に、読者の皆さんにメッセージをお願いします。
石原:いちエンジニアとして、この『Xperia Hello!』に関われたことをとてもうれしく思っています。そして、この製品を通じて、ユーザーとロボットのコミュニケーションがどのように変わっていくのかがとても気になっています。僕らが予想だにしなかった使い方を見つけたら、ぜひ教えてください。期待しています。
繁田:内蔵マイクのチューニングなど、『Xperia Hello!』はハードウェア面でも多くの苦労がありました。まるで生き物のように動く『Xperia Hello!』ですが、その裏のエンジニアたちの頑張りを知っていただけると報われます。
倉田:こだわりの“動き”など、体験した方に、「『Xperia Hello!』とのコミュニケーションは楽しい!」と思っていただけるようなものに仕上げた自負はあります。そして、これを見た他社さんから、同コンセプトの製品が登場してくることを密かに期待(笑)。「この方向、アリだよね」と思ってくれるライバルが現れたらむしろうれしいですね。
城井:これまでにない新しいコミュニケーションのかたちを提示したいという気持ちに突き動かされて『Xperia Hello!』を開発してきました。そして、長い開発時間を経て、いよいよ、この秋、市場に投入。ぜひ、新しい家族の一員として『Xperia Hello!』を迎えていただければと思います。よろしくお願いいたします。
家族の一員として『Xperia Hello!』を迎えてあげてください にいいね
ソニーショールーム・
直営店舗ソニーストアでの展示紹介
ソニーの直営店舗・ソニーストアでは、実際に商品を体感いただけます。