テレビのリモコンに話しかけるだけで見たいコンテンツを探すことができるAndroid TV™機能搭載ブラビア® 小学生から70歳までの方々を対象に音声検索認識精度の調査を実施

認識率は98.3%

ソニー ブラビア プロモーションサイトではAndroid TV™機能搭載ブラビア®の音声検索機能の
音声認識精度について調査を行った結果を本日公開いたしました。
ブラビアは多彩なコンテンツを快適にお楽しみいただくために、
2015年からAndroid TV機能を搭載しています。
テレビ放送や録画番組だけでなく、YouTubeやHuluなどのインターネット動画サービスも含め
膨大な量のコンテンツをテレビで視聴できる環境へと変わりつつあるなか、
見たいコンテンツをすぐに探し出せるよう、
テレビのリモコンに話しかけるだけで検索できる音声検索機能も搭載しています。

また、ブラビアをお使いいただいているお客様のテレビのネット接続率は64.4%
(2016年11月現在 ソニー調べ。対象モデル:2016年発売Android TV機能搭載ブラビア)と非常に高く、
ネットを接続して音声検索機能を含めた様々な機能を利用いただいています。
※音声検索機能を使うには、インターネット環境が必要です

今回の調査では、ブラビアでの音声検索がどれくらいの精度で認識されるのか、
イントネーション・話し方に違いのある小学生から70歳代までの56人に実際に
ブラビアの音声検索を使用してもらい、
音声認識精度を調べました。

主な調査結果

小学生から70歳代までの男女56人が同じ35ワードを発声した結果 認識率98.3%

  • 誰でもスムーズに音声検索操作ができました。
  • 発生音量に個人差はありましたが、音量による誤認識はありませんでした。(52db〜79db)
  • 発音が不明瞭になる傾向がある小学生でも、音声認識率は95.7%でした。

<世代別での音声検索認識率>

縦棒グラフ:この図は、縦軸に「パーセント」、横軸には「世代」の見出しがあり、各世代の検索認識が何パーセントだったかを比較している。9才以下、95.0%。10代、97.8%。20代、99.0%。30代、99.5%。40代、97.5%。50代、99.6%。60代、98.6%。70代、98.6%。

正しく認識しないケースとしては、読み方がゆっくりで単語と単語の間が空きすぎる場合に、全て話し終える前に検索が始まってしまうケース、また語尾の発声が不明瞭な場合に、誤認識してしまうケースがありました。

その他、わざと言い間違えた発声や、方言で話す方(関西4名、九州・博多4名、東北3名 計11名)に各地域の方言での発声も試してもらいました。

  • わざと言い間違えて発声しても補正されました。
    (「きんぴらごぼう」を「ちんぴらごぼう」と発声しても、すべての人で「きんぴらごぼう」と検索されました。)
  • 方言で話し言葉が違うケースでも正しく認識し、共通語と同じ検索結果が表示されました。
    博多出身の方が「今日雨降ると?」と発声しても検索結果に当日の天気が表示されました。
    関西出身の方が「めっちゃ可愛い動画見して」と発声しても動物の動画が表示されました。

「Android TV機能」とは
ブラビアが搭載するAndroid TV機能では、スマートフォンのように様々なアプリケーションをテレビにインストールすることができ、大画面でコンテンツを楽しむことができます。

<調査風景>

本調査の様子は下記URLにて動画でも公開しています。
https://youtu.be/YDrROlj4KIQ外部リンク

テレビで見られるコンテンツが、放送や録画番組に加え、さまざまな動画配信サービスも増加する中で、ブラビアの音声検索機能は、高い精度で音声を認識するとともに、コンテンツを横断的に検索できるため、見たいものにいち早くたどり着くことを可能にしています。

調査概要

調査方法

家庭でのテレビ視聴環境に近い状況での自然発声による音声検索の音声認識率を調査

調査日

2016年11月19日、20日

調査場所

東京都中央区

対象者数

56人(男性28名・女性28名 年齢は小学生から70歳代まで)

発声ワード

35個/1人あたり

  • 著名人の名前、映画/ドラマの作品名
  • 著名人名前とコンテンツの掛け合わせ(「タレント名 CM」「タレント名 ドラマ」など)
  • コンテンツ閲覧の指示ワード(「かわいい動物の写真見せて」「アルバムを開いて」など)
  • 一般的な会話に近い質問(「富士山の高さを教えて?」「アメリカの大統領は誰?」など)
  • 調べもの検索ワード(「チーム名 試合結果」「東京駅から横浜駅まで電車」など)

調査機関

ソニーマーケティング株式会社

調査機器仕様

  • 使用テレビ 「KJ-65X9350D」

調査環境

  • 騒音用スピーカー50dB
  • Wi-Fiアクセスポイント3台(※)
    詳細は下図

    ※音声検索機能付きリモコンと同じ周波数帯域を使用しているWi-Fiアクセスポイントを設置することで、より、最近の一般家庭に近い環境をつくり実験を実施

会場の広さ 32m²(19畳)図の上方に「ブラビア」、右上に「雑音」、中央付近に「対象者」、左下に「Wi-Fiアクセスポイント」があり、調査環境を表している。ブラビアは床から画面の最上部が120cm/画面下が40cm。ブラビアと対象者の距離は225cm。雑音と対象者の距離は200cm。雑音は対象者の位置で計測し50dB。
アンケートのお願い