2011年4月の記事一覧

iPhoneアプリ「音声検索」

2011年4月14日 14:00

こんにちは、音声検索アプリ担当です。

3月16日に、Yahoo!ラボから、iPhoneユーザーが声で検索を行えるアプリ「音声検索」をリリースしました。
Yahoo! JAPANの、ウェブ検索をはじめとするさまざまなサービスから、音声認識による検索ができます。使い方、しくみなどをまとめましたので、ご紹介します。

■「音声検索」アプリの機能は?
iPhoneで検索したいとき、ふつうはソフトキーボードから検索したい言葉を入力します。このアプリを使ってマイクロホンから検索したい言葉をしゃべると、その声をアプリが自動的にテキストに直して検索を行って、その結果を画面に表示してくれます。

港区 天気」検索結果画面)
「港区 天気」検索結果画面

Yahoo! JAPANではウェブ検索だけでなく、画像や地図など対象を絞った検索サービスを用意しているので、このアプリでも画面左上の虫眼鏡ボタンを押して検索モードを選ぶことによって、目的をしぼった検索が行えます。

fig2.png
検索モード選択画面

ウェブ検索で使われる言葉はなるべく網羅できるように作っています。
また全国の住所や駅名なども含めるようにしているのでお試しください。

とくに「路線」モードを選んで、「東京から六本木まで」のようにしゃべると路線検索をしてくれるのは便利だと思います。「東京駅から六本木」のように「駅」をつけたり、「から」や「まで」を省略してもだいじょうぶです。あと「東京から六本木まで、終電」のように「始発」や「終電」も声で調べられます。

fig3.jpg
路線検索結果画面

■どんなしくみで認識しているのですか?
iPhoneに向かってしゃべると、その声をヤフーのサーバーに送って、そこで音声を認識して結果をテキストとしてiPhoneに送り返しています。
アプリではそのテキストを使って、ウェブ検索などを行い、検索結果を画面に表示しています。

サーバーでの音声認識は、あらかじめいろいろな検索でよく使われる言葉を「辞書」に登録してあり、iPhoneから受け取った声をその「辞書」に含まれている単語の組み合わせとして解釈します。ですから「辞書」に登録されていない言葉は正しく認識することができず、音が似ている別の単語に間違えてしまうことがあります。
また、とても珍しい言葉や急に新しく使われるようになってきた言葉は、辞書の登録が間に合わず、認識できない場合があります。サーバー側ではできるだけ新しい言葉の増加に追いつけるように定期的に辞書の更新を続ける予定です。

音声認識はまだ完璧な技術ではないので、きちんと発声しているにも関わらず、うまく認識されないこともあると思います。そのような場合は、口とマイクロホンの位置を少し変えて言い直してみると有効な場合があります。口が近すぎて音が割れてうまく認識されない場合や、逆に遠すぎて周囲の雑音を拾って間違えてしまうこともあります。
もう一つの注意点は、マイクロホンボタンを押してからしゃべりだすまでに時間が空くと、やはり周囲のしゃべり声や雑音で誤動作することがあります。
このような配慮をしていただいても「どうも正しく認識されない」という場合は、アプリ画面の右下のボタンを押して表示されるメニューから「誤認識を報告」というボタンを選んで押していただければ、サーバーのログに残るので、開発チームにて調査を行います(短期的に改善できるとまではお約束できませんが)。

■アプリ開発で苦労したことがあれば、教えてください。
ユーザーができるだけ簡単な操作で使えるようにデザインするのに試行錯誤も含めて苦労しました。

声で検索させるためには、iPhoneのマイクロホンから声を入力しなければなりません。
ユーザーの視点からはアプリを起動すると、アプリがつねにマイクロホンからの音を聞いていて、ユーザーが検索したい言葉をしゃべったら自動的に検索するのが望ましいのは言うまでもありません。しかし今の音声認識技術では四六時中まわりの音を受け付けて、そのなかからユーザーのしゃべった検索語だけを取り出すのは容易ではありません。まわりの人の話し声やテレビの音、BGMにも反応してしまい、使いにくいものになってしまいます。

そこでしゃべる直前にユーザーにマイクロホンボタンを押してもらって、それ以降の音だけを音声認識するようにしました。できるだけ検索結果の表示領域を減らさずに、かつiPhoneを片手で持った場合でも親指でボタンを押しやすいように、画面下中央の位置に配置しました。さらにしゃべる前だけボタンを押せば、しゃべり終わりはアプリが自動的に検知して録音を止めるようにしました。しかしまわりがさわがしい場所などではしゃべり終わりの自動検知が失敗することもあるので、終わりにボタンをもう一度押してもらうのが確実です。

マイクロホンボタンを押して、ユーザーの声を処理する準備ができたら画面に時々刻々マイクロホンから入ってくる音の波形を大きく表示するようにしています。この画面の波形の大きさはユーザーの声の大きさを表しており、声が大きすぎたり小さすぎたりしたときに、それに気がついてもらうのにも役立つことを期待しています。しゃべり終わった後でマイクロホンボタンをもう一度押してもらう場合に、押しやすいように逆三角形の吹き出し「入力終了」を大きく表示して、その吹き出しを押してもボタンを押したことになるようにしました。
もうひとつ画面中央上に小さくキャンセルのボタンが表示されています。これは通信状況が悪い場合などにサーバーからの応答がなかなか返ってこない場合に、一度キャンセルしてやり直せるように用意したボタンです。

fig4.png
波形表示&入力終了ボタン画面

マイクロホンボタンを押す代わりに、iPhoneを通話時のように耳に近づけると自動的に音声認識をはじめる機能も組み込みました。わざわざマイクロホンボタンを押さなくてもよいのと、周囲から見ると通話しているように見えるので、音声検索を使用する場合の気恥ずかしさを減らす効果もあるかもしれません。
さらに実験的な機能としてはiPhoneを軽くシェイクすると音声認識をはじめる機能も加えてみました。

fig5.png

このように複数の入力手段を用意することによって、自分にあった入力手段を選んで使い続けていただける助けになればと考えています。

■おわりに
音声による入力は携帯電話の新しい入力手段として今後ますますポピュラーになることを期待しています。
最初は気恥ずかしい気持ちや、誤認識が気になることがあると思いますが、使い慣れるとソフトウエアキーボードとはまた違った利便性が得られるものと信じています。
ヤフーでもひきつづき音声入力を利用していろいろなサービスやアプリをもっと便利にするべく努力していきたいと思います。

こんにちは、Yahoo!翻訳担当です。
本日、Yahoo!翻訳をリニューアルしました。

今回リニューアルのポイントは3つ。

1.翻訳できる言語数が、4か国語から9か国語に。
新たにフランス語・ドイツ語・スペイン語・ポルトガル語・イタリア語の欧州5言語を翻訳できるようになりました。
もちろん、英語・中国語・韓国語・日本語の翻訳もこれまで通り可能です。

※日本語→他国語、他言語→日本語の翻訳が可能です。

2. 自動言語判定機能を追加
テキスト翻訳で翻訳したい文章を入力すると、何語かを自動判定する機能をつけました。
trans_lang.png

3. 言語切り替えタブや再翻訳機能を追加
trans_box.png

■言語切り替えタブについて
日本語を他言語に翻訳した場合には、言語タブが表示されます。
言語タブで各言語をクリックすると、次々と翻訳先の言語を切り替え可能。
「○○語でなんていうの?」を簡単にしらべることができます。

■再翻訳機能について
「再翻訳」のリンクをクリックすると、翻訳結果の文章を、再度原文の言語に翻訳しなおすことができます。

trans_after.png

また、これまでもご好評をいただいている対訳ハイライト、クイック辞書機能も引き続きご利用になれます。
trans_popup.png
※対訳ハイライト、クイック辞書機能についての詳細はこちらから

これからもYahoo!翻訳をよろしくお願いいたします。

当ブログについて

Yahoo!検索スタッフブログは、Yahoo!検索の新しいサービスのお知らせ、検索データの分析レポート、検索関連の読み物コンテンツ情報などをお届けしています。

ブログ内を検索

ページのトップへ

ブログトップ > 月別アーカイブの一覧>2011年4月の記事一覧