2009年3月の記事一覧

Yahoo!検索ProjectのMです。

このYahoo!検索スタッフブログでは、Yahoo!検索Projectのスタッフが参加するイベントを随時ご紹介していますが、今回は異色イベントのお知らせです!

そのイベントとは......創る心とおもてなし― 第1回 Webエンジニア料理対決! ウェブサービスも料理も「創造力」と「おもてなしの心」は同じというコンセプトのもと、なんとエンジニアによる料理対決が開催されます。

参加チームは、クックパッド株式会社様、リクルート メディアテクノロジーラボ様、そしてYahoo! JAPAN。主催は株式会社技術評論社様、クックパッド株式会社様です。ライス大盛り、という感じのイベントになること間違いなしです!

開催日時は、3月27日(金)の19時から22時30分(予定)まで。受付開始は18時30分からです。参加ご希望の方は、お申し込みフォームからお申し込みください。第一部は料理対決と試食、第二部は各チームによるライトニングトークとフリーディスカッションが予定されています。

おなかと探究心をともに満たせるこのイベント、ぜひ奮ってご参加ください!

Yahoo!検索Project、企画の岡本です。

と、参加予定のイベントをお伝えしてきましたが、もう一つ新たに参加予定のイベントを紹介します。

「現代日本語書き言葉均衡コーパス」の公開ワークショップ(研究成果報告会)が、3月14日(土)から3月16日(月)にかけて、東京工業大学の大岡山キャンパスで開催されます。

「現代日本語書き言葉均衡コーパス」には、Yahoo! JAPANもYahoo!知恵袋の投稿データ(知恵袋コーパス)の提供という形で協力させていただいている関係上、Yahoo!検索スタッフも参加します。Yahoo!検索スタッフが参加するのは、

の2日間で、「Yahoo!知恵袋コーパスのこれから-さらなる研究支援のために-」と題したポスター発表を予定しています。

このワークショップの中でも、

  • 白井勢津子「Yahoo!知恵袋における『です』を用いた引用表現」
  • 秋山智美「接尾辞型敬称の使用例とその分布-Yahoo!知恵袋から-」
  • 杉本武「Yahoo!知恵袋にみる非規範的表現」

と、Yahoo!知恵袋を対象や材料にした研究発表があるように、知恵袋コーパスはさまざまな分野の研究者にご利用いただいています。今回はこのように幅広くご利用いただいている知恵袋コーパスのより便利で有用な活用方法を探るため、ご参加の皆さまに幅広くご意見をうかがいたいと考えています。

また会期中は知恵袋コーパスに留まらず、日本語にかかわるさまざまな話題や研究に接する機会ですので、ぜひ大勢の方にご来場いただけますと幸いです。

なお、参加は事前受付制となっています。ご参加いただける方は、参加お申込より手続きをお願いします。

参考:

Yahoo!検索Projectの牧本です。

3月2日から5日にかけて、鳥取大学鳥取キャンパスで開催された、国内最大の自然言語処理に関する会議である言語処理学会第15回年次大会 (NLP2009) に参加しました。


このスタッフブログの1月14日の記事でお知らせした通り、今年はYahoo! JAPANもNLP2009に協賛しています。
そこで、今回は本会議の期間中、会場内にYahoo! JAPANのブースを設置させていただき、Yahoo!デベロッパーネットワークYahoo!知恵袋データ公開についての紹介をさせていただきました。
多くの方に来場いただき、自然言語処理研究者の観点からの感想や要望などをいただきました。Web APIのウェブサービス開発での使い方と自然言語処理研究での使い方の違いなど、貴重な知見を得ることができました。いただいたご意見は今後のサービスやデータ公開に反映させていきたいと思います。

Yahoo! JAPANのブース


また、私自身は、奈良先端科学技術大学院大学の小町守さん、Yahoo! JAPAN研究所の颯々野学との共同研究の成果を「ブートストラップを用いた検索クエリログからの意味カテゴリ獲得の分析」という題目で発表しました。
ポスターセッションでの発表だったのですが、約2時間、休む間もない程多くの方々に足を運んでいただき、有意義な議論をさせていただきました。
普段、自分たちが行っている研究開発について社外の方の意見を聞くことが少ないわれわれにとって貴重な機会となりました。

ポスターセッション


懇親会では地元のビールやワイン、日本酒が(たくさん!)出され、学生の皆さんや企業や大学の研究者の皆さんと楽しく情報交換ができました。

懇親会


ちなみに、学会の地方開催の醍醐味(だいごみ)として、観光も(ちょっとだけですが)してきました。今回、どうしても鳥取砂丘に行く時間が取れそうになかったので、会議が始まる前の朝7時に一人ホテルを出てタクシーで砂丘に行き、砂丘に登っている途中に水を吸った砂に足を取られて転んでしまいました。
もし、3日目の会場で砂だらけで疲れている人物を見かけた方がいらっしゃったら、その人物は私です。

鳥取砂丘鳥取砂丘


ということで、今回はNLP2009の参加報告をさせていただきました。
3月は、NLP2009のほかにもさまざまな学術イベントでYahoo! JAPANのスタッフが参加します。参加される方はぜひ会場で声をおかけください。

参加予定のイベントは順次、ここで紹介していきますが、当面では、

3/16(月):セマンティックWebコンファレンス2009

への参加を予定しています。

こんにちは、検索ランキングのイケミーです。

お待たせいたしました、前回の記事から時間が空いてしまいましたが、その2をお届けしたいと思います。こちらの記事は2月12日に配信した記事「「続きはウェブで!」の最強キーワードを探せ! その1」の続きになります。未読の方は先にそちらの記事をごらんのうえ、お読み下さい。では!

*****以下続き*****

ならば、「タダ動.com」はどうでしょうか。いかにもネットっぽいキーワードで良いように思えますが......
タダ動.com
やっぱり、これもおススメできません。

おススメできない理由
ドメイン用語を使用している

まずはこちらをご覧ください。とあるD社が実際に用いた「○○○.com」というキーワードに関する検索推移グラフです。

「○○○.com」というキーワードに関する検索推移グラフ

グラフを見ていただければ、言いたいことは一目瞭然(いちもくりょうぜん)ですね。そう、ユーザーは「●●.com」ではなく、.comを省略した「●●」で検索してしまう傾向にあるようです。さらにこれは.comに限らず、「●●.jp」や「●●.tv」などといった時にも同様に省略キーワードのほうが本家キーワードより検索される傾向にあります。つまり、多くのユーザーにとって「.com」や「.jp」というのは、検索する際の絞り込み要素として重要視されていない(もしくはネット言語での句読点的な扱い?)と思われます。
その理由として、.comや.jpが付く企業などの多くを、それを付けなくても検索できるという認識が多くのユーザーの無意識下にすでにあるからだと推測されます。感覚としてつい外して検索してしまうということですね。


あれもダメ、これもダメ。じゃあどうすればいいのか。もう「Yahoo! CM」でいいんじゃないだろうか......
Yahoo! CM
一見投げやりなこのキーワード、問題外と思った人もいるかもしれませんが、しかし実は以外と侮れないのです。

おススメできな......くもない理由
「●● CM」を侮るな

すでにキーワードという感じではないこの組み合わせ、しかし場合によっては皆さんが思っているよりも検索数を伸ばすのです。ここも実例で紹介しましょう。E社が表示したあるキーワード、ちょっと長めかつ短文だったせいでしょうか、以下のグラフのような減少が起きてしまいました

E社が表示したあるキーワードのグラフ

1が「キーワード」、2が「●●(会社名) CM」、そしてさらにその上を行く検索ワードがあり、それが3の「●●(会社名) ○○(タレント名)」だったのです。そう、このCMの場合、超有名タレントを起用していたうえに、ネットでオリジナル動画を配信していたため、それを目的としたユーザーがキーワードではなく直接会社名やタレント名との組み合わせに流れてしまっていたのです。このように、CMの内容やキーワードによっては、ユーザーが独自の近道を模索してくる可能性を考える必要が出てくるということです。
では、表題のように「●● CM」でキーワードをつければ誘導問題はすべて解決かというとそうもいかないようです。注意しなければいけないのが、「●● CM」の組み合わせ、単純にCM映像を見たいというユーザーと区別することが出来ないということです。それの裏づけとして「●● CM」の検索が増える場合、CMそのものが話題であったり、CMに人気のアイドルやタレントが出演していることが多い傾向にあります。そのため、キャンペーンサイトなどの集客効果を正確に測るには、この言葉はやはり使い勝手が悪いということがいえます。
また逆に、普通のキーワードを設定した場合でもCMの内容によっては「●● CM」や「●● タレント名」などの組み合わせにも注意を払っておく必要があるともいえるでしょう。


さらに......と行きたいところですが、このようなおススメできないと思われるキーワードの例というのはまだまだたくさんあり、そればかり書いていると記事が終わってしまうのでひとまずキーワードの側面からのアプローチはここまで。次に放送内容とその検索履歴を照らし合わせて考えてみましょう。

これはあるキーワードの一日の検索数推移グラフと、そのキーワードを放送したCMの放送時間を重ね合わせてたものです。

あるキーワードの一日の検索数推移グラフとそのキーワードを放送したCMの放送時間を重ね合わせてたもの
グラフは一分単位のものです。時間に若干の誤差はあると思われますがCMの放送と同時、もしくは1~2分のうちに検索が上昇し、そして、急激に収束していることがわかります。
さらに、CM放送時間帯以外も山は小さいですが満遍なく検索され続けいていることもわかります。

CM放送直後に1分とたがわず急激に検索が増えるということは、パソコンとテレビが両方つきっぱなし、もしくはパソコンでテレビを見ているなど、常にパソコンを使用できる状態になっている人の存在を示しています。CMをみてパソコンを立ち上げネットにつないでから検索をする人の方が多いのならば、軸はもう少し放送タイミングからずれてもおかしくありません。

そして針山型のグラフ。これはキーワード型CMでよく見られるグラフです。ここの特徴として、パソコンがすぐに使えて即検索行動を取った人以外の動きが意外と小さいということがわかります。平たく言えば、「CMでキーワードをみてテレビ視聴を中断し、パソコンを起動して検索する」といった行動を取る人が少ないということです。もしそのような行動ならば、グラフの形はなだらかに収束、もしくは他時間帯よりもグラフは高位で推移するはずです。

では、「続きはWebで」方式のCMはすぐにネットにつなげる状態の人以外への訴求力がないのか? という疑問がわきますが、決してそんなことはありません。
針山の頂点から5分後までを即検索派とし、それ以外の時間帯との検索数合計比率を比較すると、

即検索派とそれ以外の時間帯との検索数合計比率の比較

と、放送直後よりも、それ以外の時間帯の検索数合計のほうが比率が格段に高いことがわかります。つまり、「このCMのキーワード気になるな。あとでパソコンを使う時にでも調べてみるか」という人たちが多くいるということです。もちろん、CM以外に新聞やネット広告、ブログやネットニュースで話題になっている事も考えられますので、なかなかテレビCM即検索派とそれ以外には分けにくいのですが、あとから検索派はほとんどの検索履歴において大勢を占めていることはかわりません。
そこで、前述してきた覚えやすいキーワードが大切になってくるわけです。

次に、とりあえずキーワードを表示するタイプのCMを100本みて、その傾向を分析してみました

まずキーワードの表示位置ですが、下のような分布になりました
キーワードの表示位置
※画面を9分割したエリアにわけ、それぞれのエリアに最も近いと思われる位置でカウント

表示場所としては圧倒的に中央下、そして続いて中央、右下が多いようです。この3つの合計で全体の88%を占めていました。また、手元にある300のキーワードリストの平均文字数は6.07(記号などすべて1文字として計算)文字。最短が2文字、最長では13文字以上というものがありました。

表示タイミングは
表示タイミング

と、CMの最後に流すのが定番のパターン、最後直前というのは、ほとんどがキーワードの表示後に企業ロゴを流すパターン。また今回の調査ではカウント対象になっていませんが、CMの間中ずっと表示されているものや、頭と最後2回表示するという珍しいものも確認しました。

つまり、最も平均的な「続きはWebで」型のキーワード表示例は

CMの最後に画面中央下に6文字のキーワードを表示する

となります。このほか重要な要素としてキーワード表示時間やサイズ、キーワードの読み上げの有無、サイト内容の紹介の有無などがあげられますが、計測が大変なので省略。

さて、これを個別に分析していきたいのですが、ここからは私がそれぞれのキーワードと検索履歴を随時チェックしながら得た感想的な考察になりますので、その点ご留意ください。

まず表示位置ですが、見ている人にとってはキーワードはいつどのタイミングで、どこに出てくるかわからないため、私がチェックしている時も表示時間内にキーワードを完全に確認できないことがありました。映画の字幕は1秒で最大4~5文字という制限があると聞いたことがありますが、字幕の場合はほとんどの場合画面下部に表示されるという共通認識があるため、目線の準備などが出来ていて、非常に読みやすいのですが、CMキーワードはどこに表示されるかわからないので、映画字幕などよりも文字を見失いがちです。
表示時間が1秒未満というものも珍しくなく、キーワードの読み上げがない場合だと、もはや先ほど映ったキーワードを正確に思い出せずお手上げ状態になってしまうことがあります。
さらに、大きなテレビで見ることを前提にしているのでしょうか、パソコン画面でCMを確認した時などはキーワードがつぶれて見えないこともよくありました。検索ボックスのイラストの中にキーワードを書くというのは定番の手法ですが、その枠のせいで中の文字が必要以上に小さくなっていると感じられたものも散見されました。
また、表示位置が左上などの定番箇所以外に映る場合も虚を付かれた感じになりました。

文字数の平均は6文字でしたが、表示時間に制約のあるテレビCMではこれぐらいの文字数が限度だと思われます。あとで検索する派の多さや、文字数が長くなればなるほど誤検索が増えるということからも、覚えやすさを重視したキーワード設定が大事になると思われます。キーワードと一緒にURLを記載している例も見受けられましたが、覚えることはできませんでした。

また、これも非常によく見かけたパターンですが、キーワードと一緒に非常に多くの情報を一画面に表示している場合があります。一緒に表示されがちな内容としては、商品名、キャンペーン内容、URL、注意書き(※ただし~のようなもの)、キャンペーン期間、企業ロゴなどで、さらに画面端で有名人が手を振っている場合などもあり、どこを見ていいかわからないことがあります。とても数秒で把握できる情報量ではなく、誘導キーワードを散逸しがちです。

表示タイミングはほとんどがCMの最後で、クリック音やクリックアニメーション、なかにはテキストのタイピングから変換までをアニメーションさせているものなどもあり、インターネットでの検索を促してる様子が伺えます。表示時間が極端に短く、かつキーワードの読み上げのないものは総じて検索数の伸びが悪いという印象です。

しかし、たくさんのキーワードと履歴の反応を見比べる中で、一番感じることは、検索させるメリットを訴求していない場合は総じて検索数の伸びが悪いということです。
非常に典型的な例として、キーワードとともに「詳細はWebで」「詳しくはホームページで」とテロップや音声で添える場合がありますが、ほとんどの場合、検索として結びつかないことが多いようです。おそらくですが、多くの人にとって、「キーワードで検索する=詳細が掲載されている」というのが当たり前のことだと浸透しているのではないでしょうか。ネットで商品名を検索する場合は詳細が知りたい場合がほとんどですので、改めて「詳細はウェブで」といわれなくても、ユーザーとしては検索の衝動喚起につながっていない可能性があります。

同様に「特設サイトオープン」「限定サイト公開中」などあいまいなものも検索反応は薄いです。それよりも「限定オリジナルレシピを公開」「今なら壁紙公開中」「サイトで肌チェック」など、たとえ些細(ささい)なことでも訪れるメリットをこちら側から提示しないと、履歴として現れるリアクションはなかなか出てきません。また、例えば「○○の秘密」「○○の真実」など検索キーワードそのものを訴求のきっかけとして使う場合も見られますが、CMの内容によりうまくいく場合と行かない場合があるようですので、使い方には注意が必要だと思われます。

以上により、CMの表示の仕方としておススメできないパターン

画面上部に、キーワードが8文字以上あり表示時間は1秒未満、画面内はさまざまな要素であふれ、小さいテレビでは見づらい文字の大きさ、キーワードの読み上げがなく、サイトの具体的要素を言わず、前述のおススメできないキーワード例に引っかかっている

この場合、まず間違いなくキーワードをきっかけとした検索はされないでしょう。

キーワードの面、表示方法と検索履歴の反応の面からの検証を得てこれですべてOK......かというと、いやいやまだ大切なことがあるのです。

それは......(続きはさらに次号で!)

Yahoo!検索Project、企画の岡本です。

以前に紹介した「セマンティックWebコンファレンス2009」と日程が前後しますが、引き続きイベント参加予定のお知らせです。

データ工学と情報マネジメントに関するフォーラム(DEIM2009)が、3月8日(日)から3月10日(火)にかけて、静岡は掛川のヤマハリゾートつま恋で開催されます。

このフォーラムでは、主に若手の研究者や大学院生・学部学生を中心にして実に約250件の研究発表が行われるほか、趣向をこらしたさまざまなセッションが企画されています。

今回はそのセッションの一つであるBoFセッションにて、「Web企業における研究・開発の『これまで』と『これから』」を行います。

  • 発表者(話題提供):
  • 稲垣陽一(きざしカンパニー)
  • 公野昇(Microsoft Research Asia)
  • 森正弥(楽天技術研究所)
  • 岡本真(ヤフー株式会社/京都大学)

すでにフォーラムそのものの参加申し込みが締め切られていますが、参加申し込み済みの方はぜひご参加ください。どなたでもご発言いただけますので、お気軽にご参加いただけますと幸いです。

当ブログについて

Yahoo!検索スタッフブログは、Yahoo!検索の新しいサービスのお知らせ、検索データの分析レポート、検索関連の読み物コンテンツ情報などをお届けしています。

ブログ内を検索

ページのトップへ

ブログトップ > 月別アーカイブの一覧>2009年3月の記事一覧