検索エンジンでYahooがじりじりアップ―Google、モバイルを除くシェアで75%を割る

2014年第4四半期の決算が期待を下回った Googleだが、もうひとつの問題が浮上した。検索エンジン市場でYahooがじりじりとシェアをアップさせ、その分Googleがダウンした。モバイルを除くアメリカの検索エンジン・シェアでGoogleが2008年以来初の75%割れを記録した。一方、Yahooはbingを抜いてアメリカの検索エンジンとして第2位となった(デスクトップ、タブレット、スマートフォンを含む)。

下で詳しくみていくが、ある意味、大海の一滴のような変化ではある。それでもStatCounterのレポートによれば、YahooがFirefoxのデフォールト検索エンジンの地位を獲得したことがはっきりと結果を生んでいるのは注目だ。過去3ヶ月でYahooはアメリカにおけるFirefoxブラウザ上の検索シェアを3倍に伸ばした。

Yahooは2014年11月に10%だったFirefoxでの検索シェアを28%に伸ばした。これに対してGoogleは64%にダウンした(デスクトップ、ゲーム機、タブレットを含みスマートフォンを除く)。

Yahooのこの小さな成功は、YahooがSafariブラウザのデフォールト検索エンジンの地位を狙ってAppleに働きかけているという情報を考えるとき興味深いものになる。Safariのデフォールト検索エンジンはGoogleだが、今年で契約が切れる

YahooとMicrosoftの検索エンジンでの提携は、今年で10契約の折り返し点を迎える。Yahooは検索ビジネスの強化を目指して“契約内容の改定”を申し入れているという情報がある。おそらくはYahoo独自のテクノロジーを注入し、Yahooにとって売上をアップさせる内容としたいのだろう。.

検索市場全体からすると依然、Googleの圧倒的優位は揺らいでいない。

まずFirefoxはGoogle Chromeに比べてはるかにシェアが小さい。アメリカではChrome、Internet Explorer、iPhone、Safariについで5位にすぎない。

またGoogleが75%を下回ってといっても、それはモバイルを除外した数字だ。モバイルを含めたGoogleの検索シェアは78%ある。しかし2014年11月のGoogleのシェアは79.79%だったから、やはり1%ポイント低下している。

デスクトップ、タブレット、ゲーム機に限ればなるほど、過去3ヶ月でbingとYahooのシェアは増加し、その分Googleが減少している。

[原文へ]

(翻訳:滑川海彦@Facebook Google+


Microsoftの検索エンジンBingが質問の文脈を記憶して会話のような検索が可能に

Microsoftが今日(米国時間8/13)から、そのデスクトップ用検索エンジンBingに、パーソナルアシスタントCortanaの知能を持ち込んで、ユーザのこれまでのクェリを参考にしながら今のクェリへの情報を与える。文脈に即した情報を与えるので、検索が会話的になり、ちょうど、友だちとチャットしているときに、前の質問の関連質問をするような感じになる。

たとえばGuardians of the GalaxyでStar-Lordを演じた俳優の名前を検索すると、BingはChris Prattという名前を教えてくれるだけでなく、”Who is his wife?”(彼の妻は誰か?)とか”How old is he?”(彼は何歳か?)などの関連質問にも正しく答えてくれる。この場合の‘彼’は、Bing/Cortanaにとって、ユーザの前の質問の答えであるChris Prattなのだ。

この機能はまだ多国語化されていないので、合衆国のユーザなどが便利に利用できるだけだが、人に関する質問を続けていくと、その‘人’は前の質問やその答えの中の人である、と前提されるから、クェリのセッションが相当長い会話になることもありえる。

Bingに文脈知を持ち込もうとするMicrosoftの取り組みは、賞賛に値する。それによってコンピュータとの対話が、現実世界の対話に近いものになるだろう。一つの主題に関して一連の複数のクェリを投ずる、という検索が楽にできるようになり、短い単純な質問で単純な答が得られる。こんな対話システムがこれからますます成熟していけば、検索エンジンやそのほかのソフトウェアが、エンドユーザとさらに複雑な会話をできるようになるだろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


SEO担当者向け : これだけは知っておきたい検索エンジンの基本 【2013年度末版】

ますます高度化、専門家する検索マーケティング、SEO Japanもついついマニアックな記事が多目になってしまいますが、意外と変わりそうで変わらないのが検索エンジンの基本的構造。今回はそんな検索エンジンの基本を改めて整理した記事をサーチエンジンランドから紹介します。基本というには、若干高度な内容も含まれており、SEO担当者向けの基本といった感じではありますが、いわゆる「初心者向け」記事とは一線を画す納得の内容。混沌のSEOの時代、基本を再度理解した上で、来年のあるべきSEOを考えてみてはいかがでしょう? — SEO Japan

SEO業界の関係者(または参入を望む人達)は、様々な細かい仕事に追われている。サーバーの構造、301 リダイレクト、404 エラー、タイトルタグ等々、数えれば切りがない。

そのため、じっくりと腰を落ち着け、それぞれの作業がどのような意味を持っているのか考えることを怠ってしまう。また、大半のSEOのスタッフは、一度もトレーニングを受けたことがなく、「その場」で何とかしなければならないため、検索エンジンの仕組みを知らないSEOのスタッフが多いのは致し方ないのかもしれない。

(グーグル等の)検索エンジンの仕組みを時間を割いて考えたのは、何年前のことだろうか?私は、先日のグーグルウェブマスターハングアウト、そして、このチャットで明らかになったリンク否認ツールの情報を記事(日本語)にまとめていた先月、久しぶりに検索エンジンの仕組みを真剣に考える機会を得た。

しかし、正直に言うと、否認ツールに関する記事を書くまで、8-10年間のブランクがあったと思う。そこで、この記事を通じて、悪習を断ち切っていく。この記事では、上級者に向けて、検索エンジン(グーグル)の仕組みを説明していく。用語や運用の順番は若干異なるかもしれないが、ビングとヤフー!も同じ様なプロトコルを利用している。

クロール vs. インデックス

グーグルがサイトを「インデックス」した、とは何を意味するのだろうか?SEOの関係者は、グーグルで[site:www.site.com]検索して、サイトが提示されたと解釈する。これは、グーグルのデータベース内のページがデータベースに加えられたことを意味するものの、必ずしもクロールされているわけではなく、そのため、次のメッセージが時折表示されるのだ:

の結果の説明は、このサイトのrobots.txt により表示されません ? 詳細

インデックスはクロールとは全く異なる。簡単に言うと、URLはクロールされる前に、発見されなければならず、「インデックス」される前に(より正確に表現するなら、グーグルのインデックス内のワードに関連付ける)前にクロールされなければならない。

最近仲良くなったエンリコ・アルタヴィラは、次のように説明していた。私にはこれ以上分かりやすく説明することが出来ないため、引用させてもらう :

インデックスは、文書ではなく、ワードやフレーズのリストを持ち、その一つ一つに、当該のワードやフレーズに関連する全ての文書への参照情報が与えられている。

私達は「文書がインデックスされた」とよく言うが、実際には、「文書に関連するワードの一部が、文書に向けられるようになった」ことを意味する。文書は、そのままの状態で別の場所にアーカイブされている。

また、古くから付き合いがあり、グーグルに務めた経験を持つ ヴァネッサ・フォックスは、次のように説明している:

グーグルは、URLについて学び…その後、URLをクロールのスケジュールシステムに加える。リストを推測し、それから、優先度を考慮してURLのリストを再編成し、その順番通りにクロールしていく。

優先度は、様々な要因により左右される…ページのクロールが終わると、グーグルは、別のアルゴリズムのプロセスを実行し、インデックスに当該のページを保存するかどうかを決定する。

要するに、グーグルは、把握しているページを全てクロールするわけでも、クロールするページを全てインデックスしているわけでもないと言うことだ。

以下に、グーグルが提供したルート図を簡素化したものを掲載する:
how-search-engines-work

その他にも幾つか注意してもらいたい点がある:

- robots.txtは、ページのクロールをブロックするだけである。そのため、グーグルは、上の例のようなページをたまに検索結果に表示する。内部リンク等のアイテムを基にページとワードを関連付けることが可能であっても、ページのコンテンツをクロールすることは出来なかったからだ。

- ページレベルのnoindexコマンドは、確定的ではない。グーグルはページをクロールして、ページ上のワードをインデックスと関連付けることが可能だが、検索結果に当該のページを盛り込むことを意図しているわけではない

しかし、グーグルは、noindex処理したページを、誰でも見ることが出来る記録に含めることがある。実際に、グーグルは、その他のシグナルにより、インデックスされるべきだと判断される場合、noindexコマンドを無視することもあると明言している。これは、グーグルが、その他の検索エンジンとは一線を画する重要な領域である、ヤフー!とビングは、noindexのコマンドに従い、インデックスすることも、検索結果に盛り込むこともない。

また、カノニカル、パラメータの除外を含むその他の要素もまた、グーグルがページについて把握し、クロール/インデックスする間に処理されていく点も注目に値する。

リンクとリンクグラフ

次に理解してもらいたいのは、リンク、そして、リンクが処理される仕組みである。ここで最も重要なことは、リンク(そして、その延長線上にあるページランク)は、クロールの最中に処理されるわけではない点である。つまり、グーグルは、先ほど説明したようにクロールを行うものの、クロールを行う間は、ページランクの検討を行わずに、別の段階で対処しているのだ。

このポイントはどのような意味を持つのだろうか?

  • ページランクは、誰が何と言おうと、リンクの量と質の計測値である。ページ上のワードとは何の関係もない。
  • 大勢のSEOの関係者は、ページランクには 2つの要素(ドメインレベルとページレベル)が存在すると考えている。ドメインレベルのページランクは、ドメインのオーソリティを特定し、大勢のSEOの当事者が、サイトのランク付けに用いられていると考える要素である。私自身も、グーグルがドメインオーソリティの一部の要素を利用していると思うものの、グーグルがこの点を認めたことは一度もない。
  • ページランクは、クロールとは別に処理されるため、「noindex」や「disallow」等の指示やリファラーベースのブロックが、ページランクの流れを止めることは出来ない。
  • リファラーベースの追跡を用いて、ページランクをコントロールすることは出来ない。要するに、(例えば).htaccessでリファラーをブロックして、nofollowのような影響をgooglebotに与えることは不可能である。
  • 一般的な考えとは異なり、302 リダイレクトはページランクを転送する。
  • 以下にページランクの流れを遮る4つのアイテムを挙げていく:
    1. リンクのソース上でのnofollow
    2. リンクの起点となるページのrobots.txt内でのdisallow。robots.txtコマンドは、当該のページのコンテンツのクロールを拒否し、検索エンジンがリンクを見ることはないため、効果がある。
    3. リンクの起点となるページでの404エラー 。
    4. リンクの終点となるページでの404エラー。 404の効果があるのは、このコマンドがサーバーサイドで発生するためである。リンクグラフの処理が行われると、検索エンジンは、再びページにアクセスすることが出来なくなる。反対に、robots.txtでブロックされたページは、実際には存在し、インデックスに加えられていないだけであるため、ページランクを引き続き獲得する。

2012年8月20日に行われたウェブマスターハングアウトで、この点を指摘するためにグーグルが用いたスライドのスクリーンショットを以下に掲載する:

page-rank-slide

劣悪なリンクを処理する方法として、もう一つ挙げられるのが、リンクのソースを否認する方法でる。これは、グーグルが受け入れた場合、ソースリンクに「nofollow」を加えるのと同じ技術的な影響をもたらす。

このようにして検索エンジンは動いている

これだけでは、検索エンジンの仕組みを完全に理解することは出来ないだろう。とりあえず、覚えてもらいたい重要な点を以下に挙げていく:

  1. クロールとインデックスは同じではない。
  2. ページランクは、クロールとは別に処理されている。
  3. ページランクの転送をブロックする方法は4つのみであり、それ以外だと否認しかない。

知らなかった情報はあっただろうか?私自身は、リンクのリファラーを.htaccessでブロックし、ページランクの流れを断ち切ることが出来ると(誤った)考えていた。皆さんにも、どのような誤った考えの下、SEOに取り組んでいたのか、振り返ってもらいたい。

事実確認作業に協力してくれた、エンリコ・アルタヴィラに感謝の意を伝えたい。

この記事の中で述べられている意見はゲストライターの意見であり、必ずしもサーチ・エンジン・ランドを代表しているわけではない。


この記事は、Search Engine Landに掲載された「How Search Engines Work ? Really!」を翻訳した内容です。

SEO初心者に勉強になることはもちろん、検索エンジンと関わって15年以上の私でも、改めて気づきがある記事でした。「インデックスされたとうことは、Googleでsite:で検索して表示されることではない」という一言にはしびれましたね。SEOを実践するにおいて考えるべき要素は様々ありますが、迷った時はここに書かれている基本の基本を見失なければ大きく外れることはないはず。「より簡単になる」ことは決してないSEOの世界ではありますが、2014年のSEO、地道に迷わず取り組んでいきましょう! — SEO Japan [G+]