*リンク先は全て英語となっています。
先日、我々は100万のGoogleの検索結果を分析した。下記の疑問を明らかにするためだ。
検索エンジンの1ページ目の順位と相関関係のある要素はどれなのだろうか?
我々はコンテンツを分析した。バックリンクも分析した。さらに、サイトスピードも分析した。
エリック・バン・バスキック氏とパートナー会社の協力により、幾つかの興味深い発見を得ることができた。
この記事では、我々が行った調査により発見できた事実を共有したいと思う。
まずは、重要な事柄をまとめよう。
1.バックリンクはGoogleのランキング要素の内、依然として非常に重要な要素である。我々の調査は、該当のページにリンクを張っているドメインの数が、他のどの要素よりも、ランキングとの相関関係があったことを明らかにした。
2.我々が取得したデータによると、サイト全体のリンク・オーソリティー(Ahrefsのドメイン・レーティングによって測定)が、高順位との強い相関関係があった。
3.”トピックとの関連性がある”と評価されたコンテンツ(MarketMuseを使用)は、トピックに対し深く掘り下げていないコンテンツよりも、大いに高い順位に表示されている。そのため、トピックを絞って深く掘り下げたコンテンツを作成することで、高順位を獲得できるかもしれない。
4.SEMRushの検索結果ページのデータに基づいた調査を行った所、長いコンテンツがGoogleの検索結果の上位に表示される傾向があった。Googleの1ページ目に表示されているコンテンツの平均単語数は、1,890単語であった。
5.HTTPSは、ある程度、Googleの1ページ表示との相関関係があった。これは、GoogleがHTTPSをランキング要素として使用しているという事実があることから、それほど大きな驚きではないだろう。
6.Schemaについての話題は常にあるが、我々のデータはSchemaのマークアップと高順位との間に相関関係があることを示さなかった。
7.少なくとも、画像が1つあるコンテンツは、画像が全く無いコンテンツよりも上位に表示されていた。しかし、それ以上の画像の数がランキングに影響されることはなかった。
8.titleタグ内のキーワードの最適化とランキングについては、非常に弱い相関関係しか見られなかった。この相関関係は、我々が予測していたものよりも遥かに小さく、Googleがセマンティック検索に移行している事実を反映しているかもしれない。
9.サイトスピードは重要だ。Alexaのデータを使用し調査した所、読み込み速度が速いサイトのページは、読み込み速度が遅いサイトのページよりも、明らかに高順位に表示されていた。
10.複数回のペンギンアップデートにもかかわらず、完全一致のアンカーテキストはランキングに強い影響を与えている。
11.SimilarWebを使用して調査した所、低い直帰率が高順位と関係していることがわかった。
下記に、より詳細な情報とデータを記載する。
リンク元のドメイン数は、
ランキングへ強い影響を与える。
同じドメインから複数のバックリンクを獲得してもその効果は減少される、ということを耳にしたことはあるだろう。
言い換えれば、10個のドメインから10本のリンクを獲得する方が、同じドメインから10本のリンクを獲得するよりも良いということだ。
我々の分析によると、これは事実のようだ。ドメインの多様性はランキングへ大きな影響を与えることが分かったのである。
【上記グラフの各項目の和訳】
グラフタイトル:リンク元のドメイン数
縦軸のタイトル:リンク元のドメイン総数
横軸のタイトル:Googleの順位
Googleは、あなたのページを支持する、複数の”異なったサイト”を確認している。そして、より多くのドメインがあなたのページヘリンクを張っていれば、より多くの支持をあなたのサイトが獲得していると、Googleが認識するのである。
事実、ユニークなリンク元のドメイン数は、我々が今回行った調査の中で、最も相関関係が強い要素であった。
重要なポイント:異なったグループのドメインからリンクを獲得することは、SEOにとって非常に重要な項目である。
オーソリティーのあるドメインは、
Googleの検索結果で上位に表示される傾向がある。
驚くことではないが、Webサイト全体のリンク・オーソリティー(Ahrefsのドメイン・レーティングを使用して測定)はGoogleの順位との強い結び付きがある。
【上記グラフの各項目の和訳】
グラフタイトル:ドメインのリンク・オーソリティー(Ahrefsnoのドメイン・レーティング)
縦軸のタイトル:ドメイン・レーティングの平均
横軸のタイトル:Googleの順位
Webサイト全体のオーソリティーは、ページのオーソリティーよりも、ランキングとの強い相関関係があった。
言い換えれば、該当のページのあるドメインの方が、ページ自体よりも重要であるということだ。
重要なポイント:あなたのサイトへのリンク数が増加することで、あなたのサイト内の”別ページ”のランキングが上昇する可能性がある。
包括的で、トピックを深掘りしたコンテンツを作成することが、ランキング上昇を導く可能性がある。
SEOの初期の時代は、Googleはページ内に記述されているキーワードを見ることによって、ページのトピックを判断していた。
ページ内に該当のキーワードが〇〇回出現していれば、Googleはそのページが該当のキーワードについて書かれているものだと判断していた。今日では、ハミングバード・アルゴリズムのおかげで、Googleは全てのページのトピックを理解することができている。
例えば、”バック・トゥ・ザ・フューチャーの監督は誰?”と検索した場合、
Googleは”バック・トゥ・ザ・フューチャーの監督は誰?”というキーワードを含んでいるページを探すわけではない。
Googleは質問の意味を理解しており、適切な答えを提供する。
あなたが想像している通り、この事実は、我々がSEOのためにコンテンツを最適化する方法へ大きな影響を与えている。理論的には、Googleは特定のトピックを深掘りした記事を好んでいるはずなのだ。
しかし、データはこの考えに賛同してくれているのだろうか?
この疑問に答えるために、我々はMarketMuseを使用し、”トピックのオーソリティー”を調査するための10,000のURLを分析した。
そして、包括的なコンテンツが、内容の浅いコンテンツよりも、明らかに高順位に表示されることを明らかにした。
【上記グラフの各項目の和訳】
グラフタイトル:コンテンツのトピック・オーソリティー(MarketMuseによるデータ)
縦軸のタイトル:トピックの範囲
横軸のタイトル:Googleの順位
これは非常に興味深いことだ。しかし、Googleが包括的であると判断するコンテンツを、どのようにして作成すればいいのだろうか?
これを明らかにするため、我々のデータセットから2つの例を挙げてみよう。
最初の例は、Bush Gardendsが入園パスの期間を延長するというDaily Pressの記事だ。
このページは、1ページ目に表示されるための、よく知られたポイントを掴んでいる。例えば、このページはtitleタグとH1タグにキーワードを使用している。また、ドメイン(Dailypress.com)のオーソリティーは非常に高い。(Ahrefsのドメイン・レーティングは64)
しかしながら、このページの該当のキーワード(Busch Garden fun card)の順位は10位である。
この低順位の原因の一部は、該当のページのトピック・オーソリティーのスコアが低いためだと思われる。
対象的な例として、バリ風サテソースの作り方についてのページを例に挙げよう。
このページはサテソースについての豊富な情報を提供している。このコンテンツは、インドネシアにおけるサテソースの歴史についての記述があり、サテソースがどのように使用されているかに触れ、レシピや栄養素についての情報も提供している。
このページ内に”インドネシア サテ ソース”という記述はどこにもないが、このキーワードで1ページ表示を獲得している。
この理由の説明として、このページが”インドネシア サテ ソース”というトピックに対しての高いオーソリティーを獲得していることが挙げられるだろう。
重要なポイント:包括的で、掘り下げたコンテンツを作成することが、Googleでの上位表示の助けとなるだろう。
長文のコンテンツは、短文のコンテンツよりも、
Googleの検索結果で上位に表示される。
長文のコンテンツは、200単語程度のブログ記事よりも、上位に表示されるのだろうか?
こちらを明らかにするために、我々は自身のデータを分析してみることにした。
データから異常値(51単語以下のページと9999単語以上のページ)を除外した後、我々が発見したことは、長文のコンテンツは、短文のコンテンツよりも、明らかに順位が良いということであった。
【上記グラフの各項目の和訳】
グラフタイトル:コンテンツの単語の総数
縦軸のタイトル:単語数
横軸のタイトル:Googleの順位
我々の分析結果によると、Googleで1ページ目に表示されているコンテンツの平均単語数は、1,890単語であった。
以前行われた検索エンジンのランキング要素についての調査でも、より長いコンテンツがGoogleでは上位に表示される、という結果が出ている。
この相関関係は、長文のコンテンツはより多くのソーシャルシェアを獲得するという事実に基づいている可能性がある。もしくは、Googleがそもそも長文の記事を好む傾向があるからなのかもしれない。
その他の可能性として、長文のコンテンツはトピックへの関連性を高めることが挙げられる。その結果、Googleがあなたのコンテンツのトピックに対する理解を深めることになる。
また、長文のコンテンツが上位表示されるという事実は、優れたコンテンツを作成しようとする姿勢が、単純に結果として表れているだけとも考えられる。今回の調査は、相関関係を明らかにする調査だ。そのため、長文のコンテンツが検索結果で上位に表示される単一の原因を特定することは、不可能である。
しかしながら、我々のデータを分析し、実際の順位と照らし合わせてみると、長文のコンテンツはSEOにとって最適な手法であることは明らかであるようだ。
重要なポイント:Googleの検索結果において、長文のコンテンツは、短文のコンテンツよりも、上位に表示される。Googleの検索結果の1ページ目に表示されているコンテンツの平均単語数は、1,890単語であった。
HTTPSは上位表示と、多少、相関関係がある。
昨年、GoogleはWebマスターに対し、自身のサイトをHTTPSに対応するよう呼びかけた。また、HTTPSを”ランキング要素“とすることも発表した。
我々のデータは、この事実をどう反映しているのだろうか?
非常に強い相関関係は見られなかったが、HTTPSとGoogleの検索結果の1ページ目の順位との間に、相関関係が見られた。
【上記グラフの各項目の和訳】
グラフタイトル:HTTPSの適用
縦軸のタイトル:HTTPSのドメインの割合
横軸のタイトル:Googleの順位
この事実は、あなたが自身のサイトをすぐにでもHTTPS対応にすべきだ、という結論を導くものなのだろうか?明らかに、その判断はあなた自身にゆだねられている。しかし、HTTPSへの対応は、非常に慎重に行うべきプロジェクトであり、技術的に深刻な問題を引き起こしてしまう可能性がある。
HTTPSへの対応を取り掛かる前に、Googleによるこれらのガイドライン(日本語はこちら)を参照すべきだろう。
重要なポイント:HTTPSとランキングとの間に強い関連性が認められないため、また、HTTPSへの対応は大掛かりなプロジェクトとなるため、単純にSEOのためだけに、HTTPSへの対応を行うことを我々は推奨しない。しかし、サイトを新規で立ち上げる場合は、初めからHTTPSに対応することが望まれる。
Schemaのマークアップとランキングには関連性は見られない。
SchemaのマークアップとSEOについての議論はずっと行われてきた。
その内容は、こういったものだ。
Schemaをマークアップすることにより、検索エンジンはあなたのコンテンツの内容をより深く理解することができるようになる。この、より深い理解が、検索エンジンがあなたのサイトをより多くの人の目に触れるようにする、というものである。
例えば、<name> という構造化データのタグを使用することで、”Star Wars”という単語を記述した際に、一般的なフランチャイズではなく、オリジナルの映画タイトルについて言及していることを、Googleが理解できるようにさせるのだ。
もしくは、Eコマースサイトの場合では、Schemaを使用することで、商品の評価を表示することが可能となる。
こうした事柄の全てが、ランキング上昇の手助けとなる”はず”、とされている。実際に、Googleのジョン・ミュラー氏は、将来的にGoogleが構造化データをランキング要素として用いる可能性をほのめかしている。
しかしながら、我々の分析によれば、構造化データの使用の有無はGoogleの順位と関連性がないことが明らかになっている。
【上記グラフの各項目の和訳】
グラフタイトル:Schemaの有無
縦軸のタイトル:検索結果内の割合
横軸のタイトル:Googleの順位
重要なポイント:構造化データをサイトにマークアップするのは自由だ。しかし、ランキングに影響があることは、期待しないほうがよい。
短めのURLの方が、長めのURLよりも上位に表示される傾向がある。
オン・ページSEOの施策の1つとして、私はよく、短めのURLを使用することを薦めている。
なぜだろうか?
これには2つの理由がある。
まず、”backlinko.com/my-post”のような短いURLは、”backlinko.com/1/12/2016/blog/category/this-is-the-title-of-my-blog-post”のような長いURLよりも、Googleにとって理解がしやすいからである。
実際、マット・カッツ氏によれば、URL内の5単語以降の単語について、下記のように述べている。
“(Googleの)アルゴリズムは、こうした単語についてはあまり重要視しておらず、それほど大きな信頼は寄せていない”
我々のデータは、この言葉を裏付けている。
【上記グラフの各項目の和訳】
グラフタイトル:URLの長さ
縦軸のタイトル:平均文字数
横軸のタイトル:Googleの順位
幸運にも、このアドバイスは実践しやすい内容だと言えよう。新しいコンテンツを公開する場合、URLは短く、魅力的なものにしよう。
WordPressを使用しているのであれば、パーマリンクの構造を、”投稿名”に設定しておくとよい。
そして、新しい記事を作成するたびに、少量の単語を含むURLに修正しよう。
注意:新しいパーマリンクは、今後作成する記事にのみ適用するように設定しよう。既に投稿した記事のパーマリンクも変更した場合、SEOにおける非常に重大な問題が起こりかねない。
例えば、私が作成した” 21 Actionable SEO Techniques You Can Use Right Now(すぐに実践できる、21のSEOテクニック)”は、ターゲットキーワードをシンプルに含んだタイトルにしている。
もう1つの理由は、長いURLは、到達するまでにTOPページからの複数回のクリックが必要とされるからである。これは、通常、オーソリティの受け渡しが少なくなってしまうことを意味している。そして、オーソリティが低い場合、ランキングも低くなってしまうだろう。
例えば、BestBuy.comのiPadの商品ページのURLは、サイト内で最もオーソリティの高い、TOPページから非常に離れた位置にあることを示している。
重要なポイント:可能であれば短いURLを使用し、Googleが該当のページのトピックをより良く理解できるようにしよう。
少なくとも1つの画像があるコンテンツは、まったく画像がないコンテンツよりも、上位に表示される。
(しかし、多くの画像を使用することが違いを生み出すことはない。)
とある調査によれは、画像が豊富なページは、より多くのビュー数とソーシャル・シェアを生み出すということだ。
こうした事実は、コンテンツに多くの画像を含めることでシェアを促し、結果としてGoogleのランキングの上昇を導く、ということを意味しているのだろうか?
画像の使用がGoogleのランキングにどのような影響を与えるかを測定するため、ページのボディ内(ページ内のコンテンツ部分)の画像の有無を確認してみた。
我々のデータによると、コンテンツ内に最低1つでも画像が使用されていれば、まったく画像のないコンテンツよりもはるかに順位が良いことがわかった。
【上記グラフの各項目の和訳】
グラフタイトル:最低でも1つ画像を使用しているコンテンツ
縦軸のタイトル:(画像を使用している)ページの割合
横軸のタイトル:Googleの順位
しかしながら、画像の総数とランキングの関係性を調べたところ、相関関係は何も見当たらなかった。
つまり、ここが画像の使用とランキングにおける、収穫逓減のポイントと言えるだろう。
重要なポイント:画像をコンテンツ内に含めることは、全く含めないコンテンツよりも、明らかに良い。しかし、多くの画像を含めることが、ランキングに影響を与えることはない。
titleタグ内に(完全一致の)キーワードを含めることと、ランキングとの相関関係は小さい。
検索エンジンの初期の段階では、titleタグは非常に重要なオン・ページSEOの要素であった。
titleタグによって、ユーザー(と、検索エンジン)に、該当のページの全体的なトピックを伝えることができるため、titleタグ内に含まれる言葉は、長い間ランキングに非常に大きな影響を与えていた。
しかしながら、Googleがよりセマンティック検索に移行することで、それがtitleタグの重要性を低くさせているのではないか。我々は、この仮説を検証したいと思った。
調査の結果、titleタグ内のキーワードの使用は、ランキングとの若干の相関関係があることがわかった。しかし、その相関関係は、我々が予想していたよりもはるかに小さいものだった。
【上記グラフの各項目の和訳】
グラフタイトル:titleタグ内に含まれる(完全一致の)キーワード
縦軸のタイトル:検索結果内の割合
横軸のタイトル:Googleの順位
この結果は、Googleがあなたのページのトピックを理解するために、titleタグ内の完全一致のキーワードを見る必要がなくなっている、ということを意味している。
例えば、”list building(リスト 作成)”で検索した場合を見てみよう。
上記は上位6位の検索結果であるが、その内の3つ(1位表示も含む)が、titleタグ内に”list building”という完全一致のキーワードを使用していない。
この事実は、Googleが完全一致のキーワードから、セマンティック検索へを移行していることを反映していると言えるだろう。
重要なポイント:完全一致のキーワードをtitleタグ内に含めることは、ランキング上昇を導くこともあるだろう。しかし、セマンティック検索のおかげで、その影響力は過去と比べて低くなっているようだ。
読み込み速度の早いWebサイトは、読み込み速度の遅いWebサイトよりも、上位に表示される。
2010年以降、Googleはサイトの読み込み速度をランキングシグナルに使用することを明らかにした。
しかし、我々は非常に気になっている。
サイトの読み込み速度は、どの程度、ランキングに影響するのだろうか?
我々は、100万ドメインの平均的な読み込み速度を分析するため、Alexaのデータを参照した。つまり、個々のページの読み込み速度を直接測定した訳ではない。ドメイン全体の平均的な読み込み速度を計測したのである。
そして、サイトの読み込み速度がGoogleのランキングと、強い相関関係があることを発見した。
【上記グラフの各項目の和訳】
グラフタイトル:平均的な読み込み速度
縦軸のタイトル:ミリ秒
横軸のタイトル:Googleの順位
繰り返しとなるが、これは相関関係の調査である。そして、サイトの読み込み速度を改善することは、SEOに対しても効果があると言うことはできる。
サイトの読み込み速度を高めることで、SEOに悪影響を与えることはないだろう。自身のサイトを高速化することは、理にかなったことと言える。
重要なポイント:読み込み速度の速いWebサイトは、Googleの検索結果の上位に表示されることになるようだ。
より多くの被リンク=より高い順位。
(ソーシャルシグナルのような)検索エンジンが今日使用している、新しいランキングシグナルについての話題は尽きない。被リンク数の重要性は下がり続けている、と主張する者も多いだろう。
Googleが被リンク数をランキングシグナルに使用しているかどうか、非常に気になるところだ。
こちらを検証するため、AhrefsのAPIを使用し、対象となるサイトの各ページに向けられた被リンクの総数を測定した。
その結果、最も多い被リンクを獲得しているサイトが、Googleでは上位に表示されている傾向があることがわかった。
【上記グラフの各項目の和訳】
グラフタイトル:被リンクの総数
縦軸のタイトル:被リンクの平均数
横軸のタイトル:Googleの順位
Googleはアルゴリズムに様々な要素を追加し続けているが、被リンクは未だに重要なランキングシグナルであるようだ。
重要なポイント:被リンク数の多いページは、被リンク数の少ないページよりも、ランキングが上位になる傾向がある。
Googleのランキングは、ページ全体のリンク・オーソリティと、強く結びついている。
被リンクの総数に加え、別の疑問もある。
ページの全体的なオーソリティはランキングに影響するのだろうか?
多くのSEO担当者は、被リンクの数と同様、被リンクの質も重要であるという意見に同意するだろう。
言い換えれば、オーソリティのあるサイトからの1リンクが、品質の低い100サイトからの100リンクよりも効果が強いこともある、ということだ。
そして、我々のデータはこれを裏付けることとなった。
【上記グラフの各項目の和訳】
グラフタイトル:Webページのリンク・オーソリティ(AhrefsのURLレーティング)
縦軸のタイトル:URLレーティングの平均値
横軸のタイトル:Googleの順位
Ahrefsのリンク・オーソリティ(URLレーティング)によれば、オーソリティのあるページは、リンクオーソリティが低いページよりも、高順位に位置するようだ。しかし、この相関関係は、被リンク数における相関関係と比べ、相関の強さは低かった。
重要なポイント:ページにおける全体的なリンク・オーソリティは重要である。
完全一致のアンカーテキストは、ランキングに非常に大きな影響を与える。
Googleが2012年にペンギン・アップデートをリリースして以来、多くのSEO担当者は完全一致のアンカーテキストのリンクを構築することに反対してきた。しかし、幾つかの検索エンジンの調査によれば、アンカーテキストは未だに重要であることがわかっている。
これが、我々がアンカーテキストは未だに重要なランキングシグナルであるかどうかを、調査したいと思った理由である。
我々の調査によると、完全一致のアンカーテキストは、ランキングと非常に強い相関関係があることがわかった。
SEOの初期の段階では、完全一致のアンカーテキストでリンクを構築することは、非常に効果的なアプローチとされてきた。例えば、”online flower delivery(オンライン 花 配達)”というキーワードで上位表示を獲得したい場合、下記のようなアンカーテキストのリンクを構築することが重要であった。
しかし、Googleはこうした慣習を取り締まる目的で、ペンギンアップデートをリリースしている。そのため、未だにランキングにおける重要な要素であるという事実がありながらも、我々は完全一致のアンカーテキストでリンクを構築することを薦めていない。
重要なポイント:完全一致のアンカーテキストによる被リンクは、ランキングと強い相関関係がある。しかし、その危険性から、リンク内の完全一致のアンカーテキストによるリンク構築をSEOの施策に含めることを、我々はお勧めしない。
低い直帰率は、Googleの検索結果における高順位と、強い関連性がある。
多くのSEO担当者は、Googleが”ユーザー体験のシグナル”(直帰率、サイト内滞在時間、検索結果画面のクリック率など)をランキング要素に使用しているのではないか、と疑っている。
こちらを検証するために、我々は10万のWebサイトを対象とし、SimilarWebを使用した分析を行った。
直帰率、サイト内の滞在時間、検索結果画面におけるクリック率、の3つのシグナルを分析している。
その結果、我々は低い直帰率が、検索結果の上位表示と、強い相関関係があることを発見した。
【上記グラフの各項目の和訳】
グラフタイトル:直帰率
縦軸のタイトル:ドメイン評価の平均
横軸のタイトル:Googleの順位
注意していただきたいのは、我々は低い直帰率が高順位の”理由”となっていると主張しているわけではない、ということだ。
Googleは直帰率をランキングシグナルとして使用している可能性はある(以前、Googleはこれを否定しているが)。もしくは、高品質なコンテンツがユーザーを長い時間とどまらせている、といったことに過ぎないかもしれない。それゆえ、低い直帰率は高品質なコンテンツの副産物であり、Googleがそれを測定している、ということになるだろう。
今回の調査は相関関係の調査であるため、我々のデータ単体から結論を出すことは不可能だろう。
重要なポイント:Googleは直帰率をランキングシグナルとして使用しているかもしれない。しかし、これは相関関係の調査であり、因果関係を表すものではない。
まとめ
今回の調査に協力していただいたパートナーに、大きな感謝の意を示したい。 SEMRush、Ahrefs、MarketMuse、SimilarWebの協力により、今回の調査が可能となった。
さらに、ClickStreamのエリック・バン・バスキック氏(プロジェクト・ダイレクター)、ザック・ルセル氏(リード・デベロッパー)、クィ・ハオ氏(ヘッド・データサイエンティスト)からの協力に対しても、大きく感謝したい。
また、我々がどのようにしてデータを集め、分析したかについて詳しく知りたい場合は、今回の調査方法をまとめたリンクを掲載しておくので、そちらを参照してほしい。
そして、私は皆様からの感想を聞きたいと思っている。どんな調査結果が、あなたに驚きであっただろうか?(もしくは、驚きではなかっただろうか?)もしくは、我々の調査について、なんらかの質問があるだろうか?
下記にコメントを残し、ぜひ、我々に伝えてほしい。
この記事は、BACKLINKOに掲載された「We Analyzed 1 Million Google Search Results. Here’s What We Learned About SEO」を翻訳した内容です。