競合サイトのSEOの状況を詳細に分析する方法(難解なのでコンサルタント・SEO担当者向け)


今回のテーマは競合サイトがどのようなキーワードで集客しているかを調査する手法である。
私はこうやっていますっていうだけではあるが、この手の情報が出回っているのを全く見たことはないので参考になる方もいらっしゃると思う。
わりと難解でかつ面倒、そしてGRCを持っていないとできないため、一般のWebマスターには無縁の内容である。
難解で面倒でもやってみたいと考え、かつGRCを持っている(あるいはこれから買ってもいいと思う)人のみが対象となる記事だ。
それ以外の人は時間の無駄なので、直帰することをお勧めする。

さて、

競合サイトのSEO分析で難しいのが
「どのようなキーワードで集客しているか」

である。

SEOというものは結局のところ、

キーワードを介してWebサイトに
ユーザーを集めるマーケティング活動のことである

従って、SEOの観点からサイトを分析するためにはどのようなキーワードから集客しているかを把握しなければならない。
しかし、自サイトであれば完全ではないもののWebマスターツールやAnalyticsから把握が可能だが、競合のWebサイトがどのようなキーワードから集客しているかを知ることは非常に難しい。
どのキーワードで集客しているかを分析しない限りは、SEOの観点からの分析としては不十分であり意味をなさない。

ビッグキーワードでの上位表示の技術の有無がこれまでであればSEOにおける競合分析であった。
既存のSEO系の分析ツールはだいたいそんな感じである。

しかし、SEOの主戦場はロングテールキーワードに移りつつあり、ビッグキーワードを含めた様々なキーワードでどれだけ集客できているか?
といったはるかに難しい分析が必要になってきている。
既存のツールではまず対応できない。

さて、前置きが長くなった。
その手法である。当然ながらあくまで完全なものではないが、ある程度は役に立つはずである。
当サイトを解析の例としてやってみることにしよう。

1.Yahoo!検索で100件表示で
  ページの一覧を取得する

site:minnano-seo.com

※あくまでもYahoo!検索で、100件表示でなければならない。
ページ送りをして全ての検索結果のページのURLを取得する。

  • 検索結果1ページ目(1位~100位)

    http://search.yahoo.co.jp/search?p=site%3Aminnano-seo.com&search.x=1&fr=top_ga1_sa&tid=top_ga1_sa&ei=UTF-8&aq=&oq=

  • 検索結果2ページ目(101位~200位)

    http://search.yahoo.co.jp/search?p=site%3Aminnano-seo.com&tid=top_ga1_sa&ei=UTF-8&pstart=1&fr=top_ga1_sa&b=101

  • 検索結果3ページ目(201位~300位)

    http://search.yahoo.co.jp/search?p=site%3Aminnano-seo.com&tid=top_ga1_sa&ei=UTF-8&pstart=1&fr=top_ga1_sa&b=301

  • 検索結果4ページ目(301位~400位)

    http://search.yahoo.co.jp/search?p=site%3Aminnano-seo.com&tid=top_ga1_sa&ei=UTF-8&pstart=1&fr=top_ga1_sa&b=401

といったように、検索結果の全ページのURLを取得してメモ帳などに貼り付けておく。
(最後の順位を表す数字の部分だけを変えても可)

2.取得したURLを
  キーワードプランナーにかける

キーワードプランナーでYahoo!検索のURLを解析した結果
※クリックすると拡大します

ダウンロードボタンを押し、CSVファイルを取得する。
この操作を1.で取得したURLを全て行う。

3.CSVファイルを全て足しあわせて
  一つのCSVファイルにする

出来上がったファイルがこれだ。
全部を1つのCSVにまとめたもの

4.重複キーワードを省く

重複キーワードの省き方は私だったらExcelを使って、

1)キーワードで並べ替える

2)ダブりチェック用の列を作り(ここではB列とする)、A列がキーワードだとしたら
B2にこんな関数を入れてやる。
=if(a2=a1,”ダブリ”,”OK”)
その後、これを下までコピーしてやる。
すると、ダブっているキーワードはダブリと表示されるので、これをオートフィルタをかけて削除する。
※その際に、再計算が自動になっていると1行消されるたびにワークシート全体再計算がかかってしまうため、いつまでたっても終わらないかも知れない。
なので念のため、再計算は手動にしておく。

5.ビッグキーワードを取り出す

Googleのキーワードプランナーは良いのだが、ビッグキーワードを見出しにくい欠点がある。
2語の複合キーワードを分割して1語を見出してやる必要がある。

A列がキーワードだとしたら
C列にこんな関数を入れてやる。
=LEFT(A2,SEARCH(” “,A2)-1)
D列には
=MID(A2,SEARCH(” “,A2)+1,99)

こうすることでスペースで区切られた前後のキーワードを分離することができる。
これで取り出したE列とF列をExcelに貼ってやり、4と同様にダブリを消す。

本当は3語のパターンもこれと同様に処理してやるのだが、今回は面倒なので省略する。

6.キーワードプランナーで取得できなかった
  複合キーワードを見出す

キーワードプランナーは万能ではない。
しかし、幾つかの操作を加えてやることで、隙間を埋める事が可能になる。
これはその操作である。

4.と5.で取得したキーワードをキーワードプランナーの、
「キーワードのリストを組み合わせて新しいキーワード候補を取得」
を行い、掛け合わせパターンを作る。

私は使い勝手がいいのでAdWords Editorを使って、キーワード候補を見出している。
キーワード候補
※クリックすると拡大します

サイトテーマと無関係のキーワードが多く見出されるが、これを目視で省いてもよいのだがその必要は基本的にはない。
例)「求人 転職」「無料 アプリ」「中国 ブログ」

7.CSVファイルを全て足しあわせて
  一つのCSVファイルにする

4.5.6.で取り出したキーワードを全て足し合わせる。
足し合わせるとこんな感じ

8.キーワードプランナーで全キーワードの検索数を取得する

これが実に面倒くさいことにキーワードプランナーでは検索数は一度に800キーワードまでしか取得させてくれない。
(まあ、リスティングで使うためのツールだから仕方ない・・・)
検索数を取得する処理
※クリックすると拡大します

この画面から必要な回数だけ処理を行い、何度もダウンロードして、CSVファイルを足し合わせる必要がある。

出来上がったファイルがこれだ。

検索数取得済

9.GRCに投入できるようにデータを整えGRCにかける

GRC投入データ

こんな感じに整えたら、GRCにかけてブン回してやる。

どんなビッグキーワードで上位表示しているのか?
どんなページがランクインしているのか?
想定外の集客がされているキーワードは何か?

といったことがかなり事細かにわかる。

完成したものはこちらである。

最後まで読んでいただくとほとんどがExcel上の作業であることがわかるだろう。
とは言えExcelである必要はなく、文字列の処理ができるプログラミング言語を使って処理しても全く構わない。
(実際はプログラミングで自動化したほうがいいと思う)

この手法の最重要ポイントは大量のキーワードデータを処理することにある。
データによるアプローチがこれからのSEOにとっては最重要であると私は考えているのである。


ウェブマスターツールやAnalyticsで得られるデータと照合してみるとわかるが、この方法はそれほど精度が高く出るわけではない。
実際にこの方法でも取りこぼす重要キーワードが数多くあるし、Yahoo!検索の結果は1000件までしか表示されないので、そういった制約もある。
またあまり大規模なサイトに対しては適応させるのは難しい。
※大規模なサイトに適用する場合は、クローラーを作ってtitle、meta keywords、meta description、hnを取得し形態素解析で単語を抜き出すといった処理が必要になってくる。

もっと精度を上げるなら、更にもうちょっと工夫と手間が必要になる。
特に手間は重要で、手間をかければどんどん精度は挙げられる。

しかし、基本的な考え方はこんな感じであり、他サイトを直接見る方法はないため、現状において非常に有力な手法であると考えている。