前回紹介した
Googleによるインフォグラフィックの中で、Googleが手動で行っているスパム対応の量をチャートで紹介している気になる内容があったので、掘り下げて紹介したいと思います。 — SEO Japan
グーグルは、スパム行為を実施しているウェブサイトに対して、どのぐらいの頻度で「手動アクション」を実行しているのだろうか?グーグルは、10年近く前まで遡って、このデータに関するグラフを初めて公開した。
このグラフは、グーグルの新しい取り組み -「検索の仕組み」(日本語)の一部であり、2004年の8月から現在までのデータが反映されている(クリックすると拡大する):
【チャート右側のカテゴリの翻訳(上から下)】
純粋なスパム
レガシー
ハッキングされたサイト
サイトから不自然なリンクが外部に向けられている
自動生成されたコンテンツおよび無限の空間
クローキング/悪意のあるリダイレクト
価値をほとんど/全く加えない薄っぺらいコンテンツ
サイトに不自然なリンクが向けられている
パークドメイン
ユーザー生成スパム
テキスト隠し/キーワードスタッフィング
スパムな無料のホストおよび動的DNSプロバイダー
「レガシー」は、具体的なカテゴリを用いていなかった時代に行われたアクションを意味する、とグーグルが説明してくれた。2007年の年末あたりまでは、「不自然なリンク」か「レガシー」- つまり“その他”に分類されていた。
純粋なスパムに比べて少ない不自然なリンク
全体的に見て、最も多くのアクションが行われているカテゴリは、「純粋なスパム」である。これは、不自然なリンクやクローキング等(どちらもカテゴリが用意されている – そして、比較的、アクションが行われる回数は少ない)、特定の方法以外の方法でグーグルのガイドラインを違反する行為を指す。
グーグルは、関連するページで上述したタイプの定義を提供している。奇妙にも、「純粋なスパム」は、カテゴリが与えられている一部のスパムのタイプも含むと定義されている:
純粋なスパム: 意味のないコンテンツを自動的に生成する手法、クローキング、その他のサイトからコンテンツをコピーする行為、グーグルのウェブマスターガイドラインを何度も、または、大幅に違反する行為等、攻撃的なスパムの手法を用いていると思われるサイト
純粋なスパムの次にアクションが行われている回数が多いカテゴリは、「ハッキングされたサイト」である。グーグルは、ハッキングされただけでなく、もともと提供していた、ランク付けの対象になっていたコンテンツが既に提供されなくなっているサイトに対して、ペナルティを与えている。
一方、昨年大きな注目を集めた(日本語)、不自然なリンクに対するアクションは、少ない部類に入る。
自動アクションは反映されず
当然ながら、グーグルは、例えば、2011年に「薄っぺらいコンテンツ」対策として導入したパンダアップデート、そして、昨年、不自然なリンクに対抗するために実施したペンギンアップデート等、ウェブサイトに対して「自動アクション」も並行して実行している。このタイプのケースでは、通知は行われない。自動的にペナルティを科されるだけである。
この点を考慮すると、このグラフは、グーグルが実施するスパムのアクションを完全に反映しているとは言えない。完全なデータが反映されたグラフをいつか見てみたい気もするが、この取り組みは始まったばかりなので、今後に期待したい。
スパムのピーク & スパムの年表
このグラフには「トータル」の項目が欠けているが、「レガシー」、そして、「純粋なスパム」の線を見ていくと、手動アクションがピークを迎えた時期が何となく見えてくる。「スパム」のピークは、1ヶ月間に55万3994回の手動アクションが行われた時期である:
残念ながら、カウントの隣に日付は表示されていない。しかし、その他の大半の時点に対する日付は掲載されているため、このピークの前後の日付から、最も多くの手動アクションが行われたのは、2011年6月であったことが分かる。
ここで関連する年表が役に立つ。グラフの下には、次のように、グーグルのスパム対策の歴史の中で重要な出来事が記載されている:
しかし、2011年6月に最多のアクションを発動させた出来事は年表で取り上げられていない。パンダアップデート 4(以前はパンダ 2.2と呼ばれていた)が当時行われていたが、これは自動(または“アルゴリズム”主導)のアクションであり、手動のアクションに反映されていないはずだ。
再審査リクエスト
自動アクションの打撃を受けたウェブサイトは、サイトに変更を加え、後はグーグルが自動的に変更点を見つけ、潔く検索結果に戻してくれることを祈るしかない。この件の詳細は次のエントリで確認してもらいたい:
一方、手動アクションに対しては、再審査リクエストと呼ばれる要請書をグーグルに提出することが出来る。どれぐらいの頻度でこの要請は行われているのだろうか?グーグルは別のグラフでこのデータを公開している:
残念ながら、日付は明記されておらず、週の番号しか表示されていない。それでも、週の数を変換するサイトのおかげで、再審査リクエストの投稿が得に多かった2010年の43週目が10月25日-31日に当たることが分かった。
年表には、この急激な増加の理由が記されている。この時期にグーグルの通知システムがアップデートされ、手動アクションに関するメッセージの送信が増え始めた結果、再審査リクエストが増加したようだ。
このリクエストのうち、実際に認められたリクエストの割合はどの程度なのだろうか?残念ながら、このデータを示すグラフは公開されていない。
この記事は、Search Engine Landに掲載された「Google Charts “Manual Actions” Against Spam In Search For First Time」を翻訳した内容です。
記事にもあるように自動アクションを含んでいない手動アクションのみのチャートであり、これだけでスパム取締り状況の全体像を把握できるわけではありませんが(その辺の出し惜しみっぷりがまたGoogleらしいですね・・・)、それなりに参考になるデータでもありました。手動アクションが純粋なスパム中心でリンク関連のスパムがほとんど含まれていないのは、逆に考えるとリンクによるスパム認定はほぼアルゴリズムで判断されているということなのでしょうか?確かに手動でリンクプロフィールからスパム認定を行う作業は相当大変な気もしますし、人に任せると判断基準に個人差が相当出てきそうですし、自動ルール化した方がやりやすいのでしょうね。たまにその弊害としか思えない順位下落の憂き目にあうサイトも出てくるわけですが、、、。
最後の再審査リクエスト数もチャートで出ていましたが、Googleの対応が遅れ気味になるのもむべなるかな、というボリュームでした。対応が遅い・無いと無駄に再審査リクエストの再リクエストを出すのは、じっと我慢する忍耐力も必要そうです。 — SEO Japan [G+]
>