SEOツールを使用する目的は数多くありますが、バックリンクを調査する目的でもしばしば使用されることでしょう。もちろん、最終的なSEOへの影響はGoogleのみぞ知るところとなりますが、競合他社とのざっくりとした比較を行うケースも考えられます。こうしたバックリンクのデータを提供しているベンダーの中で、特に多くのデータベースを保有している4社を比較した調査記事となります。最終結論を出すには難しいトピックではありますが、内容としては非常に興味深いと言えるでしょう。
バックリンクのインデックスが最大であるベンダーは、どのベンダーだろうか?我々は、Ahrefs、Majestic、SEO PowerSuite、Semrushの各ベンダーを比較し、その結果をまとめた。
SEO PowerSuiteはここ数年、SEO PowerSuiteのbacklink APIとSEO SpyGlass backlink toolを活用し、バックリンクのインデックスを強化してきた。2021年6月に大規模なインフラのアップデートが行われ、クロール速度は3倍に増加した。
我々の状況をより良く理解するために、バックリンクのトップベンダーである、Ahrefs、SEO PowerSuite、Semrush、Majesticの4社比較を行うことを決意した。
この記事では、今回の調査で得られた主要な結果をすべてまとめているが、より詳細な情報は、こちらのページを参照してほしい。
免責事項:今回の調査のために、各ベンダーからAPIキーを購入している(総額6,200ドル)。また、このレポートではSEO PowerSuiteのローデータも公開している。使用されるデータがあらゆる方法で修正されていないことを確認するため、各ベンダーに連絡を取り、同様の統計データを購入し、それぞれを比較いただくことも可能だ。
分析方法
今回の調査を行うために、我々はMajestic Millionのデータセットを使用することにした。
なぜ、このデータセットなのか?Majestic Millionは、Web上のトップに位置する100万のWebサイトのリストであり、他のWebサイトからのサイテーション(つまり、リンク)数に基づいている。そのため、これらのドメインは十分な量のバックリンクを保有しているはずであり、今回の比較を統計的に優位なものとすることができるはずだ。
そのため、我々はこのデータセットを用いて、下記のバックリンク・インデックスのプロバイダーからの結果を分析したのである。
SEO PowerSuite
SEO PowerSuiteのバックリンク・インデックスは3兆6千億の外部のバックリンクと2億6千400万のインデックスされたドメインのデータを保有している。
100万ドメインのバックリンクを確認する費用は、899ドルである。
Ahrefs
公式サイトによれば、Ahrefsは3.2兆の外部のバックリンクと1億9300万のインデックスされたドメインのデータを保有している。
100万ドメインのバックリンクを確認する費用は、2,000ドルである。
Semrush
Semrushは、43兆以上のバックリンクと16億のドメインのデータを保有していると、述べている。
100万ドメインのバックリンクを確認する費用は、2,500ドルである。
Majestic
Majesticのバックリンク・インデックスが保有するバックリンク数とドメイン数に関する情報を見つけることはできなかった。公式サイトで公開されている統計情報によると、4,340億のURLをクロールし、1兆以上のURLを発見している、とのことである。
100万ドメインのバックリンクを確認する費用は、800ドルである。
アカウントをセッティングし、100万ドメインのデータを確認した後、我々は下記の計算を行った。
- 参照元ドメインによる、勝利数の合計
- バックリンク数による、勝利数の合計
- リンク数とドメイン数の比較において、各ベンダーが1位、2位、3位、4位、であった頻度
- 上記に加え、他のいくつかの指標に基づく比較はこちらのページで行っている
この調査は、2021年秋に実施された。
発見
参照ドメイン数での勝者はどこか?
まず、我々は各プロバイダーが返す、参照ドメインの数に注目した。これは、バックリンクのインデックスの網羅性を評価する指標となる。
バックリンクのドメイン数が最大であったのは、SEO PowerSuiteであり、44.4%で勝利していた。
バックリンクのインデックス数では、Semrushは2位であり、勝率は36.3%であった。また、Ahrefsは14%、Majesticは5.3%となっている。
上記のグラフは、勝率に焦点をあてたグラフであることを留意していただきたい。参照ドメインの絶対数は下記の通りとなっている。
勝率と絶対数の違いとは何か?簡単な例を挙げてみよう。同一のURLに対し、分析を行った各データベースがレポートする参照ドメインの数を見てみたとしよう。
- SEO PowerSuiteは、100ドメイン。
- Ahrefsは、101ドメイン。
- Semrushは、99ドメイン。
- Majesticは、100ドメイン。
この場合、Ahrefsが「勝ち」に対する「ポイント」を獲得することになる。そして、我々は残りの999,999ドメインに対し、この作業を行ったのである。
その結果、参照ドメインの比較では、勝者はSEO PowerSuiteであった。
バックリンク数における勝者は誰か?
バックリンク数のトータルの数では、Semrushが47.65%の勝率であり、トップだ。そして、SEO PowerSuite(21.38%)、Ahrefs(16.25%)と続く。Majesticはバックリンク数が最も少ない数であり、勝率は14.73%であった。
バックリンク数を絶対数で表したグラフは下記である。
バックリンク数の比較での勝者は、Semrushであった。
比較対象の順位分布はどのようなものか?
さらに、それぞれの比較の中で各ベンダーが1位、2位、3位、4位を獲得した頻度を計算してみた。
参照ドメインの順位分布は以下の通りである。
また、各ベンダーのバックリンク数の採点は、下記の通りである。
重要事項
あらゆるテストには限界があり、今回のテストも、その例外ではない。バックリンクのデータベースの調査を行い、完全に偏りの無い結論を出すことは、非常に困難である。
下記に、どんなバックリンクの調査においても、あなたが留意すべき重要な点をまとめてみた。
バックリンクのインデックスの種類
バックリンクのデータをカウントし、保管するために、各社がクロールに対する異なるアプローチを採っているため、あらゆるバックリンクのインデックスはユニークなものとなる。そのため、バックリンクのインデックスを比較するという行為は、本質的に異なるデータベースを分析するという、大きな欠点を含むことになってしまう。
我々の調査では、APIを介してデータにアクセスしたが、それらが返すデータは下記の通りだ。
- Ahrefs Live index(現存しているあらゆるリンク。再クロールされ、リンクがないと判断されるまで、そのリンクは現存のリンクとみなされる)
- Semrush Fresh index(過去6か月間でクロールされたあらゆるリンク)
- Majestic Fresh index (過去4か月間でクロールされたあらゆるリンク)
- SEO PowerSuite backlink indexは、あらゆる現存するリンクを含む(Ahrefsと同様、我々のインデックス内のリンクは、再クロールされ、リンクがないと判断されるまで、現存するリンクとして扱う)
AhrefsやSEO PowerSuiteと異なり、SemrushとMajesticは現存するリンクと現存しないリンクをレポートに含む。その結果、多くの場合で、バックリンクの数に大きな差異が生まれてしまう。
例えば、SemrushでAmazon.comのバックリンクを確認すると、このドメインは180億以上のバックリンクを獲得していることがわかる(これは、API経由でも確認できる数字だ)。しかし、アクティブリンクのモードに切り替えると、僅か700万リンクしか表示されない。
Ahrefsのインデックスは現存するリンクを含めているが、それでもいくつかの不一致は確認できる。AhrefsのAPIは1億1400万のバックリンク数を返すが、これはサマリーダッシュボードに表示される数字と近しい。しかし、バックリンクのレポートに切り替えると、僅か3500万件のリンクしか表示されない。
この不一致の背景には十分な説明があるはずだが(低品質なリンクや、なくなったリンクがフィルタリングされたのかもしれない)、このことから2つの重要な結論を下すことができる。
- APIによって獲得できるバックリンクのインデックスについて、100%の確信を持つことはできない
- こうした不一致を調査から排除することはできない
リンク数の算出方法の違い
バックリンクのインデックスを比較する際に直面する別の課題として、リンク数の算出方法の違いが挙げられる。例えば、同一ページ内の重複リンクを1つのリンクとして算出することもできるし、複数のリンクとして算出することもできる。これは、リダイレクトやカノニカルについても同じことが言える。これらすべてが、総数の算出に影響を与えるため、バックリンクのインデックスを比較する際は、数値を鵜呑みにすることができないのである。
IPを記録する方法の違い
同様に、バックリンクのAPIのプロバイダーが、IPのデータをどのように記録しているかも、問題となる。多くのプロバイダーが、バックリンクを探す際に発見した最新のIPだけをカウントしている。つまり、各ドメインにつき、1つのIPしか記録されない。しかし、Semrushは過去6か月で検出したあらゆるIPを記録しているようである。そのため、同一のドメインに対し、数十のIPを記録している可能性がある。
IP/サブネットの統計は、ローデータ内に含まれている。当初、我々は、この数をレポートに使用する予定であった。しかし、IPの計算における決定的な差異に気付いたため、この統計データは意味のある結論を導くために使用すべきではないと考えたのだ。
参照ドメインに対する理解の違い
ドメインは、もちろん、ドメインである。しかし、我々の調査によると、バックリンクのインデックスの場合、事態は少々複雑になるようだ。
ベリサイン社によると、「2021年の第二四半期では、全てのトップレベルドメイン数は、3億6730ドメインであった」とのことである。
そして、多くのデータプロバイダーが、インデックスされているドメイン数を一致させている一方で(Ahrefsは1億9340万ドメイン、SEO PowerSuiteは2億6400万ドメイン)、Semrushは16億ドメインを保持していると主張しており、これは懐疑的な数字である。
このように、Semrushがユニークなドメインとして算出しているものは、一般的な概念とは異なるようである。
結論から言うと、この種の比較においては、勝者も敗者もないだろう。前述の通り、あらゆる要素や異なるアプローチが影響するからである。
しかし、我々がこうした調査を行うにつれ、バックリンクのインデックスデータのプロバイダーは、長期的に、自社のデータに対する透明性を高めていくと考えている。そして、企業やAPIを活用しているユーザーが、自身が何に対して支払いを行っているのかを、より良く理解できることを意味している。
記事内でも言及されている通り、そもそものデータベースの内容が異なることもあり、単純に比較するには難しいトピックと言えます。しかし、こうしたベンダーが提供するデータが絶対的なものではなく、あまりに固執してしまうと間違った結論を導いてしまうかもしれません。各ベンダーはデータの透明性を高めるための工夫を今後も行っていくと思いますが、ユーザーとしては歓迎すべき傾向であると考えています。
この記事は、Search Engine Landに掲載された「Top 4 backlink API vendors compared (1 million domain study)」を翻訳した内容です。
投稿 100万ドメインの調査を実施。バックリンクAPIベンダーのTOP4社を徹底比較。 は SEO Japan|アイオイクスのSEO・CV改善・Webサイト集客情報ブログ に最初に表示されました。