原題:The Latest In Advanced Technical SEO
このセッションは以下の3セッションで構成されています。
Googleが伝えたい”http/2″と”https”と”レンダリング”について
Speker:Maile Ohye,Senior Developer Programs Engineer,Google Inc.
httpについて
httpについて1970年台は非常にシンプルなものだった。当時はサイトを構成する要素が少なかったが、現在は様々な要素を用いてサイトを作成している。httpのパフォーマンスを向上させるために様々な手法が用いられているが、http自体を速くすることが可能である。
http/2の利点
http/2には幾つかの利点があるが、具体的に挙げると以下のようになる。
- 複数のファイルを同時に送ることができる。
- どのデータをまずはダウンロードするか優先順位を付けることができる。
- ヘッダを圧縮(サイズを小さく)することができる。
Googleもクロームが今後http/2をサポートしていくことをブログで報告している。
httpsについて
httpsはますますデフォルトとなりつつある。Gメール、Facebook、Twitterなども全てhttpsに対応している。セキュリティを強めることがスタンダードとなっているのだ。
https対応のステップ
httpsへの対応を検討しているのであれば、すぐにでも開始すべきだ。しかし、確かな手順で行う必要がある。以下にその手順をまとめてみよう。
- 多くのブラウザに対応されている、2048ビットのTLS証明書を認証を受けた機関から取得する。
- TLS証明書を設定する。
- サーバーのパフォーマンスを確認し、必要であれば調整する。
- httpからhttpsへ301リダイレクトを設定する。(両URLをアクセス可能にしない)
- 挙動を確認する。
-CSS、JavaScript、画像などのリソースを全てhttpsに通す。
-ページ内の全てのマークアップがhttps対応になっているか確認する。
レンダリングについて
Googleのレンダリングのパフォーマンスを確認するために、Fetch as Googleを使用しよう。最初の200KBのコンテンツに何が表示されるか?ブロックしているリソースがあれば修正しよう。また、サーバーのパフォーマンスに優先順位をつけよう。
Googleが考えるレンダリング
レンダリングにおけるGoogleの目標は、ユーザーが見るのと同様に、サイトを見ることだ。適切にレンダリングができれば、より多くのコンテンツをインデックスに加える事ができる。また、モバイルかデスクトップかなど、レイアウトの判断も向上する。Googleはユーザーにとって価値のあるコンテンツを全てインデックスしたいと思っている。
隠れたコンテンツがないか?
重要なコンテンツを読むために、クリックやマウスオーバーを要求していないだろうか?そうであれば、すぐにそれらをやめるべきだ。”隠されたコンテンツ”をGoogleは”重要度が低いコンテンツ”と認識することを忘れないで欲しい。重要なものは上に置く、の原則に従ってほしい。
ページを構成する要素が多い場合
例えば、Eコマースのサイトで100個の商品があるページの場合などは特に注意だ。ページのリソースは全てクロールされるようにしよう。商品や記事と平行して優先順位をつけ、キューに加えるようにしよう。
CSSとJavaScript
CSSとJavaScriptはクロール可能な状態にしておこう。ユーザーにとってはきちんと表示され、モバイルフレンドリーのサイトと認識されるかもしれないが、ブロックしていると、Googleは内容を確認できない。結果、Googleにとってはモバイルフレンドリーのサイトでなくなってしまう。
あなたがGoogleに送るべき、技術的なシグナル
Speaker:Jenny Halasz,President, Founder,JLH Marketing
シグナル
シグナルとはGoogleにあなたが何をしているか、していないかを伝える手段である。
決定的なシグナル
まずは最も重要なシグナルをまとめてみよう
- 301リダイレクト
恒久的な移動を意味する。サーバー側で設定し、デフォルトではなく、リンクのパワーを渡す。 - ページ削除
404(Not Found)はデフォルト、410(Gone)はデフォルトでない。 - noindex
ページ単位で設定が可能。デフォルトではなく、nofollowを設定していなければ、リンクパワーは渡される。設定されたページはインデックスされない。 - robots.txt
ディレクトリかページ単位で設定が可能。インデックスは(おそらく)される。リンクのパワーは渡される。
それでも重要なシグナル
非常に強いシグナルではあるが、決定的ではない。
- rel=canonical
重複コンテンツを知らせる。https設定の場合は気をつける。 - rel=next/prev
連続したページの関係性を伝える。外部・内部のリンクに気をつける点はrel=canonicalと同じ。 - hreflang
言語の設定を伝える。言語と地域の設定から成り、言語だけでは使えるが、地域だけでは使えない。
よくある間違い
- リダイレクト(wwwの有り無し、httpとhttpsなど)
- パンくずリスト
- サーチコンソールのパラメータ
IBMのサイトに起きた、技術的な問題
Speaker:Christine Smith,IBM Search Marketing Technical Lead,IBM
IBMのサイトに実際に起こった出来事
このセッションではIBMに実際に起こった技術的なエラーの内容と修正方法をお話する。具体的には、1.数千ページがインデックスから消失、2.内部リンク評価、3.URLの特定の不備、というストーリーだ。
1.数千ページがインデックスから消失
サーバーやソフトウェア用のセルフサポートのページがインデックスからなくなってしまった。2013年の出来事で、月のトラフィックの24%が減少した。検索結果に出てこなくなってしまったのだ。
原因究明
検索結果から消えた30ページを抜粋し、色々と確認。ページの表示、リダイレクト、canonical、tobots.txtなど。
サイトマップが原因?
全体の10%しかインデックスされていなかった。そのため、サイトマップを再度作成し、canonicalに注意しながらURLを訂正した。この作業で全体の60%(現在は88%)がインデックスされたが、Googleからの流入の改善はされないまま。
Googleに相談
2014年の4月と5月にGoogleに相談したところ、対象の30ページが重複コンテンツと見なされており、最後のクロールが2013年の11月となっていたことが判明した。その後、状況の説明と伴に再審査リクエストを提出し、クロールの頻度をあげることもリクエストした。その結果、6月には22%までインデックス数が増加した。
原因は?
おそらく、リダイレクトの不備(メンテナンスページヘのリダイレクトなど)と500や504の設定が疑わしい。サイトがメンテナンス状態の場合は503を設定し、Googleが再度クロールしてくれる状態にしておこう。
2.内部リンク評価の消失
IBMのsmarterplanetというサイトが”カード”システム(各記事をカードのように選り分けるレイアウト)を採用したが、その”カード”が内部リンクの評価を受けていないようだ。
原因は?
robots.txtがJavaScriptをブロックしており、JavaScriptがカードをレンダリングしていた。robots.txtのブロックを解除した後、Googleは内部リンクの評価を認めてくれるようになった。しかし、BaiduやYandexはJavaScriptをサポートしていないことは要注意。
3.URLの特定の不備
IBMのとあるサイトにある既存のコンテンツを別のプラットフォームに移動した。そこではコンテンツが動的に再作成されるようになっていた。
検索結果に現れなくなった
原因はcanocnicalの設定に不備があったことだ。結果、全てのコンテンツが重複コンテンツと見なされ、Googleのインデックスから削除されてしまった。canonicalのコードを再度見直した結果改善されたが、canonicalの設定とエンコード文字には特に気をつけることを薦める。
全体のストーリーで学んだこと
- “canonical”、”robots.txt”、”リダイレクト”は常にダブルチェックしよう。
- サイトマップはよく確認しよう。
- サイトメンテナンスの際は503を使おう。