リンク評価の分散を防ぐ!canonical属性で正しいURLを認識させる!

canonical

canonical属性ってご存知ですか?
以前から言葉だけは知っていましたが、最近よく見聞きするようになってきました。
(モバイルフレンドリーが重要視されるようになってから特に顕著に感じます)

今回は、このcanonical属性の意味と必要性について学んでいきましょう。

 

canonical(カノニカル)属性って何?

canonical属性とは、「同一コンテンツなのに複数URLが存在する」というページのURLを一つにまとめ(URLの正規化)、Googleに明示的に伝える方法の一つです。

通常Googlebotは、重複したコンテンツのURLがある場合、どのURLを検索結果に表示すべきかを自身で判断しますが、そのURLが多い場合などは自身での判断が難しくなってきます。
そこでcanonical属性が役に立ってくるわけです。

重複したコンテンツページがあった場合でも、canonical属性が指定してあれば、Googlebotはそれをヒントにして最適なページをインデックスすることが可能になります。
具体的に以下のようなケースでcanonical属性が必要になってきます。

 

www表記や、index.php等のファイル名の有無

以下4つのURLは表記がそれぞれ違いますが、すべて同一のページにアクセスします。

http://www.pstakumi.net

http://pstakumi.net

http://www.pstakumi.net/index.php

http://pstakumi.net/index.php

 

PC用ページとスマホ用ページが存在する場合

デザインやレイアウトは異なるが、コンテンツが同一なPC用ページとスマホ用ページが存在する場合にもcanonical属性による正規URLの指定は必要です。

http://www.hoge.jp

http://www.hoge.jp/sp/

※PC向けのみのページ、スマホ向けのみのページ(対になっていないページ)といった場合は設定は不要です。

 

複数カテゴリ配下に同じ記事を紐付けたため、システム上複数URLが生成されてしまう場合

例えばECサイトにおいて仮にiPhoneを販売していた場合、「スマホ」カテゴリに紐づく一方で、「Apple」カテゴリに紐づくようなケースは多いと思います。
上記のような複数カテゴリに紐づく商品は、結果的にコンテンツは同一なのに2つURLが生成されてしまうことになります。

http://www.hoge.jp/smartphone/iphone/

http://www.hoge.jp/apple/iphone/

 

複数URLを持つ上でのデメリット

このように同一コンテンツで複数URLを持っている場合、以下のようなデメリットが考えられます。

  1. 意図したページをインデックスさせることができない
  2. URLが複数あるので、リンク・ページランクなどの評価も分散されてしまう
  3. 場合によってはgoogleからペナルティを受けてしまう(※)

(※)www有・www無などのように、意図せずできてしまった重複コンテンツはそこまでペナルティを恐れる心配はありません。
(大規模サイトで重複ページを(悪意なく)大量につくってしまっている場合などは例外だそうです)

いわゆるブラックハットSEOとして、悪意をもって誘導ページやサテライトページを量産した場合は、Googleからペナルティを受ける可能性があります。

以下のブログで重複コンテンツの扱いについて詳しく記載してあります。

ほとんどの場合には、重複コンテンツが本当にスパムとして扱われることはない。適切にまとめる必要があり正しく順位づけする必要があるものとして扱われているに過ぎない。

参考:「重複コンテンツはスパムでGoogleにペナルティを受ける」は、なぜ間違いなのか

 

canonicalの設定方法

canonicalの設定は非常に簡単です。
htmlソースの<head>セクション内に以下の一文をいれるだけです。

<link rel="canonical" href="http://○○○○" />

href属性の中は実際に使用するURLをいれてください。
例えば、冒頭で挙げた例で言うと、

http://www.pstakumi.net

http://pstakumi.net

http://www.pstakumi.net/index.php

http://pstakumi.net/index.php

このURLの内、2番目のURL(www無し・ファイル名無し)を実際に使っていきたい場合は、

<link rel="canonical" href="http://pstakumi.net" />

と書けばOKです。

 

こうすることでGoogleは、複数あるURLの中からどれを検索結果に表示すべきかを理解することが出来ます。

 

間違った設定でインデックスから消える?

意図した検索結果を反映させるためにも、Googleに正規化したURLを伝えることは大事です。
しかし、canonicalタグの使い方を誤るととんでもない事態が起こりかねません。

僕が何度か目にしたrel=”canonical”タグのトラブルは、サイト内のすべてのページで、rel=”canonical”タグでトップページを指定してしまい、トップページ以外がインデックスから消えるケースです。
参考:rel=”canonical”タグの誤用でインデックスから消滅

人間のやることですから、絶対にミスは起こります。
しかし、トップページ以外がすべて検索結果に表示されなくなってしまうというのは笑い話にはなりませんよね。

Googleはあくまでcanonicalをインデックスのヒントとして参照しているので、canonicalタグで指定したものが絶対にインデックスされる訳ではありませんが、Googleのインデックスの判断基準としてcanonicalは大きなウェイトを占めていることは間違いなさそうです。

誤った設定方法をしたところで、中々気付くのにも時間がかかりそうなので、canonicalを設定するときは十分に注意しておきたいです。


関連記事

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

ページ上部へ戻る