Canonical URL

Canonical URLとは何でしょう?

普通にWebサイトをブラウズしている場合は、最終的にHTMLをブラウザが解析して人間が中身を見るので問題ないのですが、Webサイトのシステム構造上、まったく同じ内容を別のURLで表示させることがあります。

検索エンジン3社、正しいサイトURLを認識させるcanonical属性を導入(URLの正規化)

を引用すると

SONYのデジカメ「cyber-shot T700」の商品詳細ページが、(1) ブランド「デジカメ」カテゴリ、(2) ブランド「cyber-shot」カテゴリ、それぞれの直下に、コンテンツが全く同一(重複)ながら異なるURLで作成されたとしよう(こういうECサイトは結構ある)。この場合、商品詳細ページ「T700」が2ページ作成されることになるが、検索エンジンはどちらのページをインデックスすればいいのか判断ができない。

前述のように、内容だけを見る場合はURLなんてどうでも良いが、検索エンジンのクローラが同じようなページに遭遇して「結局どれが本当なのよ?」とはなかなか結論が出ませんので、結局すべてのサイトを別サイトとして認識します。
結果、検索エンジンの表示順位に影響を与えてしまい、たとえば同じキーワードでの検索で同内容で別URLとして表示されてしまったりします。もっと悪いことにそのページ自体の順位が落ちてしまうことも考えられます。

そこでGoogle, Yahoo, Mictosoftでそんな場合の標準を決めたそうです。
ページの<head>~</head>内に以下引用の記述で最適なURLを記載します。

<link rel="canonical" href="http://mysite.com"/>

ここで指定したhref要素の記述を参考に、検索エンジンが「結局どれなのよ?」というのを決めます。
この場合の別URLの内容は、完全に同じでなくてもよいようで、動的に出力するようなWebサイトの場合(というかこんなのを使うところは動的なサイトでしょう)には便利でしょう。

Word PressのプラグインにもCanonical URL’s for WordPressというのがあったので早速入れてみました。


Leave a Reply