Canonical URL
Canonical URLとは何でしょう?
普通にWebサイトをブラウズしている場合は、最終的にHTMLをブラウザが解析して人間が中身を見るので問題ないのですが、Webサイトのシステム構造上、まったく同じ内容を別のURLで表示させることがあります。
検索エンジン3社、正しいサイトURLを認識させるcanonical属性を導入(URLの正規化)
を引用すると
SONYのデジカメ「cyber-shot T700」の商品詳細ページが、(1) ブランド「デジカメ」カテゴリ、(2) ブランド「cyber-shot」カテゴリ、それぞれの直下に、コンテンツが全く同一(重複)ながら異なるURLで作成されたとしよう(こういうECサイトは結構ある)。この場合、商品詳細ページ「T700」が2ページ作成されることになるが、検索エンジンはどちらのページをインデックスすればいいのか判断ができない。
前述のように、内容だけを見る場合はURLなんてどうでも良いが、検索エンジンのクローラが同じようなページに遭遇して「結局どれが本当なのよ?」とはなかなか結論が出ませんので、結局すべてのサイトを別サイトとして認識します。
結果、検索エンジンの表示順位に影響を与えてしまい、たとえば同じキーワードでの検索で同内容で別URLとして表示されてしまったりします。もっと悪いことにそのページ自体の順位が落ちてしまうことも考えられます。
そこでGoogle, Yahoo, Mictosoftでそんな場合の標準を決めたそうです。
ページの<head>~</head>内に以下引用の記述で最適なURLを記載します。
<link rel="canonical" href="http://mysite.com"/>
ここで指定したhref要素の記述を参考に、検索エンジンが「結局どれなのよ?」というのを決めます。
この場合の別URLの内容は、完全に同じでなくてもよいようで、動的に出力するようなWebサイトの場合(というかこんなのを使うところは動的なサイトでしょう)には便利でしょう。
Word PressのプラグインにもCanonical URL’s for WordPressというのがあったので早速入れてみました。