検索エンジンのヒント:ドキュメントの優先バージョン
データドリブンサイトを運営したり、文書が重複するその他の理由がある場合、検索エンジンにマスターコピーか専門用語である「正式な」コピーを伝えることが重要です。 検索エンジンがページにインデックスを付けると、コンテンツが複製されたことを知ることができます。 追加情報がなければ、検索エンジンは顧客のニーズを最もよく満たすページを決定します。 これはうまくいくかもしれませんが、古くなったページと古くなったページを配信する検索エンジンのインスタンスが多くあります。
正準ページを指定する方法
あなたの文書のメタデータを持つ標準URLを検索エンジンに伝えるのはとても簡単です。 標準ではないすべてのページで、次のHTMLをHEAD要素の上部に配置します。
HTTPヘッダー(.htaccessやPHPなど)にアクセスできる場合は、PDFのようにHTML HEADを持たないファイルに標準URLを設定することもできます。 これを行うには、以下のように非正規ページのヘッダーを設定します。
リンク:< 標準ページのURL >。 rel = "canonical"
正準タグがどのように機能するのか
標準的なメタデータは、マスタであるページを検索するヒントとして使用されます。 検索エンジンはこれを使用してインデックスを更新し、マスターコピーをプライマリコピーとして参照し、検索結果を提供するときに正規のものと信じているページを配信します。
しかし、指定した正規のページは、検索エンジンが提供するページではない可能性があります。
これが起こる理由はたくさんあります。
- 指定したURLが404見つからない場合、検索エンジンは配信する最も関連性の高い2番目のURLを見つけようとします
- あなたのサイトが偽のカノニカルURLを追加するためにハッキングされていると検索エンジンが判断した場合、そのURLは使用されません(もちろん、この場合は大きな問題になります)
- タグにリンクを挿入すると、HEADタグが閉じられていないと思われる何らかの理由があります。 これは、多くのWebサイトでは、ユーザーがBODY要素内のページのコンテンツを編集できるようになっているため、正式な参照がないと信頼できないと判断されるためです。
何がRel = Canonicalタグではないか
多くの人は、rel = canonicalリンクをページに追加すると、そのページはHTTP 301リダイレクトなどの標準バージョンにリダイレクトされると信じています。 それは本当ではありません。 rel = canonicalリンクは検索エンジンに情報を提供しますが、ページの表示方法やサーバーレベルでのリダイレクトには影響しません。
標準的なリンクは、最終的には単なるヒントです。 検索エンジンはそれを尊重する必要はありません。 ほとんどの検索エンジンはページ所有者の願いを尊重するよう努力していますが、その日の終わりに検索結果が表示され、正規のページを提供したくない場合は検索結果は表示されません。
標準リンクを使用する場合
上で述べたように、標準ではないすべての重複ページにリンクを使用する必要があります。 類似しているが同一ではないページがある場合、標準的なページを作成するよりも、異なるページに変更する方が理にかなっていることがあります。
絶対的に同一ではない2つのページを正準としてマークすることは可能です。 それらは似ているはずですが、単にあなたのホームページにすべてのページを指すべきではありません 。 Canonicalは、そのページがそのドキュメントのマスターコピーであり、サイトのどの種類のマスターリンクでもないことを意味します。
私は最後のことを繰り返すことが重要だと思います。たとえあなたがそうするように誘惑されていても、標準ページとしてあなたのホームページをあなたのホームページに向けるべきではありません。 これを行うと、偶然にも、標準ではないページ(つまり、ホームページではないすべてのページにrel = canonicalリンクがある)が検索エンジンのインデックスから削除される可能性があります。
これは悪意のあるGoogle(またはBingやYahoo!などの検索エンジン)ではありません。 彼らはあなたがしたことをやっている - すべてのページをあなたのホームページの複製とみなし、すべての結果をそのページに返すことを考えている。 顧客がより関連性の高い文書ではなくホームページに迷惑をかけてしまうと、そのページはあまり人気がなくなり、検索結果に表示されなくなります。 問題を解決しても、その後数か月は検索結果を殺すことができ、サイトのランキングが回復するという保証はありません。
なんらかの理由で検索から除外されたページ標準を作成しないでください(noindexメタタグやrobots.txtファイルで除外されるなど)。 検索エンジンが正規のページを参照するには、最初にそのページを参照できる必要があります。
rel = canonicalリンクを使用するのに適した場所は次のとおりです。
- 動的URLを使用しているサイト - 好きなURLフォーマットを定義するために使用できます
- eコマースサイト、特に商品リスト - お客様がソート基準を変更すると、その新しいURLをインデックスに登録する必要はありません
- シンジケートコンテンツ - あなたが書いたコンテンツを使用しているサイト運営者は、元のドキュメントを指しているページにrel = canonicalリンクを含める必要があります
Canonical Linkを使用しない場合
最初の選択肢は301リダイレクトでなければなりません。 これは、ページのURLが変更されたことを検索エンジンに知らせるだけでなく、最新の(そして私が言うcanonicol?)バージョンのページに人々を連れて行きます。
怠惰にしないでください。 URL構造を変更する場合は、HTTPヘッダー操作(.htaccessやPHPなどのスクリプト)を使用して301のリダイレクトを自動的に追加します。
rel = canonicalリンクを使用することはできますが、古いページは表示されません。 そして誰でもいつでもそれらに行くことができます。 実際、顧客がページをブックマークしていて、URLを変更してrel =標準リンクを使用して検索エンジンを更新するだけの場合、その顧客は新しいページを見ることはありません 。
rel = canonicalリンクは、重複したコンテンツが多いサイトにとって便利なツールです。 どのように動作するかを理解することで、効果的に使用できます。 しかし、最終的には検索エンジンによってリリースされ、検索インデックスを最新の状態に保つのに役立つツールです。 サーバーをきれいにして最新の状態に保てないと、顧客に影響を与え、サイトが傷つける可能性があります。 責任感を持って使用してください。