重複コンテンツを理解し、WordPressでそれを根絶するためのガイド
公開: 2021-12-16人生において、特定のものが私たちを狂わせることができる方法は狂っています。 恥ずかしがらずにスーパーで並んでいる人のことを考えています。
パスタアルデンテを調理せず、沸騰したお湯に入れるときに切る人…または、早朝の目覚まし時計が鳴り響き、再び鳴り響き、素敵な暖かいベッドから出ます。

そして、重複するコンテンツを見つけます。 あなたが知っている、あなたが別のウェブサイトで一語一語あなたのコンテンツの全部または一部を見つけるその不快な瞬間。
または、その古き良きCtrl+C Ctrl+V (またはプロMac群衆の場合はCmd+C Cmd+V )が再び大混乱を引き起こしたとき。 彼らが言うように、それは本当にあなたを夢中にさせます。
重複するコンテンツは、他の人のサイトで見つけた場合に実際の問題になりますが、知らないうちに自分のWordPressサイトに表示されることもあります。
これは、特にSEOに悪影響を与える可能性があるため、同じように煩わしいものです。
これを避けるために、私に従ってください!
この投稿では、このひどい重複コンテンツについてのすべて、特にそれを取り除くための具体的な解決策を学びます。 そして、私は約束します、それは大騒ぎがないことが保証されています。
概要
- 重複コンテンツとは何ですか?
- 重複するコンテンツを見つけて認識する方法は?
- WordPressの内部重複コンテンツの原因(およびそれを解決する方法)は何ですか?
- 重複する外部コンテンツを取り除くための3つのステップ
重複コンテンツとは何ですか?
重複コンテンツとは、同じWebサイトの異なるページであろうと、他のWebサイトであろうと、一度に複数のWebアドレス(URL)で類似しているコンテンツです。
これはグーグルのような検索エンジンの仕事を複雑にします、そしてそれは彼らのSERP(検索エンジン結果ページ)で重複したページをより低くランク付けすることを選ぶかもしれません。
明確にするために、重複コンテンツには主に2つのタイプがあります。
- ほとんどの場合、実際には知らないうちにサイトで発生する内部重複。 それらがあなたの知らないうちに作られているとしましょう。
- 他のサイトが自分のページのコンテンツの全部または一部をコピーする場合の外部複製。
トレーシングペーパーの画像
さて、重複コンテンツとは何かを説明するために、数年(長い)年を遡ってみましょう。小学校のベンチとアートのレッスンです。
同じ手書きの絵を再現できる有名なトレーシングペーパーを覚えていますか? まあ、重複コンテンツは少しそのようなものです。
基本的な図面がコンテンツの元のURLを表しているとします(例https:// )。 yourwebsite.com/your-awesome-post/ 。https:// yourwebsite.com/your-awesome-post/
トレーシングペーパーを使用して同じように(または部分的に)複製された図面は、複製されたURLを示しています: https://yourwebsite.com/your-awesome-post-bis/ ://yourwebsite.com/your-awesome-post-bis/。
それはあなたにとって明らかですか? それから未来に戻って、私は現在を意味します。

Webの4分の1以上が複製されています
2013年、元GoogleエンジニアのMatt Cuttsは、ウェブ上で公開されたコンテンツの25%から30%が重複すると述べました。
この統計が少し戻ったとしても、かなりの大きさのオーダーが得られます。
幸いなことに、グーグルが述べているように、 「ほとんどの場合、これは起源を欺くものではありません」。
これは、重複コンテンツの原因が技術的で意図的でないことが多いことを意味します。つまり、あなたがいるWebマスターが意図的に重複コンテンツを作成することはありません。
したがって、世界で最も使用されている検索エンジンであるGoogleは、検索結果を「だまして操作」することが目標でない場合、ペナルティを科す傾向はありません。
ただし、注意してください。Googleがこの慣行をスパムと見なさない場合、重複も実際には好きではありません。
どうして? なぜなら、最終的には、インデックスを作成して「個別の情報を含むページを表示する」ために特別な努力を払う必要があるからです。
SEOでは、インデックス作成フェーズは、検索エンジンロボットがWeb全体のページをスキャンして、インデックス(一種の巨大なデータベース)に分類する瞬間に対応します。
グーグルのような検索エンジンがその結果ページ(SERP)に最も関連性のある結果を表示できるようにするために描くのはこのインデックスです。
Googleは重複コンテンツをどのように処理しますか?
ええと、グーグルについて話すときは「それ」と言いますが、実際には、スパイダーまたはグーグルボットとも呼ばれる「グーグルのロボット」と言うべきでした。
重複を見つけた場合の動作の概略図を次に示します。
- 彼らは、リンクからリンクへとナビゲートすることによって、新しいコンテンツを求めてWebを閲覧します(Webは巨大であることを忘れないでください)。
- 重複するコンテンツに遭遇すると、それらをクラスターにグループ化します。
- 次に、このクラスターに存在するコンテンツの最良の結果を表示します。

シニアボーナスではなく、人気ボーナス
問題は、この最良の結果が必ずしも元のコンテンツ(重複していないコンテンツ)に対応するとは限らないことです。
この点で、グーグルのせいにするのは難しい。何千もの同じコンテンツの中からオリジナルを見つけなければならないとき、その仕事がどれほど難しいか想像してみてください!
先に進むために、ダニエル・ロックが言うように、グーグルはコンテンツの公開の日付に依存しません。
「各コンテンツの日付を管理で自由に変更」できるので、単純すぎます。
Googleは、 「誰がコンテンツの発信元であり、誰が盗用の可能性があるかを判断するために、URLとドメインの人気」に依存しているとDanielRoch氏は付け加えます。 「言い換えれば、人気の高いサイトがあなたからコンテンツを盗んだ場合、あなたは検索エンジンとの戦いに負けます」。
興味があれば、同じマット・カッツがこのビデオでこれを詳しく説明しています。
このデモンストレーションから、2つの主要なことを覚えておくことができます。
- Googleは、「ランキングを操作してユーザーを欺くために」作成された「まれなケース」を除いて、厳密に言えば重複コンテンツにペナルティを科しません。 この場合、当該サイトは「検索結果に表示されなくなります」 。
- それ以外の場合、重複するコンテンツにはペナルティはありませんが、まったく同じです。 あなたが重複コンテンツの被害者であり、Googleがあなたのコンテンツの元のバージョンを表示しないことを決定した場合、あなたはその検索結果ページに表示されなくなります。
その結果、検索エンジン最適化(SEO)アクションは重大な結果を招く可能性があります。

SEOの重複コンテンツの影響は何ですか?
コンテンツが重複していると、コンテンツのSEO (検索エンジン最適化)に悪影響を与える可能性があります。
つまり、サイトのトラフィックが減少し、いくつかの理由で検索結果ページの位置が失われる可能性があります。
- Googleは、重複コンテンツの元のバージョンがどれであるかを正確に把握していないため、1つだけを表示し、検索結果で他のすべての同一の結果を「非表示」にします。
- 他のユーザーがあなたの複製コンテンツに対して作成するバックリンクは、効果が低くなります。 リンクは複数の重複する出版物に分散されるため、電力が少なくなります。 ただし、コンテンツのバックリンクの関連性が高いほど、ランクが高くなる可能性が高くなります。
- 検索エンジンは重複コンテンツのクロールにより多くの時間を費やす必要があり、新しい「元の」コンテンツのインデックス作成が遅くなるリスクがあるため、より多くのクロール予算(GoogleがWordPress Webサイトでクロールできる最大ページ数)を消費します。またはまったくインデックスを作成しません。
重複するコンテンツは影に潜んでいることが多く、常に識別して飼いならすことができるとは限らないため、次のパートで、コンテンツのマスクを解除するいくつかの方法を見つけてください。

重複するコンテンツを見つけて認識する方法は?
あなたの目で:視覚的な方法
それらを閉じてスリープ状態にし、目を覚ますとすぐに大きく開いて、この記事を読んでください。目は、重複コンテンツ、特に外部の重複の可能性のある痕跡を検出する最初の武器です。
想像してみてください。数か月前に、おいしいチョコレートブラウニーの作り方のヒントを紹介する投稿を公開しました。
これで、元のソースから単語ごとにいくつかの箇所を複製した出版物に出くわしました。 "とんでもない! 私はこれを書いた、あなたは泥棒だ!」
はい、それはあなたです、そしてあなたは盗作されました。 さて、記事全体がコピーされて貼り付けられたわけではありませんが、コンテンツが重複している状況にあるのではないかと思うかもしれません。 いい視点ね。
この件に関して、正確な規則はありません。 つまり、次のように、超えてはならない制限を定義している検索エンジンはありません。 「コンテンツの40%をコピーすると、複製者としては不適切です。 「「
あなたを助けるために、文章全体がコピーされた場合、Googleは「コンテンツの大きなブロック」について話していることを覚えておいてください-あなたはコンテンツが複製されていると考えることができます。
あなたは泣く目が残っていますが、涙を乾かすための可能な治療法もあることを知っています。 この投稿の後半でそれに戻ります。
目の後には、2つ目の武器があります。それは、重複するコンテンツを検出するためのツールです。
専用ツールを使用:サードパーティの方法
内部および外部の重複を検出するためのいくつかのソリューションが市場に出回っています。 プレゼンテーション。
複製を殺す

Kill Duplicateは、特にコンテンツをスキャンすることにより、外部の重複を特定するのに役立つ重要なプレミアムツールです。
完全で、ダッシュボードで直接解決策を提案することで盗用に対処するのにも役立ちます(たとえば、ホスト、サイトに連絡する、または苦情を申し立てる)。
価格:€19 /月から( 除くVAT)すなわち±21ドル。
Copyscape

Copyscapeは、Web上でページのコピーを見つけるのに役立つフリーミアムソリューションです。 使用するには、検索バーに選択したURLを入力するだけです。
次に、誰もあなたをコピーしていないことを指で交差させます。
次に、Copyscapeが識別したパブリケーションをチェックして、コンテンツが複製されているように見えるかどうかを確認できます。
Copyscapeは、はるかに高度な機能を備えたプレミアムバージョンでも利用できます(検索あたり3セントから)。

DupliChecker

DupliCheckerは、「盗用防止ソフトウェア」としての地位を確立しています。 無料版では検索ごとに1,000語に制限されており、URLやテキストを入力するか、ファイルをダウンロードすることで、テキストの独創性を確認できます。
したがって、コンテンツの公開の前後に使用できます。 多くの広告の存在を後悔することができれば、DupliCheckerは、類似率を毎回表示することでいくつかの結果を表示するため、興味深いままです。

Proバージョンも$ 10から入手可能で、最大30,000語を使用できます。
サイトライナー

Sitelinerは、そのまま「サイトを探索」するのに最適です。つまり、内部の重複を特定するのに最適です。
結果をグラフの形式で表示します。 無料版では、30日に1回、最大250ページのサイトをスキャンできます。
Proオファーでは、最大25,000ページを処理し、識別プロセスから除外するページを選択できます。
悲鳴を上げるカエル

Screaming Frogは、重複するコンテンツを特定するための特別なツールではありません。 しかし、内部の重複を見つけることは依然として重要です。
これはクローラーであり、ページ上のSEOを分析するためのツールです。サイトのURLを抽出してスキャンし、問題(リンク切れ、 titleとmeta descriptionタグの分析、サーバーエラーなど)を探します。
したがって、ページのh1タイトル、 titleおよびmeta descriptionタグなどの特定の重複要素について通知することができます。
無料版では最大500のURLを分析できます。 Proバージョンの価格は年間149ポンド(つまり±197ドル)です。
Google検索コンソール

このツールのリストは、スイスアーミーナイフであるGoogle検索コンソールで終わります。
この無料のツールを使用すると、サイトをより適切に管理し、SEOを追跡できます。 それは多くの情報を提供します:あなたのサイトのエラー、検索分析、リンク、インデックス作成ステータス、クロールエラーなど。
上記の小さな友達とは異なり、Google検索コンソールはどのURLが内部で複製されているかを教えてくれません。
ただし、それはあなたが見つけるのを助けることができます。 これを行うには、[インデックス]> [カバレッジ]メニューに移動します。 あなたはできる:
- インデックス付きURLの数を確認してください。 あなたがあなたのサイトで206ページを作成し、そしてグーグルがそれらの674を索引付けしたことを知っているなら、あなたは確かにいくつかの重複したコンテンツが周りにあることを知っています…
- 除外されたURLをチェックして、重複するコンテンツボックスに収まるかどうかを確認します。

また、SemrushやAhrefsなどの多くのSEOツールには、サイト上の重複コンテンツを識別するのに役立つ機能もあります。
グーグルからの特定のコマンドで:手動の方法
この一連のツールの後、重複するコンテンツを見つけるためにアクティブにできる最後のレバーが1つあります。それはGoogleです。
これを行うために、有名な検索エンジンは演算子、つまり検索バーで指定して結果をより正確にフィルタリングできるコマンドを提供します。
それらのいくつかは、サイト検索オペレーター( site: :)のように、重複コンテンツを効率的にハントすることができます。 外部重複を検索するには、次のクエリを入力して、検索結果からドメイン名を除外します。
-site:yourdomainname.com "title of your publication" 。 これにより、次のWPMarmite記事の例で次のようになります-site:wpmarmite.com/en/ "test of 6 must-have SEO plugins on WordPress"

さて、それはあなたが飲み込んだばかりの大きな塊です。 これで、重複コンテンツとは何か、そしてそれを識別する方法がわかりました。
今、あなたはそれを取り除く必要があります。 この投稿の残りの部分では、停止する方法の詳細な手順に焦点を当てます。
- 内部重複
- 外部重複
WordPressのWebサイトで発生する可能性のある問題から始めることをお勧めします。
WordPressの内部重複コンテンツの原因(およびそれを解決する方法)は何ですか?
URL
URLは、Webページのアドレスです。 たとえば、WPMarmiteホームページは次のURLにあります: https://wpmarmite.com/en/ ://wpmarmite.com/en/。
ご想像のとおり、WordPress Webサイトのコンテンツが多いほど、URLも多くなります。 たとえば、大規模なeコマースWebサイトの場合、多くの製品を販売すると、数千のURLにすばやくアクセスできます。
ここまでは順調ですね。 ただし、有名なURLが気になる場合があります。
- 特定のページへの訪問を追跡するための指示が含まれている場合。 その後、URLの最後に新しいパラメータが自動的に追加されます。 たとえば、最初のURLは
https://yourpost.comになり、重複するURLはhttps://yourpost.com?utm_source=facebookになります。 あなたは違いを見ることができないかもしれませんが、検索エンジンはそうします。 - ナビゲーションをフィルタリングするためのパラメータが含まれている場合。 これは、ファセット検索を使用するWooCommerceストアでよく見られます。 これは、サイズ、色、価格などで製品を並べ替えることができるユーザーにとって非常に便利です。懸念されるのは、ほぼ一語一語同じコンテンツで、多くの重複ページが作成されることです。以下を参照してください。
-
https://yourstore.com/pants-black-size-m -
https://yourstore.com/pants-black-size-l
-
- スラッシュを区別せずに使用する場合。 例:
https://yourstore.com/pants-black-size-m://yourstore.com/pants-black-size-mとhttps://yourstore.com/pants-black-size-lは、Googleによって2つの異なるURLと見なされるため、コンテンツが重複しています。
重複するURLの問題を解決する方法は?
重複URLの問題を解決する最も簡単な方法は、301リダイレクトと呼ばれるものを実行することです。
リダイレクトを使用すると、URL A( https://mygreatwebsite.comなど)にアクセスしたい訪問者をURL B(例: https://myawesomewebsite.com )。
これは、リダイレクトプラグインを使用して簡単に行うことができます。
たとえば、robots.txtファイルを使用して、クローラーがWebサイト上の重複コンテンツにアクセスするのをブロックするのではなく、正規URLと呼ばれるものを使用できるとGoogleは述べています。
URLで特定の属性を使用することにより、重複ページの元のバージョンである検索エンジンに通知します。
このようにして、(重複バージョンではなく)結果ページに表示するために考慮されるのがこの元のバージョンであることを確認します。
参考までに、正規URLは、 rel="canonical"と呼ばれる少し余分なHTMLコードを使用します。 実際には、次のようになります。
<link rel="canonical" href="https://wpmarmite.com/en/astra-theme/" />
Yoast SEOプラグインを使用している場合は、プラグインの編集インターフェイスを介して正規URLを入力できます。

デフォルトでは、YoastSEOはパブリケーションのURLを正規URLとして追加することに注意してください。 ほとんどの場合、何もする必要はありません。
プロのようにYoastSEOを設定する方法については、このテーマに関する専用ガイドにアクセスしてください。
コメントのページネーション
URLの後で、WordPressのコンテンツが重複する2番目の原因であるコメントページ付けについて説明しましょう。
WordPressを使用すると、読者が投稿に残したコメントをいくつかのページに分割できます。
紙の上では、これはコメントがたくさんあるサイト/ブログにとって便利なようです。
読者は、最初に最新のコメントを表示してから、別のページに移動して古いコメントを読むことを選択できます。
ここに問題があります。 投稿のコンテンツとともに、ページごとに新しいURLが自動的に作成されます。
コメントページネーションの問題を解決するにはどうすればよいですか?
あなたができる主なことは、単にこのオプションを有効にしないことです。
デフォルトでは、WordPressのインストール時にチェックされません。 ただし、次のメニューに移動して確認することをお勧めします: [設定] > [ディスカッション]。
[コメントをページに分割し、ページごとに50のトップレベルのコメントがあり、デフォルトで最後のページが表示される]チェックボックスがオフになっていることを確認します。

タグ
あなたはWordPressの管理インターフェースを使用しているので、そこにとどまり、素晴らしくて暖かいです。
次に、投稿を分類するために使用されるタグについて説明します(タグがオプションであることを除いて、カテゴリに少し似ています)。
ここでも、ユーザーの視点から見れば、基本的な意図は良いです。 タグを使用すると、特定の主題(映画など)に関連するすべての投稿を確認できます。

SEOの場合、 WordPressがタグごとに新しいアーカイブページを生成するため、これははるかに厄介です。つまり、投稿は追加のページになります。
つまり、同じ投稿に対して10個のタグを作成すると、10個の重複した投稿になります…
カテゴリの重複を防ぐ方法は?
最善の解決策は、タグを使用しないことです。 本当にこれを実行したい場合は、これがもたらす可能性のある結果について慎重に検討してください。
ドメイン名のバリエーション
最後に、ドメイン名にいくつかのバリエーション(HTTPS、HTTP、wwwおよびwwwなし)でアクセスできる可能性もあります。
-
https://example.com -
https://www.example.com -
http://example.com -
http://www.example.com
結果? あなたのサイトにはいくつかの方法でアクセスできます。言い換えると、4回複製されます。
これは、たとえば、HTTPバージョンをリダイレクトせずにHTTPSに切り替えたばかりの場合に発生する可能性があります。
これが当てはまるかどうかを確認するには、お気に入りのブラウザでドメイン名の各バリアントを手動で入力します。
アクセス可能なバージョンのサイト(つまり、HTTPSのバージョン)へのリダイレクトがない場合は、作業を開始する必要があります。

ドメイン名の単一のバリアントを定義するにはどうすればよいですか?
2019年に新しいGoogle検索コンソールに切り替えるまで、無料のGoogleツールでお気に入りのドメインを選択することができました。
現在、最も簡単な方法は、301リダイレクトを実行することです。 このために、ホスティング会社が使用している場合は、たとえばcPanelインターフェイスを使用できます。 この件に関する詳細な手順を参照してください。
ドメイン名について言えば、ドメイン名を選択するための完全なガイドを読むことをお勧めします。
さて、内部の重複については、それほど悪くはないと言います。 それでは、外部の重複コンテンツを処理する必要がある場合に適用する対策について説明しましょう。
ほら、重砲を取り出します!
重複する外部コンテンツを取り除くための3つのステップ
非常警報。 あなたはそれを確信しています、あなたのコンテンツは複製されました。 問題のあるサイト名を呼び出す段階を過ぎたら、行動を起こす時が来ました。
この場合、あなたは何をしますか? あなたは怒りを叫びますか? 警察や消防署に電話しますか? 盗作者がアメリカ人の場合、FBI、またはCIAに連絡しますか?
代わりに、深呼吸して以下の手順に従ってください。これで問題が解決するはずです。
ステップ1:サイトの所有者に連絡する
難しい方法を使用する前に、それを楽にしてください。 まず、この厄介な重複コンテンツの問題から平和的な方法を見つけてください。
まず、気になるコンテンツの所有者に連絡して、何が起こっているのかを調べてください。
あなたは彼らが誰であるか、そして彼らに連絡する方法についての情報を次のようないくつかの場所で見つけることができます:
- 彼らのウェブサイトの連絡先ページ。
- 利用規約のページ。
- 出版物の最後に「著者」を挿入します。
- 彼らのソーシャルネットワーク。
- お気に入りの検索エンジン。 たとえば、人の名前と名前を入力して、何が表示されるかを確認します。
- ドメイン名のデータベース、WHOIS。
Whoisは、所有者とホストに関する情報、および技術的な詳細を提供します。 GandiおよびWhois.netを使用してWhoisドメインを検索することもできます。

調査の結果、メールを見つけましたか? 状況を詳しく説明する、礼儀正しくしっかりした最高のメッセージを書く時が来ました。
コンテンツの重複を見つけた人に、スクリーンショットやその他の具体的な証拠を追加してみませんか。
これが著作権侵害であることを示して続行します (許可なくコンテンツを複製または配布する権利はありません)。 盗用されたコンテンツを削除するように依頼して終了します。
最善の努力にもかかわらず、失敗しましたか? 手順2に進みます。
ステップ2:盗作者のホストに連絡する
それで、あなたが侵害者として特定した人は、ただ動揺しませんか? 彼のウェブホストに連絡すると、彼は曲がる可能性があります。
そのためには、いくつかのオプションがあります。
- ホストの連絡先の詳細は、通常、コンテンツを複製した人のWebサイトの法的通知ページにあります。
- そうでない場合は、Whoisのおかげでそれらを見つけることができます。
探している情報が見つかったら、手順1で書いたのと同じ種類の電子メールを送信し、受信者に合わせて調整します。
Webホストは通常、重複するコンテンツに非常に敏感であり、あなたを助けるはずです。 この問題はWPMarmiteで数回発生しており、Alexが投稿をコピーして貼り付けるのに役立っています。
それでもうまくいかない場合は、難しい方法でそれを行う時が来ました。ステップ3で調べてください。
ステップ3:ページをGoogleに報告する
デッキの最後のカードを取り出して、最後の手段として使用します。Googleに報告します。
Googleに「あなたの著作権を侵害するページ」を検索結果から削除するように依頼するには、有名な検索エンジンがDMCA (デジタルミレニアム著作権法)リクエストを送信する必要があることを示しています。
ちなみに、これは著作権侵害と戦うことを目的としたアメリカの法律です。
詳細は、次の順序で続行する方法です。
- このページに移動し、関連するGoogleサービスを選択します(通常は「Google検索」になります)。
- 「知的財産の問題」チェックボックスをオンにします。
- 「著作権侵害」を選択します。
- 「はい、私は著作権所有者であるか、著作権所有者に代わって行動する権限があります」にチェックを入れます。
- 侵害されているコンテンツの種類について尋ねられたら、「その他」を選択します。
- 青いボタン「リクエストの作成」をクリックします。
- フォームに記入し、日付を記入し、署名して送信します。

これらの行全体で見てきたように、遅かれ早かれ、内部か外部かに関係なく、重複するコンテンツを処理する必要があります。
Googleがこの慣行に直接ペナルティを課さない場合、重複するコンテンツはSEO戦略に悪影響を及ぼし、トラフィックと検索エンジンの結果ページでの位置が低下する可能性があります。
#WordPressの重複コンテンツについてすべて知りたいですか? #SEOアクションにペナルティを課さずに、外部および内部の#duplicatecontentを取り除くためのヒントとベストプラクティスを見つけてください。
この問題に正面から取り組むために、この投稿では、ツールとベストプラクティスを使用して、この疫病を具体的に取り除く方法について詳しく説明しています。
重複するコンテンツをどのように処理しますか? コメントを投稿して、ヒントやフィードバックを共有してください。


