了解重複內容的指南……並在 WordPress 上消除它
已發表: 2021-12-16在生活中,某些事情如何讓我們發瘋是很瘋狂的。 我在想那些在超市排隊時無恥地欺騙你的人。
那些不做有嚼勁的意大利面的人,當他們把它放在沸水里時把它切開……或者那些清晨的鬧鐘響起,響起,再響起,讓你從一張溫暖的床上醒來。

然後你會發現重複的內容。 您知道,當您在另一個網站上逐字逐句地找到全部或部分內容時,那個不愉快的時刻。
或者,當那個老舊的Ctrl+C Ctrl+V (或Cmd+C Cmd+V用於支持 Mac 的人群)再次造成嚴重破壞時。 正如他們所說,它真的讓你發瘋。
當您在其他人的網站上發現重複內容時,它是一個真正的問題,但它也可以在您自己的 WordPress 網站上彈出,而您甚至都不知道它。
這同樣令人討厭,尤其是因為它會對您的 SEO 產生負面影響。
為了避免這種情況,跟我來!
在這篇文章中,您將了解有關這個該死的重複內容的所有信息,尤其是擺脫它的具體解決方案。 我保證,它保證不會大驚小怪。
概述
- 什麼是重複內容?
- 如何查找和識別重複內容?
- 是什麼導致 WordPress 內部重複內容(以及如何解決)?
- 擺脫重複的外部內容的 3 個步驟
什麼是重複內容?
重複內容是同時在多個網址 (URL) 上相似的內容,無論是在同一網站的不同頁面上,還是在其他網站上。
這使 Google 等搜索引擎的工作變得複雜,它們可能會選擇在其 SERP(搜索引擎結果頁面)中將重複頁面排名較低。
為了清楚起見,重複內容主要有兩種類型:
- 內部重複,發生在您的網站上,大多數時候您都不知道。 假設它們是在您不知情的情況下製造的。
- 外部重複,當其他網站在其頁面上複製您的全部或部分內容時。
描圖紙的圖像
現在,為了說明什麼是重複內容,讓我們退後幾年(漫長):回到小學的長椅和藝術課。
你還記得著名的描圖紙,它可以讓你複製一模一樣的手寫畫嗎? 嗯,重複的內容有點像這樣。
假設基本繪圖表示您的內容的原始 URL,例如https:// yourwebsite.com/your-awesome-post/ 。https:// yourwebsite.com/your-awesome-post/
使用描圖紙相同(或部分)複製的繪圖說明了重複的 URL: https://yourwebsite.com/your-awesome-post-bis/ ://yourwebsite.com/your-awesome-post-bis/。
你清楚嗎? 然後回到未來,我的意思是現在。

超過四分之一的網絡被複製
2013 年,前谷歌工程師馬特·卡茨 (Matt Cutts) 表示,網絡上發布的 25% 到 30% 的內容將是重複的。
即使這個統計數據倒退了一點,它也給了你一個非常有說服力的數量級。
幸運的是,正如穀歌所說, “大多數情況下,這不是欺騙性的”。
這意味著重複內容的原因通常是技術性的和無意的:您所在的網站管理員不會故意創建重複的內容。
因此,如果您的目標不是“欺騙和操縱”其搜索結果,那麼世界上最常用的搜索引擎谷歌就不會懲罰您。
但是,請注意:如果 Google 不認為這種做法是垃圾郵件,那麼它也不真正喜歡重複。
為什麼? 因為最終,它必須付出額外的努力來索引和“顯示包含不同信息的頁面” 。
在 SEO 中,索引階段對應於搜索引擎機器人掃描整個網絡上的頁面的時刻,以便將它們分類到索引(一種巨大的數據庫)中。
正是在這個索引中,像谷歌這樣的搜索引擎能夠在其結果頁面 (SERP) 中顯示最相關的結果。
Google 如何處理重複內容?
好吧,我說谷歌時說“它”,但實際上我應該說“谷歌的機器人”,也稱為蜘蛛或谷歌機器人。
以下是它們在發現重複項時如何操作的示意圖:
- 他們通過從一個鏈接導航到另一個鏈接來瀏覽網絡以查找新內容(請記住,網絡是巨大的)。
- 當他們遇到重複的內容時,他們會將它們分組到一個集群中。
- 然後根據他們的說法,他們顯示該集群中存在的內容的最佳結果。

人氣加成,而不是資歷加成
問題是這個最佳結果並不總是對應於原始內容(不重複的內容) 。
在這一點上,很難責怪谷歌:想像一下它的任務是多麼艱鉅,它必須在數千個相同的內容中找到原始內容!
正如 Daniel Roch 所說,谷歌並不依賴於內容的發布日期。
這太簡單了,因為您可以“在管理中隨意修改每個內容的日期” 。
谷歌依靠“URL 和域的流行度來確定誰是內容的來源以及誰是可能的抄襲者”, Daniel Roch 補充道。 “換句話說,如果一個更受歡迎的網站從你那裡竊取內容,你就輸掉了與搜索引擎的戰鬥”。
如果您有興趣,同樣的 Matt Cutts 在此視頻中對此進行了詳細說明:
我們可以記住這個演示的兩個主要內容:
- 嚴格來說,谷歌不會懲罰重複的內容,除非在“極少數情況下”創建它是為了“操縱我們的排名和欺騙我們的用戶” 。 如果發生這種情況,相關網站“將不再出現在其搜索結果中” 。
- 其餘的時間,重複的內容不會受到懲罰,但它是一樣的。 如果您是重複內容的受害者,並且 Google 決定不顯示您內容的原始版本,您將在其搜索結果頁面中變得不可見。
因此,您的搜索引擎優化 (SEO) 操作可能會遭受重大後果。

SEO中重複內容的影響是什麼?
重複的內容會對您的內容的 SEO (搜索引擎優化)產生負面影響。
換句話說,您可能會看到您網站上的流量減少,並在搜索結果頁面上失去位置,原因如下:
- Google 並不確切知道哪個是重複內容的原始版本,因此它只會顯示一個,因此會在其搜索結果中“隱藏”所有其他相同的結果。
- 其他用戶對您的重複內容的反向鏈接將不太有效。 鏈接將分佈在幾個重複的出版物中,因此權力較小。 但是,內容的相關反向鏈接越多,它獲得更好排名的機會就越大。
- 您將消耗更多的抓取預算(Google 可以在您的 WordPress 網站上抓取的最大頁面數),因為搜索引擎將不得不花費更多時間來抓取您的重複內容,並且存在索引新“原始”內容的速度較慢的風險,或者根本不索引它。
由於重複的內容經常潛伏在陰影中,並且不能總是被識別和馴服,因此在下面的部分中找出幾種揭露它的方法。

如何查找和識別重複內容?
用你的眼睛:視覺方法
您將它們關閉以睡覺,然後在醒來後立即將它們打開,並閱讀本文:您的眼睛是檢測可能存在的重複內容痕蹟的第一武器,尤其是外部重複。
想像一下:幾個月前,您發表了一篇文章,其中提煉了有關如何製作美味巧克力布朗尼的技巧。
現在您遇到了一個出版物,它逐字複製了原始源代碼中的多個段落。 “沒門! 這是我寫的,你這個小偷!”
是的,是你,你被抄襲了。 現在,整篇文章都沒有被複製和粘貼,但您可能想知道我們是否處於重複內容的情況? 好點子。
在這件事上,沒有確切的規則。 也就是說,沒有一個搜索引擎定義了一個不能被超越的限制,比如: “如果你複製了 40% 的內容,你就是一個糟糕的複制者! “
為了幫助你,假設如果整個句子都被複製了——記住,谷歌談論的是“大塊內容” ——你可以認為內容被複製了。
你的眼睛要哭了,但要知道也有可能的補救措施來擦乾你的眼淚。 我稍後會在這篇文章中討論這個問題。
在眼睛之後,您可以使用第二個武器:檢測重複內容的工具。
使用專用工具:第三方方法
市場上有幾種檢測內部和外部重複的解決方案。 推介會。
殺死重複

Kill Duplicate 是一款重要的高級工具,可幫助識別外部重複,尤其是通過掃描您的內容。
完整,它還可以通過直接在儀表板上提出解決方案來幫助您處理剽竊(例如聯繫主機、站點或提出投訴)。
價格:每月 19 歐元起( 不包括增值稅),即 ± 21 美元。
文案

Copyscape 是一種免費增值解決方案,可幫助您在 Web 上找到頁面的副本。 要使用它,只需在搜索欄中輸入您選擇的 URL。

然後交叉你的手指,沒有人復制你。
然後,您可以檢查 Copyscape 已識別的出版物,以查看內容是否重複。
Copyscape 還提供具有更多高級功能的高級版本(每次搜索 3 美分起)。
重複檢查器

DupliChecker 將自己定位為“反抄襲軟件” 。 在其免費版本中,每次搜索限制為 1,000 個單詞,它允許您通過輸入文本的 URL、一段文本或下載文件來檢查文本的原創性。
因此,您可以在發佈內容之前和之後使用它。 如果我們可以對許多廣告的存在感到遺憾,DupliChecker 仍然很有趣,因為它通過每次向您顯示相似率來顯示多個結果:

專業版也可從 10 美元購買,最多可使用 30,000 個單詞。
定位器

Siteliner 將非常適合“探索您的站點” ,因為它可以識別內部重複。
它以圖表的形式呈現其結果。 免費版允許您每 30 天掃描一次網站,最多 250 頁。
使用 Pro 產品,您最多可以處理 25,000 個頁面,並選擇要從識別過程中排除的頁面。
尖叫的青蛙

Screaming Frog 不是專門用於識別重複內容的工具。 但尋找內部重複仍然很重要。
它是一個爬蟲,一種分析您的頁面 SEO 的工具:它提取並掃描您網站的 URL 以查找問題(例如損壞的鏈接、 title和meta description標籤分析、服務器錯誤等)。
因此,它將能夠通知您某些重複元素,例如您的頁面的h1標題和title和meta description標籤。
免費版最多可以分析 500 個 URL。 專業版的費用為每年 149 英鎊(即 ± 197 美元)。
谷歌搜索控制台

我們用一把必不可少的瑞士軍刀來結束這個工具列表:谷歌搜索控制台。
這個免費工具可以讓您更好地管理您的網站並跟踪您的 SEO。 它提供了很多信息:您網站上的錯誤、搜索分析、鏈接、索引狀態、抓取錯誤等。
與上面提到的小伙伴不同,Google Search Console 將無法告訴您哪些 URL 已在內部重複。
但是,它可以幫助您找出答案。 為此,只需轉到“索引” >“覆蓋”菜單。 你可以:
- 檢查索引 URL 的數量。 如果您知道您已經在您的網站上創建了 206 個頁面,並且 Google 已將其中的 674 個編入索引,那麼您就知道周圍肯定有一些重複的內容……
- 檢查排除的 URL,以了解它們是否適合重複的內容框。

另請注意,許多 SEO 工具(例如 Semrush 或 Ahrefs)也具有幫助您識別網站上重複內容的功能。
使用來自 Google 的特定命令:手動方法
在這一輪工具之後,您可以激活最後一個槓桿來查找重複內容:谷歌。
為此,著名的搜索引擎提供了運算符,即您可以在其搜索欄中指定的命令以更精確地過濾其結果。
其中一些可以有效地搜索重複內容,例如站點搜索運算符( site: )。 要搜索外部重複,請通過鍵入以下查詢從搜索結果中排除您的域名:
-site:yourdomainname.com "title of your publication" 。 在以下 WPMarmite 文章的示例中,這將給出: -site:wpmarmite.com/en/ "test of 6 must-have SEO plugins on WordPress"

嗯,那是你剛剛吞下的一大塊。 現在您知道什麼是重複內容以及如何識別它。
現在你必須擺脫它。 這篇文章的其餘部分將重點介紹如何停止的詳細說明:
- 內部重複
- 外部重複
我建議您從您在 WordPress 網站上可能遇到的問題開始。
是什麼導致 WordPress 內部重複內容(以及如何解決)?
網址
URL 是網頁的地址。 例如,可以在以下 URL 找到 WPMarmite 主頁: https://wpmarmite.com/en/ ://wpmarmite.com/en/。
可以想像,您的 WordPress 網站擁有的內容越多,您擁有的 URL 就越多。 例如,在大型電子商務網站的情況下,如果您銷售大量產品,您可以非常快速地訪問數千個 URL。
到現在為止還挺好。 但是,在某些情況下,我們著名的 URL 會開始困擾您:
- 當它們包含跟踪對特定頁面的訪問的指示時。 然後,新參數會自動添加到 URL 的末尾。 例如,初始 URL 為
https://yourpost.com,重複 URL 為https://yourpost.com?utm_source=facebook。 您可能看不到差異,但搜索引擎會。 - 當它們包含用於過濾導航的參數時。 在使用多面搜索的 WooCommerce 商店中經常出現這種情況。 這對用戶來說非常方便,他們可以按尺寸、顏色、價格等對產品進行分類。令人擔憂的是,這會創建許多重複頁面,內容幾乎一字不差,請參閱:
-
https://yourstore.com/pants-black-size-m -
https://yourstore.com/pants-black-size-l
-
- 當他們無差別地使用斜線時。 例如:
https://yourstore.com/pants-black-size-m://yourstore.com/pants-black-size-m 和https://yourstore.com/pants-black-size-l被 Google 視為兩個不同的 URL,因此是重複內容。
如何解決重複 URL 問題?
解決重複 URL 問題的最簡單方法是執行所謂的 301 重定向。
重定向允許您自動將希望訪問 URL A(例如https://mygreatwebsite.com )的訪問者重定向到 URL B(例如https://myawesomewebsite.com )。
您可以使用重定向插件輕鬆完成此操作。
例如, Google 並沒有阻止爬蟲訪問您網站上的重複內容,而是使用 robots.txt 文件,它還聲明您可以使用所謂的規範 URL 。
通過在 URL 中使用特定屬性,您可以告訴搜索引擎哪個是重複頁面的原始版本。
這樣,您可以確保在結果頁面中顯示的是這個原始版本(而不是重複版本)。
供您參考,規範 URL 使用了一段額外的 HTML 代碼,稱為rel="canonical" 。 它看起來像這樣,在實踐中:
<link rel="canonical" href="https://wpmarmite.com/en/astra-theme/" />
如果您使用的是 Yoast SEO 插件,您可以通過插件的編輯界面填寫規範 URL:

請注意,默認情況下,Yoast SEO 將發布的 URL 添加為規範 URL。 在大多數情況下,您不必做任何事情。
要了解如何像專業人士一樣設置 Yoast SEO,請訪問我們關於該主題的專門指南!
評論的分頁
在 URL 之後,讓我們談談 WordPress 上重複內容的第二個原因:評論分頁。
WordPress允許您將讀者在帖子上留下的評論分成幾個頁面。
在紙面上,這對於有很多評論的網站/博客來說似乎很方便。
讀者可以先查看最新的評論,然後通過轉到另一個頁面來選擇閱讀較舊的評論。
這就是問題所在。 每次都會為每個頁面自動創建新的 URL,其中包含您的帖子內容。
如何解決評論分頁問題?
您可以做的主要事情就是不啟用此選項。
默認情況下,安裝 WordPress 時不會勾選。 但是,我邀請您通過以下菜單進行檢查:設置>討論。
確保未選中“將評論分成頁面,每頁有 50 條頂級評論,默認顯示最後一頁”框。

標籤
由於您在 WordPress 管理界面上,所以請待在那裡,溫暖而溫馨。
現在讓我們談談標籤,它用於對您的帖子進行分類(有點像您的類別,只是標籤是可選的)。
同樣,如果我們從用戶的角度來看,基本意圖是好的。 標籤將允許他檢查您與特定主題(例如電影)相關的所有帖子。

對於您的 SEO,這更煩人,因為WordPress 會為每個標籤生成新的存檔頁面,這意味著您的帖子最終會出現在其他頁面上。
換句話說,如果你為同一個帖子創建 10 個標籤,你最終會得到 10 個重複的帖子……
如何防止重複類別?
最好的解決方案是不使用標籤。 如果您真的想這樣做,請仔細考慮這可能產生的後果。
域名變體
最後,您的域名也可以通過多種變體(HTTPS、HTTP、www 和不帶 www)訪問:
-
https://example.com -
https://www.example.com -
http://example.com -
http://www.example.com
結果? 您的網站可以通過多種方式訪問,或者換句話說,它將被複製 4 次。
例如,如果您剛剛切換到 HTTPS 而沒有重定向 HTTP 版本,就會發生這種情況。
要了解您是否屬於這種情況,請在您喜歡的瀏覽器中手動輸入您的域名的每個變體。
如果沒有重定向到您網站的可訪問版本(即 HTTPS 中的版本),您將不得不開始工作。

如何為您的域名定義一個變體?
在 2019 年切換到新的 Google Search Console 之前,可以在免費的 Google 工具上選擇最喜歡的域。
現在,最簡單的方法是執行 301 重定向。 為此,例如,如果您的託管公司使用它,您可以使用您的 cPanel 界面。 請參閱我們關於該主題的詳細說明。
說到域名,我們只能建議您閱讀我們的完整域名選擇指南。
好吧,對於內部重複,我們會說我們還不錯。 現在,讓我們談談如果您必須處理外部重複內容時要應用的措施。
你會看到,我們會幹掉重砲!
擺脫重複的外部內容的 3 個步驟
紅色警報。 您確定,您的內容已被複製。 一旦您通過了調用違規站點名稱的階段,就該採取行動了。
在這種情況下,你會怎麼做? 你發怒了嗎? 報警還是消防? 如果抄襲者是美國人,你會聯繫聯邦調查局,甚至中央情報局嗎?
相反,只需深呼吸並按照以下步驟操作即可解決您的問題。
第 1 步:聯繫網站所有者
在使用硬方法之前,請放輕鬆。 首先,嘗試找到解決這個煩人的重複內容問題的和平方法。
首先,聯繫您所困擾的內容的所有者,以了解發生了什麼。
您可以在以下幾個地方找到有關他們是誰以及如何联系他們的信息:
- 他們網站的聯繫頁面。
- 服務條款頁面。
- 在他們的出版物末尾插入“作者”。
- 他們的社交網絡。
- 你最喜歡的搜索引擎。 例如,輸入此人的名字和姓氏以查看出現的情況。
- 域名數據庫,WHOIS。
Whois 為您提供有關所有者和主機的信息以及技術細節。 您也可以使用 Gandi 和 Whois.net 搜索 Whois 域名。

經過調查,您發現了一封電子郵件? 是時候寫出你最好的信息了,既禮貌又堅定,詳細說明情況。
向對方解釋您發現了重複的內容,為什麼不添加屏幕截圖和其他有形證據。
繼續指出這是侵犯版權 (未經許可,任何人都無權複製或分發內容)。 最後要求此人刪除抄襲內容。
儘管你盡了最大的努力,但你失敗了嗎? 轉到第 2 步。
第二步:聯繫抄襲者的宿主
所以你認定為侵權者的人就不會讓步嗎? 聯繫他的網絡主機可能會讓他屈服。
為此,您有多種選擇:
- 主持人的聯繫方式通常應該在復制您的內容的人的網站上的法律聲明頁面上。
- 如果沒有,您可以通過 Whois 找到它們。
找到您要查找的信息後,發送與您在第 1 步中編寫的相同類型的電子郵件,只是將其調整為適合您的收件人。
Web 主機通常對重複內容非常敏感,應該可以幫助您。 WPMarmite 曾多次出現此問題,它幫助 Alex 刪除了複製和粘貼的帖子。
如果您仍然沒有按照自己的方式進行操作,那麼是時候採取艱難的方式了:在第 3 步中找出答案。
第 3 步:向 Google 報告該頁面
拿出你套牌中的最後一張牌,作為最後的手段:向谷歌報告。
要要求 Google 從其搜索結果中刪除“侵犯您版權的頁面” ,著名的搜索引擎表明您必須向其發送 DMCA (數字千年版權法案)請求。
供您參考,這是一項旨在打擊侵犯版權的美國法律。
詳細地,這裡是如何進行的,按順序:
- 進入這個頁面,選擇相關的谷歌服務(通常是“谷歌搜索”)。
- 勾選“知識產權問題”複選框。
- 選擇“侵犯版權”。
- 勾選“是的,我是版權所有者或被授權代表版權所有者行事”。
- 當被問及被侵權的內容類型時,選擇“其他”。
- 單擊藍色按鈕“創建請求”。
- 填寫表格、日期、簽名並提交。

正如您在這些行中看到的那樣,遲早您將不得不處理重複的內容,無論是內部的還是外部的。
如果 Google 不直接懲罰這種做法,重複的內容可能會對您的 SEO 策略產生有害後果,導致流量下降以及您在搜索引擎結果頁面中的位置。
想了解有關#WordPress 上重複內容的所有信息嗎? 了解我們的技巧和最佳實踐,以擺脫外部和內部#duplicatecontent,而不是懲罰您的#SEO 行為!
為了直接解決這個問題,這篇文章詳細介紹瞭如何使用工具和最佳實踐以具體的方式擺脫這種瘟疫。
你如何處理重複的內容? 通過發表評論與我們分享您的提示和反饋。


