Duplicate Content
重複內容是同一內容出現在多個 URL。它會分散權重、浪費 crawl budget,並讓錯頁被收錄。
定義
Duplicate content 指相同或高度相似的內容存在於多個 URL(例如參數、尾斜線、http/https、分頁複製、或多語言誤配置)。它不一定會被『懲罰』,但常造成索引與權威訊號被拆散,讓你更難衝到第一名。
為什麼重要
- 權威訊號被分散:外部連結與內鏈指向不同版本
- 索引混亂:搜尋引擎可能收錄錯的 URL(參數版、舊版)
- 浪費資源:爬蟲在重複頁面上花太多時間
怎麼做(實作重點)
- 選定 canonical URL:用 canonical、301 轉址、內鏈統一
- 對參數/排序頁:必要時 noindex 或做參數策略
- 多語言:用正確 hreflang + 每語系獨立 canonical
相關連結
常見問題
關於這個詞彙的常見問答。