Thuật ngữ

Duplicate Content

Nội dung trùng lặp là nội dung giống hệt hoặc gần giống hệt xuất hiện trên nhiều trang web khác nhau. Nó có thể xảy ra trên cùng một trang web hoặc trên các trang web khác nhau.
Ví dụ: nếu bạn đăng một bài blog trên trang web của mình và quyết định gửi nó như một bài đăng khách cho một trang web khác, đó là nội dung trùng lặp.
Có nhiều tranh cãi về nội dung trùng lặp trong cộng đồng quản trị web. Mối quan tâm chính là Google sẽ phạt trang web của họ nếu họ có nội dung trùng lặp.

Tại sao nội dung trùng lặp lại xấu cho SEO?

Có một số lý do tại sao nội dung trùng lặp lại xấu cho SEO:

  • Xếp hạng phiên bản trang không mong muốn trong kết quả tìm kiếm: Nếu bạn có cùng nội dung xuất hiện trên các URL khác nhau, Google có thể xếp hạng phiên bản bạn không muốn xếp hạng. Đó là bởi vì Google sẽ chọn phiên bản nào để xếp hạng dựa trên những gì nó cho là tốt nhất cho người dùng. Bạn có thể tránh điều này bằng cách quản lý nội dung trùng lặp thích hợp, như được giải thích thêm trong bài viết này.
  • Giảm giá trị liên kết: Mỗi URL có nội dung trùng lặp có thể thu hút các backlink khác nhau và có PageRank riêng. Hãy nhớ rằng PageRank vẫn là một yếu tố xếp hạng, nghĩa là URL bạn không định xếp hạng có thể có hồ sơ liên kết tốt hơn URL bạn thực sự đang cố xếp hạng.
  • Ngân sách truy cập bị lãng phí: Nếu bạn có một trang web lớn hoặc thường xuyên cập nhật nội dung trên trang web của mình, nội dung trùng lặp sẽ lãng phí ngân sách truy cập. Thay vì thu thập các trang mới và cập nhật, công cụ tìm kiếm sẽ thu thập và thu thập lại tất cả các phiên bản nội dung trùng lặp. Do đó, nội dung mới của bạn có thể mất nhiều thời gian hơn để xuất hiện trong kết quả tìm kiếm.
  • Nội dung được tổng hợp hoặc sao chép vượt trội nội dung gốc của bạn: Lý do cuối cùng khiến nội dung trùng lặp xấu cho SEO là trong một số trường hợp hiếm hoi, nội dung được tổng hợp hoặc sao chép có thể xếp hạng cao hơn nội dung gốc của bạn. Mặc dù không thường xảy ra, nhưng nó đã được báo cáo trong các cộng đồng SEO khác nhau.

Bạn có bị phạt vì nội dung trùng lặp không?

Theo Google, hầu hết nội dung trùng lặp không có nguồn gốc lừa dối. Nói cách khác, nếu bạn không cố thao túng thứ hạng tìm kiếm bằng nội dung trùng lặp, Google sẽ không phạt trang web của bạn.

Tuy nhiên, có một hình phạt (hành động thủ công) dành cho “nội dung mỏng không có giá trị gia tăng”, bao gồm cả nội dung được sao chép.

Làm thế nào để tìm nội dung trùng lặp trên trang web của bạn?

Bạn có thể tìm nội dung trùng lặp trên trang web của mình bằng Ahrefs Site Audit hoặc Ahrefs Webmaster Tools.

Khi bạn chạy kiểm tra trang web của mình, bạn sẽ thấy một phần dành riêng cho nội dung trùng lặp. Trong phần đó, bạn sẽ tìm thấy báo cáo về các trang trùng lặp trên trang web của mình không có thẻ chính xác.

Ngoài ra, nó sẽ hiển thị cho bạn các trang sử dụng cùng tiêu đề và mô tả.

Cách ngăn chặn nội dung trùng lặp:

  • Sử dụng một tiêu chuẩn cho tất cả các URL trên trang web của bạn: Đầu tiên, hãy đảm bảo rằng mỗi trang trên trang web của bạn có thể truy cập dưới dạng phiên bản www hoặc không www. Bạn cũng cần áp dụng nguyên tắc tương tự cho dấu gạch chéo cuối URL và đảm bảo rằng mỗi trang chỉ truy cập được qua giao thức HTTPS. Tất cả các phiên bản khác nên được chuyển hướng đến URL tiêu chuẩn bạn đã quyết định.
  • Sử dụng thẻ chính xác để hợp nhất: Các trang trùng lặp hoặc gần trùng lặp trên trang web của bạn phải trỏ đến một phiên bản chính xác, duy nhất bằng cách sử dụng thẻ chính xác. Thẻ chính xác cho Google biết phiên bản nào là chính và nên được lập chỉ mục.
  • Sử dụng thẻ chính xác tự tham chiếu: Thẻ chính xác tự tham chiếu là một thẻ được thêm vào phiên bản chính của trang; bất kể các trang trùng lặp khác. Chúng không bắt buộc nhưng được khuyến nghị. Điều này rất hữu ích khi bạn đang xử lý các URL có nhiều tham số URL gắn vào.