Canonical là gì? Tầm quan trọng của Canonical URL

  • Bạn đang tìm hiểu thẻ canonical là gì và làm thế nào sử dụng chúng để tránh các vấn đề trùng lặp nội dung? Thẻ canonical đã có từ năm 2009 được tạo ra bởi Google, Microsoft và Yahoo United. 

    Mục đích của họ là cung cấp cho chủ sở hữu website cách để giải quyết các vấn đề trùng lặp nội dung một cách nhanh chóng và dễ dàng. Vậy chúng hoạt động hiệu quả không? Câu trả lời là có nếu bạn biết cách áp dụng chính xác. 

    Trong hướng dẫn này, bạn sẽ học:

    • Canonical SEO là gì?
    • Cấu trúc chuẩn của Canonical Tag 
    • Tại sao Canonical lại quan trọng trong SEO?
    • Có nên dùng thẻ canonical khi không có nội dung trùng lặp? 
    • Khái niệm cơ bản về triển khai thẻ canonical 
    • Thiết lập Canonical đơn giản và nhanh chóng
    • Các lỗi thường gặp về canonical cần tráng 
    • Cách tìm và sửa lỗi canonical trên website 

    Các kiến thức này được tổng hợp từ kinh nghiệm thực chiến qua bao nhiêu dự án mà Quyết đảm nhận. Hy vọng sẽ giúp anh em áp dụng vào dự án SEO của mình để thúc đẩy website tăng trưởng. 

    I. Canonical SEO là gì?

    Thẻ canonical (rel=“canonical”) là một đoạn mã HTML xác định phiên bản chính cho các trang trùng lặp, gần trùng lặp và tương tự. Nói cách khác, nếu bạn có nội dung giống hoặc tương tự trong các URL khác nhau, bạn có thể sử dụng thẻ canonical để chỉ định phiên bản nào là phiên bản chính nên được index. 

    Canonical seo la gi

    Thẻ canonical (rel=“canonical”) là một đoạn mã HTML

    II. Cấu trúc chuẩn của Canonical Tag 

    Các thẻ canonical sử dụng cú pháp đơn giản và nhất quán và được đặt trong phần <head> của website:

    <link rel=“canonical” href=“https://example.com/sample-page/” />

    Đây là ý nghĩa của từng phần của mã đó:

    • link rel=“canonical”:  Liên kết trong thẻ này là phiên bản chính (canonical) của trang này.
    • href=“https://example.com/sample-page/”: Bạn có thể tìm thấy phiên bản canonical tại URL này.

    Canonical seo la gi

    Các thẻ canonical sử dụng cú pháp đơn giản và nhất quán

    III. Tại sao Canonical lại quan trọng trong SEO?

    Google không thích nội dung trùng lặp bởi nó khiến họ khó lựa chọn:

    • Phiên bản nào của trang cần index (họ sẽ chỉ lindex một trang)
    • Phiên bản nào của trang để xếp hạng cho các truy vấn có liên quan.
    • Liệu họ có nên hợp nhất “link equity” trên một trang hay chia nó thành nhiều phiên bản.

    Quá nhiều nội dung trùng lặp cũng có thể ảnh hưởng đến “crawl budget” của bạn . Điều đó có nghĩa là Google sẽ mất thời gian thu thập thông tin nhiều phiên bản của cùng một trang thay vì khám phá nội dung quan trọng khác trên website của bạn.

    Thẻ canonical giúp giải quyết tất cả những vấn đề này. Chúng cho phép bạn thông báo Google biết họ nên index và xếp hạng phiên bản nào của trang cũng như nơi hợp nhất bất kỳ “link equity” nào.

    Nếu bạn không chỉ định được canonical URL thì Google sẽ tự xử lý các vấn đề .

    “Nếu bạn không chỉ ra một canonical URL, chúng tôi sẽ xác định những gì chúng tôi nghĩ là phiên bản hoặc URL tốt nhất.” 

    Canonical seo la gi

    Tại sao Canonical lại quan trọng trong SEO?

    Dựa vào Google như thế này không phải là một ý tưởng tuyệt vời. Họ có thể chọn một phiên bản trang của bạn mà bạn không thực sự muốn trở thành trang chuẩn.

    Lưu ý: Google tuyên bố rằng họ thường tôn trọng canonical URL mà bạn đặt, nhưng không phải lúc nào cũng vậy. Đó là bởi vì các thẻ canonical là gợi ý chứ không phải là chỉ thị. Miễn là họ được tôn trọng thì mọi tín hiệu như liên kết sẽ hợp nhất thành canonical URL.

    Sử dụng các phương pháp hay nhất về thẻ canonical cũng giúp giảm thiểu nguy cơ Google xem một phiên bản không mong muốn của trang là canonical.

    IV. Có nên dùng thẻ canonical khi không có nội dung trùng lặp?

    Cho rằng bạn có thể đã không xuất bản các bài đăng và trang giống nhau nhiều lần, thật dễ dàng để cho rằng website của bạn không có nội dung trùng lặp.

    Nhưng công cụ tìm kiếm crawl URL, không phải website.

    Điều đó có nghĩa là họ xem example.com/product và example.com/product?color=red  là các trang duy nhất, mặc dù chúng là cùng một website có nội dung giống hệt nhau hoặc tương tự.

     

    Đây được gọi là các URL được tham số hóa và chúng là nguyên nhân phổ biến của nội dung trùng lặp, đặc biệt là trên các web thương mại điện tử có điều hướng theo từng khía cạnh/bộ lọc.

    Ví dụ: 

    Đây là tất cả các trang riêng biệt trong mắt Google, mặc dù nội dung chỉ khác nhau một chút. Nhưng không chỉ các website thương mại điện tử trở thành nạn nhân của nội dung trùng lặp.

    Dưới đây là một số nguyên nhân phổ biến khác của nội dung trùng lặp áp dụng cho tất cả các loại trang web:

    • Có URL được tham số hóa cho các tham số tìm kiếm (ví dụ: example.com?q=search-term)
    • Có URL được tham số hóa cho ID phiên (ví dụ: https://example.com?sessionid=3)
    • Có các phiên bản trang có thể in riêng biệt (ví dụ: example.com/page và example.com/print/page)
    • Có các URL duy nhất cho các bài đăng thuộc các danh mục khác nhau (ví dụ: example.com/ services/SEO/  và example.com/ specials/SEO/) 
    • Có các trang cho các loại thiết bị khác nhau (ví dụ: example.com  và m.example.com)
    • Có các phiên bản AMP và không phải AMP của một trang  (ví dụ: example.com/page và amp.example/page)
    • Cung cấp cùng một nội dung tại các biến thể non-www và www (ví dụ: http://example.com  và http://www.example.com)
    • Cung cấp cùng một nội dung ở các biến thể non-https và https (ví dụ: http://www.example.com và https://www.example.com)
    • Cung cấp cùng một nội dung có và không có dấu gạch chéo ở cuối (ví dụ: https://example.com/page/ và http://www.example.com/page)
    • Cung cấp cùng một nội dung ở các phiên bản mặc định của trang, chẳng hạn như trang index (ví dụ: https://www.example.com/, https://www.example.com/index.htm, https: //www.example. com/index.html, https://www.example.com/index.php, https://www.example.com/default.htm, v.v.)
    • Cung cấp cùng một nội dung có và không có chữ viết hoa (ví dụ: https://example.com/page/  và http://www.example.com/Page/)

    Trong những tình huống này, việc sử dụng đúng các thẻ canonical là rất quan trọng.

    Hơn nữa, vấn đề nội dung trùng lặp giữa nhiều miền cũng là một vấn đề. Nếu bạn đang cung cấp nội dung, cách tốt nhất là sử dụng thẻ canonical tự tham chiếu trên bài viết của bạn và để nội dung được cung cấp chỉ định bạn là phiên bản canonical có thẻ canonical nhiều miền.

    Điều này không phải lúc nào cũng ngăn nội dung được cung cấp hiển thị trong kết quả tìm kiếm nhưng nó giúp giảm nguy cơ nội dung đó có thứ hạng cao hơn nội dung gốc.

    https://twitter.com/dannysullivan?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1174340517057875968%7Ctwgr%5E%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fahrefs.com%2Fblog%2Fcanonical-tags%2F 

    V. Khái niệm cơ bản về triển khai thẻ canonical

    Canonicals rất dễ thực hiện. Chúng ta sẽ thảo luận về bốn cách khác nhau để thực hiện điều đó ở phần sau. Nhưng bất kể bạn chọn phương pháp nào, có năm quy tắc vàng mà bạn nên nhớ mọi lúc.

    Quy tắc số 1: Sử dụng absolute URLs

    John Mueller của Google nói rằng cách tốt nhất là không sử dụng các đường dẫn tương đối với phần tử liên kết rel=“canonical”.

    https://twitter.com/JohnMu/status/1055155977148919808?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1055155977148919808%7Ctwgr%5E%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fahrefs.com%2Fblog%2Fcanonical-tags%2F 

    Vì vậy, bạn nên sử dụng cấu trúc sau:

    <link rel=“canonical” href =“https://example.com/sample-page/” />

    Trái ngược với điều này:

    <link rel=“canonical” href =”/sample-page/” />

    Canonical seo la gi

    John Mueller nói về cách sử dụng absolute URLs trên trang cá nhân của bản thân

    Quy tắc số 2: Sử dụng URL viết thường

    Vì Google có thể coi URL viết hoa và viết thường là hai URL khác nhau, trước tiên bạn muốn đảm bảo buộc phải sử dụng URL viết thường trên máy chủ của mình , sau đó sử dụng URL viết thường cho các thẻ chuẩn của bạn.

    Canonical seo la gi

    Google có thể coi URL viết hoa và viết thường là hai URL khác nhau

    Quy tắc số 3: Sử dụng đúng phiên bản domain (HTTPS và HTTP)

    Nếu bạn đã chuyển sang SSL, hãy đảm bảo rằng bạn không khai báo bất kỳ URL non-SSL (tức là HTTP) nào trong các thẻ canonical của mình. Làm như vậy về mặt lý thuyết có thể dẫn đến nhầm lẫn và kết quả không mong muốn. Nếu bạn đang ở trên một miền an toàn, hãy đảm bảo rằng bạn sử dụng phiên bản URL sau:

    <link rel=“canonical” href =“https://example.com/sample-page/” />

    Như trái ngược với:

    <link rel= canonical” href =“http://example.com/sample-page/” />

    Lưu ý: Nếu bạn không sử dụng HTTPS thì ngược lại. 

    Canonical seo la gi

    Sử dụng đúng phiên bản domain (HTTPS và HTTP)

    Quy tắc số 4: Sử dụng thẻ canonical tự tham chiếu

    John Mueller của Google nói rằng mặc dù không bắt buộc nhưng các thẻ canonical tự tham chiếu được khuyến khích .

    “Tôi khuyên bạn nên [sử dụng] trang canonical tự tham chiếu vì nó thực sự giúp chúng tôi hiểu rõ bạn muốn index trang nào hoặc URL sẽ là gì khi được index. 

    Ngay cả khi bạn có một trang, đôi khi có các biến thể khác nhau của URL có thể kéo trang đó lên. Ví dụ, với các tham số ở cuối cùng, có thể là chữ hoa, chữ thường hoặc www và non-www. Tất cả những thứ này có thể được làm rõ bằng một thẻ canonical.

    Canonical seo la gi

    John Mueller của Google nói rằng mặc dù không bắt buộc nhưng các thẻ canonical tự tham chiếu

    Trong trường hợp bạn không chắc chắn về cách thức hoạt động của một thẻ canonical tự tham chiếu, về cơ bản, đó là một thẻ canonical trên một trang tự trỏ đến chính nó. Ví dụ: nếu URL là https://example.com/sample-page, thì một trang canonical tự tham chiếu trên trang đó sẽ là:

    <link rel = “canonical” href = “https://example.com/sample-page” />

    Hầu hết các CMS phổ biến hiện đại ‘tự động thêm các URL tự tham chiếu, nhưng bạn sẽ cần phải có mã cứng cho nhà phát triển của mình nếu sử dụng CMS tùy chỉnh

    Quy tắc số 5: Sử dụng một thẻ canonical trên mỗi trang

    Nếu trang có nhiều thẻ canonical thì Google sẽ bỏ qua cả hai. Trong trường hợp có nhiều khai báo về rel=canonical, Google có thể sẽ bỏ qua tất cả các gợi ý rel=canonical.

    Canonical seo la gi

    Sử dụng một thẻ canonical trên mỗi trang

    VI. Thiết lập Canonical đơn giản và nhanh chóng

    Có năm cách đã biết để chỉ định canonical URL. Đây là những gì được gọi là tín hiệu chuẩn hóa:

    • HTML tag (rel=canonical)
    • HTTP header
    • Sitemap
    • 301 redirect*
    • Internal links

    Để biết ưu và nhược điểm của từng phương pháp, hãy xem tài liệu chính thức của Google .

    1. Cài đặt Canonical bằng thẻ HTML rel = “canonical”

    Sử dụng thẻ rel=canonical là cách đơn giản và rõ ràng nhất để chỉ định một canonical URL.

    Chỉ cần thêm mã sau vào phần <head> của bất kỳ trang trùng lặp nào:

    <link rel = “canonical” href = “https://example.com/canonical-page/” />

    Ví dụ

    Giả sử bạn có một trang web thương mại điện tử bán áo thun. Bạn muốn https://yourstore.com/tshirts/black-tshirts/ là canonical URL, ngay cả khi nội dung của trang đó có thể truy cập được qua các URL khác (ví dụ: https://yourstore.com/offers/black-tshirts/)

    Canonical seo la gi

    Cài đặt Canonical bằng thẻ HTML rel = “canonical”

    Chỉ cần thêm thẻ canonical sau vào bất kỳ trang trùng lặp nào:

    <link rel=“canonical” href =“https://yourstore.com/tshirts/black-tshirts/” />

    Lưu ý rằng nếu bạn đang sử dụng CMS, bạn không cần phải lo lắng về mã trang của mình. Có một cách dễ dàng hơn.

    • Đặt thẻ canonical trong WordPress

    Cài đặt Yoast SEO và các thẻ canonical tự tham chiếu sẽ được thêm tự động. Để đặt canonical tùy chỉnh, hãy sử dụng phần “Advanced” trên mỗi bài đăng hoặc trang.

    canonical

    • Đặt thẻ canonical trong Shopify

    Shopify thêm các canonical URL tự tham chiếu cho các sản phẩm và bài đăng trên blog theo mặc định. Để đặt các canonical URL tùy chỉnh, bạn cần phải chỉnh sửa trực tiếp các tệp mẫu (.liquid).

    Canonical seo la gi

    • Đặt thẻ canonical trong Squarespace

    Squarespace cũng thêm các URL tự tham chiếu theo mặc định. Tuy nhiên, như trường hợp của Shopify, bạn cần phải chỉnh sửa mã trực tiếp nếu muốn thêm canonical URL tùy chỉnh.

    Canonical seo la gi

    2. Cài đặt Canonical trong tiêu đề HTTP

    Đối với các tài liệu như PDF, không có cách nào để đặt các thẻ canonical trong tiêu đề trang vì không có phần trang <head>. Trong những trường hợp như vậy, bạn sẽ cần sử dụng HTTP header để đặt canonical. Bạn cũng có thể sử dụng canonical trong HTTP header trên các trang web chuẩn.

    Ví dụ

    Hãy tưởng tượng rằng chúng tôi tạo một phiên bản PDF của bài đăng trên blog này và lưu trữ nó trong thư mục con blog của chúng tôi (ahrefs.com/blog/*).

    Đây là tiêu đề HTTP của chúng tôi có thể trông như thế nào đối với tệp đó:

    HTTP/1.1 200 OK

    Content-Type: application/pdf

    Link: <https://ahrefs.com/blog/canonical-tags/>; rel=”canonical”

    Canonical seo la gi

    Cài đặt Canonical trong tiêu đề HTTP

    3. Cài đặt Canonical trong sitemaps 

    Google tuyên bố rằng các trang non-canonical không nên được đưa vào sitemap. Chỉ các canonical URL mới được liệt kê. Đó là bởi vì Google xem các trang được liệt kê trong sitemap là trang canonical được đề xuất.

    Tuy nhiên, họ không phải lúc nào cũng chọn URL trong sitemap làm canonical.

    “Chúng tôi không đảm bảo rằng chúng tôi sẽ coi các URL của sitemap là canonical, nhưng đó là một cách đơn giản để xác định các trang canonical cho một trang web lớn và sitemap là một cách hữu ích để cho Google biết những trang nào bạn coi là quan trọng nhất trên website của mình.

    Canonical seo la gi

    Cài đặt Canonical trong sitemaps 

    4. Cài đặt Canonical bằng redirect 301 

    Sử dụng redirect 301 khi bạn muốn chuyển hướng traffic khỏi URL trùng lặp và sang phiên bản chuẩn.

    Ví dụ

    Giả sử trang của bạn có thể truy cập được tại các URL sau:

    example.com

    example.com/index.php

    example.com/home/

    Chọn một URL làm chuẩn và chuyển hướng các URL khác ở đó.

    Bạn cũng nên thực hiện tương tự đối với các phiên bản HTTPS/HTTP và www/non-www trên website của mình. Chọn một phiên bản chuẩn và chuyển hướng những phiên bản khác đến phiên bản đó.

    canonical

    Sử dụng redirect 301 khi bạn muốn chuyển hướng traffic khỏi URL

    5. Internal links 

    Cách bạn liên kết từ trang này sang trang khác trên toàn bộ website của mình là một tín hiệu chuẩn hóa.

    Google Webmaster Trends Analyst John Mueller đề cập đến các tín hiệu được sử dụng để xác định URL chuẩn trong video #AskGoogleWebmasters này:

    https://www.youtube.com/watch?v=8j_hxBw5B4E 

    Bạn càng nhất quán với tất cả các tín hiệu này, thì các công cụ tìm kiếm càng dễ dàng xác định canonical URL của bạn. Như John đã đề cập trong video, Google cũng ưu tiên HTTPS hơn HTTP URL và các URL đẹp hơn.

    VII. Các lỗi thường gặp về canonical cần tránh 

    Canonicalization là một chủ đề hơi phức tạp. Như vậy, có rất nhiều hiểu lầm và quan niệm sai lầm về cách thức chuẩn hóa chính xác. 

    Canonical seo la gi

    7 lỗi thường gặp về canonical cần tránh

    Dưới đây là một số sai lầm phổ biến mọi người khi cố gắng chuẩn hóa:

    1. Chặn URL được chuẩn hóa qua robots.txt

    Việc chặn một URL trong robots.txt sẽ ngăn Google thu thập dữ liệu, có nghĩa là họ không thể thấy bất kỳ thẻ canonical nào trên trang đó. Điều đó ngăn họ chuyển bất kỳ “link equity” nào từ non-canonical sang canonical.

    2. Đặt URL chuẩn hóa thành ‘noindex'

    Bạn không nên kết hợp noindex và rel=canonical bởi vì chúng là những hướng dẫn trái ngược nhau.

    Google thường sẽ ưu tiên thẻ canonical hơn thẻ ‘noindex', như John Mueller đã nói ở đây. 

    https://www.reddit.com/r/TechSEO/comments/8yahdr/2_questions_about_the_canonical_tag/e2dey9i/?context=1 

    Canonical seo la gi

    Tuy nhiên nó vẫn thực hành không tốt. Nếu bạn muốn noindex và chuẩn hóa một URL, hãy sử dụng redirect 301. Nếu không, hãy sử dụng rel=canonical.

    3. Đặt mã trạng thái HTTP 4XX cho canonical URL 

    Việc đặt mã trạng thái HTTP 4XX cho một canonical URL có tác dụng tương tự như việc sử dụng thẻ ‘noindex': Google sẽ không thể nhìn thấy thẻ canonical và chuyển “link equity” sang phiên bản canonical.

    4. Chuẩn hóa tất cả các trang được phân trang thành trang gốc

    Các trang được phân trang không nên được chuẩn hóa thành trang được phân trang đầu tiên trong chuỗi. Thay vào đó, các tiêu chuẩn tự tham chiếu nên được sử dụng trên tất cả các trang được phân trang.

    Tại sao? Như John Mueller của Google đã nói trên Reddit , đây là cách sử dụng rel=canonical không đúng cách.

    “Điều chính cần tránh, vì bài đăng này là về canonicalization, là sử dụng rel=canonical trên trang 2 trỏ đến trang 1. Trang 2 không tương đương với trang 1, vì vậy rel=canonical như vậy sẽ không chính xác.

    Bạn cũng nên sử dụng thẻ rel=prev/next để phân trang. Những thứ này không còn được sử dụng bởi Google , nhưng Bing vẫn sử dụng chúng.

    5. Không sử dụng thẻ canonical với hreflang

    Thẻ Hreflang được sử dụng để chỉ định nhắm mục tiêu theo ngôn ngữ và địa lý của một trang web.

    Google tuyên bố rằng khi sử dụng hreflang, bạn nên “chỉ định một trang canonical bằng cùng một ngôn ngữ hoặc ngôn ngữ thay thế tốt nhất có thể nếu một trang canonical không tồn tại cho cùng một ngôn ngữ”.

    6. Có nhiều thẻ rel=canonical

    Việc có nhiều thẻ rel=canonical sẽ khiến chúng có khả năng bị Google từ chối. Trong nhiều trường hợp, điều này xảy ra do các thẻ được chèn vào hệ thống ở các điểm khác nhau, chẳng hạn như CMS, chủ đề và plugin. Đây là lý do tại sao nhiều plugin có tùy chọn ghi đè nhằm đảm bảo rằng chúng là nguồn duy nhất cho các thẻ canonical.

    Một lĩnh vực khác mà đây có thể là vấn đề là với canonical được thêm bằng JavaScript. Nếu bạn không có canonical URL được chỉ định trong phản hồi HTML và sau đó thêm thẻ rel=canonical với JavaScript thì nó sẽ được tuân thủ khi Google hiển thị trang. Tuy nhiên, nếu bạn có một trang canonical được chỉ định trong HTML và hoán đổi phiên bản ưa thích bằng JavaScript, bạn đang gửi các tín hiệu hỗn hợp đến Google.

    7. Rel=canonical trong <body>

    Rel=canonical chỉ xuất hiện trong phần <head> của tài liệu. Thẻ canonical trong phần <body> của trang sẽ bị bỏ qua.

    Nơi mà điều này có thể trở thành một vấn đề là với việc phân tích cú pháp của một tài liệu. Mặc dù mã nguồn của một trang có thể có thẻ rel=canonical ở vị trí chính xác, nhưng khi trang thực sự được tạo trong trình duyệt hoặc được hiển thị bởi công cụ tìm kiếm, nhiều thứ khác nhau như thẻ không đóng, JavaScript được chèn hoặc <iframes> trong phần <head> có thể khiến phần <head> kết thúc sớm trong khi hiển thị. Trong những trường hợp này, một thẻ canonical có thể vô tình bị đưa vào <body> của một trang được hiển thị mà nó sẽ không được xuất hiện.

    VIII. Cách tìm và sửa các lỗi canonical trên website 

    Rất dễ mắc lỗi với quá trình chuẩn hóa, vì vậy bạn phải thường xuyên kiểm tra website của mình để tìm các vấn đề liên quan đến thẻ canonical và sửa chúng càng sớm càng tốt.

    Đối với điều này, bạn có thể sử dụng công cụ Ahrefs’ Site Audit. 

    Site Audit crawl website của bạn cho hơn 100 vấn đề SEO, bao gồm cả những vấn đề liên quan đến thẻ canonical.

    Dưới đây là mười hai vấn đề liên quan đến thẻ canonical mà Site Audit có thể tìm thấy và cách khắc phục chúng:

    Canonical seo la gi

    1. Canonical trỏ đến 4XX

    Cảnh báo này kích hoạt khi một hoặc nhiều trang được chuẩn hóa thành URL 4XX.

    Tại sao nó là một vấn đề?

    Các công cụ tìm kiếm không index các trang 4XX vì chúng không hoạt động. Do đó, họ sẽ bỏ qua bất kỳ thẻ canonical nào trỏ đến các trang như vậy và thường index sai phiên bản (không phải chuẩn) của trang.

    Làm thế nào để khắc phục? 

    Xem lại các trang bị ảnh hưởng và thay thế các liên kết canonical (4XX) đã chết bằng các liên kết đến các trang (200) đang hoạt động mà bạn muốn index. 

    2. Canonical trỏ đến 5XX

    Cảnh báo này kích hoạt khi một hoặc nhiều trang được chuẩn hóa thành URL 5XX.

    Tại sao nó là một vấn đề?

    Mã trạng thái HTTP 5XX cho biết sự cố máy chủ dẫn đến không thể truy cập trang canonical. Google không có khả năng index các trang không thể truy cập, vì vậy có thể bỏ qua trang canonical.

    Làm thế nào để khắc phục? 

    Thay thế bất kỳ canonical URL sai bằng các URL hợp lệ. Kiểm tra các cấu hình sai của máy chủ nếu trang chuẩn được chỉ định có vẻ chính xác. Lưu ý rằng đây có thể là sự cố tạm thời nếu quá trình thu thập thông tin xảy ra khi trang web của bạn ngừng hoạt động để bảo trì hoặc máy chủ của trang web của bạn bị quá tải.

    3. Canonical trỏ đến redirect 

    Cảnh báo này kích hoạt khi một hoặc nhiều trang được chuẩn hóa thành URL được chuyển hướng.

    Tại sao nó là một vấn đề? 

    Canonicals phải luôn trỏ đến phiên bản có thẩm quyền nhất của một trang. Đây không phải là trường hợp của các URL chuyển hướng. Do đó, các công cụ tìm kiếm có thể hiểu sai hoặc bỏ qua canonical.

    Làm thế nào để khắc phục? 

    Thay thế các liên kết canonical bằng các liên kết trực tiếp đến phiên bản có thẩm quyền nhất của trang (tức là phiên bản trả về mã trạng thái HTTP 200 và không redirect).

    4. Các trang trùng lặp không có canonical

    Cảnh báo này kích hoạt khi tồn tại một hoặc nhiều trang trùng lặp hoặc rất giống nhau nhưng không chỉ định phiên bản canonical.

    Tại sao nó là một vấn đề?

    Bởi vì không có trang canonical nào được chỉ định, Google sẽ cố gắng xác định phiên bản phù hợp nhất để tự hiển thị trong kết quả tìm kiếm. Đây có thể không phải là phiên bản bạn muốn index.

    Làm thế nào để khắc phục? 

    Xem lại các nhóm trùng lặp. Chọn một phiên bản chuẩn sẽ được index trong kết quả tìm kiếm. Chỉ định đây là phiên bản canonical trên tất cả các bản sao (và thêm thẻ canonical tự tham chiếu vào phiên bản canonical).

    5. Hreflang trỏ đến non-canonical 

    Cảnh báo này kích hoạt khi một hoặc nhiều trang chỉ định non-canonical URL trong các chú thích hreflang của chúng.

    Tại sao nó là một vấn đề? 

    Các liên kết trong thẻ hreflang phải luôn  trỏ đến các trang canonical. Liên kết đến phiên bản non-canonical của một trang từ các chú thích hreflang có thể gây nhầm lẫn và đánh lừa các công cụ tìm kiếm.

    Làm thế nào để khắc phục? 

    Thay thế các liên kết trong chú thích hreflang của các trang bị ảnh hưởng bằng các liên kết canonical của chúng.

    6. Canonical URL không có incoming internal link

    Cảnh báo này kích hoạt khi một hoặc nhiều URL chuẩn được chỉ định không có liên kết đến nội bộ.

    Tại sao nó là một vấn đề?

    Các canonical URL không có internal link không thể truy cập được đối với khách truy cập website. Thay vào đó, ở một nơi nào đó trên trang web, họ đang được chuyển hướng đến phiên bản non-canonical của trang.

    Làm thế nào để khắc phục? 

    Thay thế bất kỳ internal link nào đến các trang được chuẩn hóa bằng các liên kết trực tiếp đến trang canonical.

    7. Trang non-canonical trong sitemap 

    Cảnh báo này kích hoạt khi một hoặc nhiều trang không chuẩn được liệt kê trong sơ đồ trang web.

    Tại sao nó là một vấn đề? 

    Google tuyên bố rằng bạn không nên đưa các non-canonical URL vào sitemap của mình. Lý do là họ thấy các trang trong sitemap là trang canonical được đề xuất. Bạn chỉ nên liệt kê các trang mà bạn muốn index trong sitemap.

    Làm thế nào để khắc phục? 

    Xóa các non-canonical URL khỏi sitemap của bạn.

    8. Trang non-canonical được chỉ định là trang canonical 

    Cảnh báo này kích hoạt khi một hoặc nhiều trang chỉ định một canonical URL cũng được chuẩn hóa cho một trang khác. Điều này tạo ra một “chuỗi canonical” trong đó trang A được chuẩn hóa thành trang B, sau đó được chuẩn hóa thành trang C.

    Canonical seo la gi

    Tại sao nó là một vấn đề? 

    Các chuỗi canonical có thể gây nhầm lẫn và đánh lừa các công cụ tìm kiếm. Do đó, họ có thể hiểu sai hoặc bỏ qua quy tắc được chỉ định.

    Làm thế nào để khắc phục? 

    Thay thế các liên kết non-canonical trong thẻ canonical của các trang bị ảnh hưởng bằng các liên kết trực tiếp đến trang canonical. Ví dụ: nếu trang A được chuẩn hóa thành trang B, sau đó được chuẩn hóa thành trang C, hãy thay thế liên kết chuẩn hóa trên trang A bằng một liên kết đến trang C.

    9. Open Graph URL không khớp với canonical 

    Cảnh báo này kích hoạt khi có sự không khớp giữa canonical và Open Graph URL được chỉ định trên một hoặc nhiều trang.

    Tại sao nó là một vấn đề? 

    Nếu Open Graph URL không khớp với trang canonical thì phiên bản non-canonical của một trang sẽ được chia sẻ trên các mạng xã hội.

    Làm thế nào để khắc phục? 

    Thay thế Open Graph URL trên các trang bị ảnh hưởng bằng canonical URL. Đảm bảo rằng hai URL giống nhau.

    Lưu ý: URL bên trong thẻ Open Graph phải là tuyệt đối và sử dụng giao thức http:// hoặc https://, như trường hợp của canonicals. 

    10. Canonical từ HTTPS sang HTTP

    Cảnh báo này kích hoạt khi một hoặc nhiều trang bảo mật (HTTPS) chỉ định phiên bản không bảo mật (HTTP) làm trang canonical.

    Tại sao nó là một vấn đề? 

    HTTPS là một yếu tố xếp hạng , vì vậy bạn nên chỉ định các phiên bản an toàn của các trang là trang canonical nếu có thể.

    Làm thế nào để khắc phục? 

    Redirect trang HTTP sang HTTPS tương đương. Nếu không thể, hãy thêm liên kết rel=“canonical” từ phiên bản HTTP của trang vào phiên bản HTTPS.

    Lưu ý: Google cũng liệt kê việc triển khai HSTS là một giải pháp tiềm năng.

    11. Canonical từ HTTP sang HTTPS

    Cảnh báo này kích hoạt khi một hoặc nhiều trang không bảo mật (HTTP) chỉ định phiên bản bảo mật (HTTPS) làm trang canonical.

    Tại sao nó là một vấn đề? 

    HTTPS được ưu tiên hơn HTTP. Việc có phiên bản HTTP của một trang sau đó chỉ định phiên bản HTTPS là trang canonical là không hợp lý.

    Lưu ý: Điều này có thể sẽ không gây ra vấn đề lớn nhưng nó vẫn đáng được khắc phục nếu có thể. 

    Làm thế nào để khắc phục? 

    Triển khai redirect 301 từ HTTP sang HTTPS. Bạn cũng nên thay thế bất kỳ internal link nào đến phiên bản HTTP của trang bằng các liên kết trực tiếp đến phiên bản HTTPS.

    12. Trang non-canonical nhận được organic traffic 

    Cảnh báo này kích hoạt khi một hoặc nhiều trang non-canonical hiển thị trong kết quả tìm kiếm và nhận được organic traffic (điều này sẽ không xảy ra).

    Tại sao nó là một vấn đề? 

    Thẻ canonical của bạn được thiết lập không chính xác hoặc Google đã chọn bỏ qua thẻ canonical được chỉ định.

    Làm thế nào để khắc phục? 

    Kiểm tra xem các thẻ rel=canonical có được thiết lập chính xác trên tất cả các trang được báo cáo hay không. Nếu đó không phải là vấn đề, hãy sử dụng công cụ URL Inspection trong Google Search Console để xem liệu họ có coi canonical URL được chỉ định là canonical hay không. Nếu không khớp thì bạn hãy điều tra lý do tại sao có thể xảy ra trường hợp này.

    Các thẻ canonical không đến nỗi quá phức tạp, bạn chỉ cần tìm hiểu rõ về bản chất là có thể dễ dàng thực hiện. Bạn chỉ cần nhớ rằng các thẻ canonical không phải là một chỉ thị mà là một tín hiệu cho các công cụ tìm kiếm. Nói cách khác, họ có thể chọn một canonical khác với canonical mà bạn khai báo.

    Bạn có thể sử dụng công cụ URL Inspection trong Google Search Console để xem cả trang canonical do người dùng khai báo và do Google chọn.

    Canonical seo la gi

    Nếu bạn có bất kỳ thắc mắc nào về canonical nói riêng và SEO nói chung thì bạn có thể liên hệ với Quyết để được giải đáp và hướng dẫn nhanh chóng nhất. Ngoài ra, bạn cũng có thể theo dõi website seosona.com để cập nhật các thông tin mới nhất về Digital Marketing nhé. 

    https://seongon.com/blog/seo/canonical-la-gi.html 

    https://ahrefs.com/blog/canonical-tags/ 

    https://moz.com/learn/seo/canonicalization 

    https://www.semrush.com/blog/canonical-url-guide/ 

    0 0 đánh giá
    Đánh giá bài viết
    Theo dõi
    Thông báo của
    guest

    0 Góp ý
    Phản hồi nội tuyến
    Xem tất cả bình luận
    0
    Rất thích suy nghĩ của bạn, hãy bình luận.x