Đường dẫn canonical URL, có thể hiểu như nào nhỉ! Thường thì trên bất kỳ website nào đều có nhiều bài viết trùng nhau về nội dung, nhưng tiêu đề và đường dẫn khác nhau. Nếu số lượng những bài viết này nhiều quá thì có thể bị Search Engine hiểu nhầm là cố tình spam, copy paste bài viết. Và việc dùng Canonical URL (link HTML với thuộc tính rel=canonical) sẽ giúp người quản trị, người làm nội dung giải quyết vấn đề này mà không ảnh hưởng đến thứ hạng của trang web.
1. rel=canonical là gì?
rel=canonical hoặc gọi ngắn gọn là canonical link, là 1 thành phần HTML giúp chúng ta loại bỏ bớt yếu tố trùng lặp nội dung trên website. Việc đó được thực hiện bằng cách chỉ định rõ yếu tố canonical URL, hay nói nôm na là đường link nào là bài gốc. Ví dụ:
- Cùng 1 nội dung nhưng trên website Quản Trị Mạng có 3 bài viết về cách "Live Stream Facebook trên máy tính", thì bạn cần xác định bài nào là bài gốc (ví dụ là bài 1, có thể dựa trên số lượt xem, lượt tương tác, nội dung cập nhật...) và đặt link Canonical vào bài đó. Và khi đó, Search Engine sẽ tự động lấy bài viết được chỉ định đó và hiển thị cho người đọc mặc dù họ click chuột vào link bài 2 hoặc 3.
Qua đây, chúng ta có thể thấy rằng rel=canonical khá giống với 301 direct nhưng nó khác biệt ở chỗ là hệ thống không redirect.
2. Ưu thế của rel=canonical trong SEO là gì?
Lại quay về vấn đề đường dẫn - URL của bài viết, khi bạn có nhiều lựa chọn trong việc lấy ra 1 URL đẹp nhất, có lợi thế nhất.
Cách nào thiết lập các đường link Canonical?
Tiếp tục bằng ví dụ cho dễ hiểu. Giả sử rằng ta có 2 bài viết với độ trùng khớp 100%, điểm khác biệt là chúng nằm ở khác chuyên mục. Và cả 2 bài viết đều có giá trị, vậy tôi nên chọn bài nào làm bài gốc? Rõ ràng rất khó lựa chọn, phải không nào?
Bài viết 1: http://example.com/wordpress/seo-plugin/
Bài viết 2: http://example.com/wordpress/plugins/seo/
Trường hợp rất cụ thể về việc áp dụng rel=canonical vào. Quy trình, quy tắc như sau:
- Bước 01: chọn lấy 1 bài để làm gốc, có thể dựa vào các tiêu chí đã đề cập ở trên.
- Bước 02: thêm thẻ rel=canonical từ trang không cần canonical vào trang canonical (cẩn thận kẻo nhầm ở bước này nhé anh em!). Mã ở phần head của trang không canonical sẽ có dạng như dưới đây:
<link rel="canonical" href="http://example.com/wordpress/seo-plugin/">
Ta có hiểu nôm na là thẻ này sẽ có tác dụng gộp 2 bài viết vào 1 đường URL duy nhất. Việc chuyển hướng này chỉ có tác dụng với Search Engine, và người đọc sẽ không biết được sự khác biệt đó, và lượt view sẽ được tính cho bài viết được canonical.
3. Khi nào nên dùng Canonical URL?
Lựa chọn giữa 301 redirect hay canonical?
Nếu bạn băn khoăn giữa việc dùng 301 redirect hoặc canonical trong khi website bạn đáp ứng được cả 2 tính năng trên, thì nên chọn phương án nào?
Xét về phương diện kỹ thuật thì nên luôn chọn Redirect. Còn trong trường hợp còn lại thì ưu tiên dùng Canonical.
Cũng với ví dụ trên, nhưng lại nảy ra ý tưởng sau! Liệu chúng ta có nên tự Canonical URL của chính bài viết đó? Câu hỏi này mang tính tranh cãi rất cao, phần lớn các ý kiến đưa ra đều nghiêng về phương án đặt Canonical cho tất cả các trang. Và có vẻ Google cũng đồng ý với ý kiến này, xem thêm tại đây.Lý do là vì tất cả các bộ quản trị CMS đều cho chấp nhận thay đổi URL mà không cần thay đổi nội dụng, vẫn không ảnh hưởng đến thứ hạng trang web. Do vậy, các bạn có thể cho rằng toàn bộ URL có dạng như dưới đây đều có thể trùng lặp nội dung:
- http://example.com/wordpress/seo-plugin/
- http://example.com/wordpress/seo-plugin/?isnt=it-awesome
- http://example.com/wordpress/seo-plugin/?cmpgn=twitter
- http://example.com/wordpress/seo-plugin/?cmpgn=facebook
Canonical URL trong Cross Domain?
Vấn đề như thế này nữa, nội dung a của bạn hoàn toàn có thể được xuất bản trên 2 hoặc nhiều website (tất nhiên là được bạn cho phép). Bạn chỉ cần xem kỹ những bài viết đó, ở phần thẻ head chắc chắn sẽ thấy rel=canonical và trỏ về bài gốc. Điều này cũng có nghĩa là toàn bộ link trỏ từ các phiên bản khác nhau đều tác động đến thứ hạng của các bài viết được canonical.
Các lỗi thường gặp trong việc Canonical URL?
Lợi ích của Canonical ta đã thấy ở trên. Còn vấn đề gì sẽ xảy ra nếu ta Canonical nhầm? Dưới đây Quản Trị Mạng sẽ liệt kê ra vài lỗi thường gặp nhé.
- Đặt nhầm thẻ rel=canonical vào trang không cần canonical. Điều này dẫn đến hệ quả là tụt thứ hạng, cả 2 bài viết đều bị kéo xuống khỏi trang top tìm kiếm.
- Không nên đặt Canonical vào các page cố định ở trang 1, mà thay vào đó là canonical vào các thành phần từ trang 2 trở đi. Vì nếu đặt ở trang 1, Search Engine sẽ không index các đường link từ các trang sau trở đi.
- Càng cụ thể càng tốt. Nhiều site có sử dụng các giao thức kết nối khác nhau, nghĩa là họ bỏ tiền tố http hoặc https trong link. Không nên làm như vậy, đối với link Canonical thì càng cụ thể, càng đầy đủ càng tốt.
- Quá nhiều link rel=canonical sẽ có ảnh hưởng xấu đến trang.
Rel=canonical và mạng xã hội?
Hiện tại, Facebook và Twitter đều coi trọng rel=canonical. Nếu bạn chia sẻ đường dẫn bài viết trên Facebook mà nó đã canonical tại 1 nơi khác, thì Facebook cũng sẽ chia sẻ chính xác những gì từ bài gốc đó. Và với Twitter cũng tương tự như vậy.
4. Ưu điểm khi dùng rel=canonical?
Canonical link HTTP header:
Google cũng đã hỗ trợ phần canonical link HTTP header (xem thêm tại đây). Và phần header sẽ trông giống như thế này:
Link: <http://www.example.com/white-paper.pdf>;
rel="canonical"
Các phần link HTTP header canonical rất tốt khi bạn tiến hành canonical các file tài liệu như PDF...
Chúc các bạn thành công!