Trang kiểu mẫu: Xử lý các vấn đề về trùng lặp nội dung

Quản Trị Mạng - Một website nếu xuất hiện nhiều trang có nội dung giống nhau thường sẽ làm cho Google "lúng túng" trong việc lập chỉ mục trang nào là tốt nhất. Với việc chỉ ra trang nào là kiểu mẫu, Google sẽ đánh giá chuẩn xác hơn trang mà bạn cho là có nội dung tốt nhất. Nói cách khác, trang kiểu mẫu là trang web được yêu thích nhất trong số các trang có nội dung giống nhau.

Ví dụ, như một website thường có thể có nhiều trang liệt kê cùng một danh mục sản phẩm theo các tiêu chí khác nhau (theo vần, theo giá bán hoặc theo đánh giá xếp loại…) như:

http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=alpha&sessionid=5678asfasdfasfd
http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=price&sessionid=5678asfasdfasfd

Nếu như Google biết được là các trang này có nội dung giống nhau thì Google sẽ chỉ index một trang vào kết quả tìm kiếm. Thuật toán của Google sẽ chọn một trang mà họ cho là có thể đưa ra giải đáp tốt nhất đối với tìm kiếm của người dùng. Tuy nhiên, giờ đây, chúng ta có thể xác định được trang nào là trang kiểu mẫu theo đánh giá của các bộ máy tìm kiếm bằng việc thêm một cấu trúc <link> với thuộc tính rel="canonical" vào thẻ <head> của trang chưa được coi là kiểu mẫu.

Việc thêm đường dẫn và thuộc tính này cho phép người sở hữu website có thể xác định được các trang có nội dung trùng lặp trên website và thông báo cho Google rằng: “Trong số các trang có nội dung trùng lặp thì đây là trang tốt nhất. Hãy ưu tiên trang này trong kết quả tìm kiếm”.

Làm thế nào để xác định một URL kiểu mẫu?

Có 2 cách để xác định một URL kiểu mẫu:

1. Chèn một đường link rel="canonical" vào thẻ <head> trên trang HTML không được coi là trang kiểu mẫu (non-canonical page)

Để xác định liên kết http://www.example.com/product.php?item=swedish-fish được coi là kiểu mẫu, hãy tạo một đường link như sau:

<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish"/>

Copy link này vào thẻ <head> của các trang non-canonical, ví dụ http://www.example.com/product.php?item=swedish-fish&sort=price.

Nếu nội dung đều được hiển thị ở cả hai trang http://www.example.com/product.php?item=swedish-fishhttps://www.example.com/product.php?item=swedish-fish, thì có thể xác định được trang nào là trang kiểu mẫu bằng cách tạo đường link:

<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish"/>

và chèn link này vào thẻ <head> của https://www.example.com/product.php?item=swedish-fish.

2. Xác định URL kiểu mẫu thông qua Link rel="canonical" HTTP header.

Việc thêm rel="canonical" vào phần head của trang HTML không sử dụng được với các file PDF và các dạng file khác được index trong Google Web Search. Trong trường hợp đó, bạn có thể xác định URL kiểu mẫu thông qua Link rel="canonical" HTTP header như sau: (ghi chú: để làm được điều này, bạn sẽ phải có khả năng cấu hình các server của mình):

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

Hiện này, google chỉ hỗ trợ các cấu trúc header cho việc tìm kiếm web.

rel="canonical" là một gợi ý hay một chuyển hướng?

Người sở hữu website có thể chọn lựa phiên bản web nào có thể được Google coi là kiểu mẫu. Google sẽ tính đến yếu tố này cùng với các dấu hiệu khác để quyết định xem các URL nào chứa nội dung trùng lặp, sau đó sẽ tính toán để xác định xem trang nào sẽ được hiển thị trên kết quả tìm kiếm.

Đường dẫn tương đối hay tuyệt đối?

rel="canonical" có thể được sử dụng với các đường dẫn tương đối hoặc tuyệt đối, nhưng nên sử dụng các đường dẫn tuyệt đối để hạn chế tối đa rắc rối phát sinh. Nếu văn bản của bạn có một đường link gốc thì các link liên quan sẽ được coi là tương đối so với link gốc này.

Nội dung các trang có cần phải tương tự với nội dung của trang kiểu mẫu hay không?

Có. Thuộc tính rel=“canonical” có thể được sử dụng chỉ để xác định xem trang nào được yêu thích nhất trong số các trang có nội dung trùng lặp (vẫn được chấp nhận trong trường hợp có một vài sai khác rất nhỏ như thứ tự sắp xếp…)

Ví dụ, nếu một website có các trang cùng nói về một mẫu giầy khiêu vũ, các mẫu này chỉ khác nhau về màu sắc thì ta có thể xác định trang kiểu mẫu bằng việc xác định xem trang nào có loại màu sắc được ưa thích nhất, và trang này sẽ có nhiều khả năng hơn để Google đưa vào kết quả tìm kiếm.

Tuy nhiên, thuộc tính rel="canonical” có thể sẽ không hiệu quả trong trường hợp website này chỉ muốn nâng cao thứ hạng của trang nói về keo bọt chứ không phải các trang về giày.

Nếu rel="canonical" chỉ đến một trang không tồn tại thì sao? Hoặc nếu có nhiều trang cùng được coi là trang kiểu mẫu?

Google sẽ cố gắng hết sức để dựa vào các thuật toán và đưa ra quyết định trang nào sẽ là trang kiểu mẫu như Google đã và đang làm.

Google có thể theo một chuỗi các chỉ định rel="canonical" không?

Có, trong một số trường hợp. Tuy nhiên, để đảm bảo việc lựa chọn được trang kiểu mẫu tối ưu nhất, Google khuyến cáo nên update các link dẫn tới một trang kiểu mẫu.

Có thể sử dụng rel="canonical" để giúp chỉ ra URL kiểu mẫu đối với một tên miền hoàn toàn khác không?

Có, nhiều trường hợp sẽ rất khó để tạo ra các redirect, ví dụ như khi muốn chuyển sang một tên miền mới ở một máy chủ không có khả năng tạo ra các redirect. Trong trường hợp này, có thể sử dụng thuộc tính rel="canonical" để xác định chính xác URL của tên miền nào sẽ được index. Trong khi thuộc tính rel="canonical" được xem như một gợi ý hơn là một đường dẫn tuyệt đối thì đây vẫn được coi là một giải pháp hữu ích.

Thứ Năm, 17/11/2011 15:12
51 👨 874
0 Bình luận
Sắp xếp theo
    ❖ Kiến thức cơ bản