Hiện nay các bộ máy tìm kiếm và đặc biệt là Google xem xét
rất kỹ việc duplicate content hay còn gọi là trùng lặp nội
dung. Việc trùng lặp nội dung giữa các website thường mang
đến nhiều phiền toái cho tác giả, người trích lại hoặc ngay cả
cho người tham quan website
7 trang |
Chia sẻ: lylyngoc | Lượt xem: 1562 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Duplicate trong SEO, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Duplicate trong SEO
Hiện nay các bộ máy tìm kiếm và đặc biệt là Google xem xét
rất kỹ việc duplicate content hay còn gọi là trùng lặp nội
dung. Việc trùng lặp nội dung giữa các website thường mang
đến nhiều phiền toái cho tác giả, người trích lại hoặc ngay cả
cho người tham quan website.
Vấn đề càng trở nên cấp thiết hơn khi rất nhiều trang web đã
bị đánh rớt hạng trên các công cụ tìm kiếm, đơn giản vì lỗi
duplicate content. Để hiểu rõ hơn về duplicate content chúng
ta hãy tham khảo một số dạng duplicate sau đây:
Duplicate content: nghĩa là trùng lặp nội dung giữa các
URL khác nhau cùng truy xuất một web page. Ví dụ :
Cả 2 URL trên đều cùng trỏ về trang chủ của domain.com
Có 2 loại duplicate content mà bạn nên chú ý. Đó là duplicate
trong trang và duplicate ngoài trang.
1. Duplicate trong trang:
Nội dung bị trùng lặp bởi các URL cùng thuộc tên miền của
trang. Ví dụ phía trên là một dạng duplicate trong trang.
Ngoài ra duplicate trong trang còn một số dạng duplicate như
sau:
1.1 Session ID:
Ví dụ:
Cả 2 cùng trỏ về một nội dung trên website.
1.2 Tham số thuộc tính trên URL
Ví dụ :
Cả 2 cùng trỏ về nội dung web màu đỏ trên website.
1.3 Thư mục trên URL
Ví dụ :
Cả 2 cùng trỏ về cùng một nội dung trên website mặc dù
đường dẫn thư mục khác nhau.
1.4 Các tag trên URL
Ví dụ :
Các 2 cùng trỏ về cùng một nội dung. Chức năng tag này
thường được rất nhiều người sử dụng, nhưng nếu không để ý
chuyển đổi sang một URL duy nhất thì lỗi duplicate sẽ xuất
hiện.
2. Duplicate ngoài trang:
Duplicate ngoài trang có 2 trường hợp đáng chú ý. Trường
hợp duplicate do trích dẫn lại hoặc duplicate do cố ý spam.
2.1 Duplicate do trích dẫn:
Dễ thấy nhất là các trang báo, tin tức hoặc các nội dung hay
thường được các trang khác trích dẫn lại. Điều này là tốt
nhưng đôi khi cũng gây ra nhiều sự phiền toái. Các search
engine không nhận được đâu là bài gốc, thường thì search
engine dựa vào độ trust của trang hoặc thời điểm index để
xác định nội dung gốc.
Nhưng cũng sẽ xảy ra trường hợp trang có độ trust cao trích
dẫn lại trang có độ trust thấp, làm cho trang chủ nội dung gặp
nhiều thiệt thòi trong lỗi duplicate.
2.2 Duplicate do cố ý spam:
Một số đối thủ sử dụng thủ thuật làm mờ mắt search engine
khi nhân bản ra hàng loạt nội dung giống nhau trên cả trang
có độ trust cao cũng như trang có độ trust thấp.
Bạn cũng biết rằng không phải lúc nào nội dung trên web của
bạn cũng được index trước, đôi khi Google vẫn lầm tưởng
nội dung mà bạn viết ra chính là duplicate content với các nội
dung mà đối thủ mang đi spam.
Tổng hợp lại, có 2 loại duplicate content : duplicate trong
trang và duplicate ngoài trang. Khi bạn nhận diện được
chúng bước tiếp theo là bạn phải suy nghĩ làm thế nào để
chuyển đổi các nội dung trùng lập về một phiên bản, giúp các
search engine dễ dàng đánh dấu được đâu là nội dung của
bạn, việc này vừa giúp bạn nâng cao độ trust của website
đồng thời cũng tránh được những sự hiểu lầm không cần thiết
của search engine đối với website của bạn.