Cách chặn liên kết trỏ tới từ domain không mong muốn này
là dùng file .htaccess để block những liên kết từ site mà mình
không mong muốn đến site mình dựa trên nguyên lý bắt
HTTP Referer header với nội dung hướng dẫn như sau:
Nhân dịp khai trương box này mình muốn chia sẽ với mọi
người thủ thuật “Chặn liên kết trỏ tới từ domain không
muốn” bằng .htaccess
8 trang |
Chia sẻ: lylyngoc | Lượt xem: 1577 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Thủ thuật chống backlink xấu bằng HTTP Referer không hiệu quả, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Thủ thuật chống
backlink xấu bằng HTTP
Referer không hiệu quả
Cách chặn liên kết trỏ tới từ domain không mong muốn này
là dùng file .htaccess để block những liên kết từ site mà mình
không mong muốn đến site mình dựa trên nguyên lý bắt
HTTP Referer header với nội dung hướng dẫn như sau:
Nhân dịp khai trương box này mình muốn chia sẽ với mọi
người thủ thuật “Chặn liên kết trỏ tới từ domain không
muốn” bằng .htaccess
Từ tình huống thực tế “Seo idol 2011″, xuất hiện tình huống
chơi xấu đội vietnamtours247.com bằng cách tạo link farm
với số lượng cực lớn từ blogspot. Mà tiêu biểu là
site
Và từ thực tế để tiếp tục chiến đấu cùng Seoidol chắc hẳn
phải tìm ra cách di đó ngăn chặn phần nào việc chơi xấu
này. Mình cố gắng tìm tòi và lần mò khắc các diễn đàn seo
trên thế giới với hy vọng kiếm được giải pháp ngăn chặn việc
này tái diễn. Và mình tìm thấy được 1 giải pháp có thể “sử
dụng được”
Mình xin cung cấp 1 đoạn code trong file .htaccess như sau:
SetEnvIfNoCase Referer “.*(cụm từ chứa trong domain).*”
ban
SetEnvIfNoCase Referer “.*(blogspot).*” ban
SetEnvIfNoCase Referer “.*(azfreeapps).*” ban
order allow,deny
deny from env=ban
allow from all
Với nôi dung trong ( ) là cụm từ chứa trong domain mà bạn
muốn chặc liên kết trỏ đến website của bạn.
Ví dụ từ trường hợp của site
Nếu bạn set giá trị
SetEnvIfNoCase Referer “.*(giethetseo).*” ban
Thì kết quả là tất cả những liên kết xuất phát
từ sẽ không thể kết nối đến site
của bạn và lúc này trình duyệt sẽ hiển thị lỗi “403 Forbiden
– You don’t have permission to access / on this server”
Mặc khác nếu bạn set giá trị
SetEnvIfNoCase Referer “.*(blogspot).*” ban
Thì kết quả những trang co domain chứa blogspot bao gồm
cả giethetseo.blogspot.com sẽ đều bị chặn khi liên kết đến
trang của bạn (Có thể hiểu khi ta chặn blogspot thì dạng
subdomain của blogspot cũng sẽ bị ảnh hưởng)
Hãy kiểm tra lượng backlink trỏ đến web của bạn hằng ngày
bằng các công cụ hỗ trợ như site explore, backlink watch. Để
kiểm tra những domain có dấu hiệu bất thường và tiến hành
ngăn chặn kịp thời. Có thể đây chỉ là 1 giải pháp tình thế
nhằm hạn chế phần nào ảnh hưởng của những liên kết xấu.
Mong rằng nó cũng sẽ giúp chiến dịch SEO của bạn hiệu quả
hơn.
Vì một cộng đồng seo vững mạnh. Rất mong nhận được nhiều
giải pháp và nhận xét từ mọi người để có thể khắc phục một
cách triệt để hơn.
Vì sao cách này lại không hiệu quả? Theo tôi thì nếu như bạn
hiểu được nguyên lý Google Crawl và Indexwebsite như thế
nào sẽ không khó để hiểu được điều này. Các bạn có thể
tham khảo thêm bài viết Google thu thập nội dung website
của bạn như thế nào. Ở đây tôi xin phép giải thích như sau:
Đoạn code trên dựa vào HTTP Referer header của một
request để chặn những backlink được cho là không mong
muốn. Trước tiên bạn cần phải hiểu được rằng HTTP
Referer là gì và được sinh ra như thế nào?
HTTP Referer là một tham số được truyền đi trong request
thông qua header xảy ra khi bạn click chuột từ một trang web
A đến một trang web B. Lúc đó thông số HTTP Referer được
truyền đến trang B khi request là đường dẫn URL của trang
A.
Tuy nhiên, khi kết hợp với quá trình Crawl và Index của
Google như tôi giới thiệu trong bài ở trên thì nó bao gồm
nhiều tiến trình nhỏ và có thể mô tả như sau:
Một con Googlebot thứ nhất (gọi tắt là Googlebot #1) Crawl
trang A và thu thập nội dung của trang A, đồng thời thu thập
tất cả các URL liên kết có trong trang A, sau đó Googlebot
#1 này đem dữ kiện báo cáo về trung tâm lưu trữ. Các URL
liên kết được đưa tập hợp vào một danh sách và sắp xếp thứ
tự ưu tiên để phân công nhiệm vụ cho các Googlebot khác
tiếp tục đi Crawl và Index các danh sách URL đó. (Tham
khảo thêm về HTTP
Referer:
Như vậy, các con bot khác khi được phân công nhiệm vụ thì
nó sẽ là dạng request trực tiếp chứ không phải như hành động
click chuột của một người dùng thông thường từ trang A đến
trang B. Do đó, lúc này thông số HTTP Referer không được
sinh ra đồng thời có thể kết luận là việc chặn liên kết từ trang
khác bằng HTTP Referer đối với Googlebot là không hiệu
quả.
Mặt khác, cho dù đặt giả thuyết là Googlebot sẽ có hành vì
giống như người là nó sẽ di chuyển từ trang này đến trang
khác thông qua URL thì cách trên vẫn không hiệu quả. Bởi vì
lúc này bot sẽ nhận được trạng thái Forbidden (không cho
phép truy cập). Và như vậy thì bot cũng sẽ dễ bị hiểu nhầm
rằng trang này không cho phép truy cập, điều này có khi sẽ
mang lại tai hại cho bạn nếu như bot cập nhật thông tin
Forbidden này và con mang lại tác dụng ngược cho website
của bạn.
Tuy nhiên, vấn đề về cách phòng chống này xảy ra do
từ cuộc thi SEO Idol 2011 vừa rồi có những hành vi chơi xấu
từ các đối thủ. Nhưng theo quan điểm cá nhân và kết hợp
những hiểu biết của tôi thì Google không dễ dàng để những
đối thủ của mình chơi xấu một cách dễ dàng như vậy. Để
hiểu được điều này bạn cần phải hiểu rõ những tiêu chí và
thuật toán của Google trong việc xếp hạng các trang web.