如果網(wǎng)站使用虛擬空間,那么就會有一些流量限制,如果大部分流量都被蜘蛛占據(jù),那么我們就需要花一些額外的錢來購買流量。那么,如果一個網(wǎng)站上的大量流量被蜘蛛爬行所浪費,有什么技巧和方法可以在不影響搜索引擎優(yōu)化效果的情況下限制搜索引擎優(yōu)化效果呢?優(yōu)幫云seo顧問認(rèn)為我們可以采取以下方式:
1、找出假蜘蛛和護(hù)盾IP。通過對網(wǎng)站日志的分析,我們可以知道,很多所謂的百度蜘蛛或谷歌蜘蛛其實都是假的。我們可以分析這些假蜘蛛的IP來屏蔽它們,這樣不僅可以節(jié)省流量,還可以降低網(wǎng)站被收集的風(fēng)險。具體操作需要檢查ip是否是真正的蜘蛛,操作方法是:點擊左下角的start-run-cmd-enter命令即可看到結(jié)果。如果是真的,搜索蜘蛛有一個蜘蛛標(biāo)記,但假蜘蛛沒有標(biāo)記。
2、屏蔽無效蜘蛛或搜索蜘蛛對搜索引擎優(yōu)化的影響很小。比如我們知道google蜘蛛是一個非常大的抓取量,但是對于很多行業(yè)來說,google的流量很低,seo的效果不好,所以我們可以屏蔽google蜘蛛的抓取并節(jié)省很多流量,比如說網(wǎng)站屏蔽了抓取量。谷歌蜘蛛。除了谷歌,還有一些蜘蛛,如谷歌搜索、必應(yīng)蜘蛛等。這些流量很低,或者幾乎沒有蜘蛛能真正躲開。
3、使用robots.txt限制無效或重復(fù)頁面的爬網(wǎng)。有些頁面可能以前就存在,但現(xiàn)在不存在,或者存在動態(tài)和靜態(tài)URL。由于數(shù)據(jù)庫中存在反向鏈接或此類鏈接,蜘蛛仍會不時地抓取它們。我們可以找到返回404頁的url并將其屏蔽,從而改進(jìn)抓取,屏蔽也減少了對流量的浪費。
限制蜘蛛抓取頁面數(shù)量
4、限制頁面爬行的內(nèi)容,提高爬行的效率和速度,減少爬行的流量。對于任何頁面,都有許多無效的噪聲區(qū)域,例如網(wǎng)站登錄、注冊部分、底部版權(quán)信息、一些有用的鏈接導(dǎo)航等,或者一些模板上的蜘蛛無法識別的顯示模塊,我們可以使用這些模板添加nofollow標(biāo)簽。
5、外部鏈接或CDN加速,以改善蜘蛛抓取,減少服務(wù)器響應(yīng)和流量浪費。目前的網(wǎng)站大多使用大量的圖片、視頻等多媒體來顯示,但這些圖片缺乏更多的下載流量。如果我們對圖片使用外部調(diào)用,那么我們可以節(jié)省大量蜘蛛爬行流量。目前,更好的方法是把圖片放到其他服務(wù)器上或上傳到一些磁盤上。
6、使用站長工具限制或改進(jìn)蜘蛛抓取,或限制蜘蛛抓取的時間。目前,百度站長平臺和谷歌站長平臺都有站長抓取工具,可以用來限制蜘蛛抓取的時間和數(shù)量,我們可以根據(jù)需要合理部署,達(dá)到較好的效果。
當(dāng)然,在實踐中,我們也可以根據(jù)自己的實際需要來解決這個問題,比如對于一些抓取量過大的欄目,在站點地圖中設(shè)置一個較低的抓取頻率,如果一些重要的內(nèi)容沒有被很好地包含進(jìn)來,可以增加外部或內(nèi)部的鏈來提高抓取的效率等等。該方法已經(jīng)失效,可以根據(jù)具體情況進(jìn)行改進(jìn)。為了減少抓取和提高抓取效率,需要對更新期間的設(shè)置進(jìn)行合理化。