網站的SEO優化過程中不免會分析網站日志,網站日志的分析和診斷就像給網站看病一樣,我們通過網站日志的分析,可以更加清楚的知道網站的健康狀況,很多時候網站沒有被收錄,我們也可以通過對網站日志的分析,來判斷是否被搜索引擎過來的抓取過,然后再根據情況做出適當的seo策略調整等等。
我們知道通過網站日志可以清楚的得知用戶在什么IP、什么時間、用什么操作系統、什么瀏覽器、什么分辨率顯示器的情況下訪問了你網站的哪個頁面,是否訪問成功。對于SEOer來說,網站日志可以記錄各搜索引擎蜘蛛機器人爬行網站的詳細情況,例如:哪個IP的百度蜘蛛機器人在哪天訪問了網站多少次,訪問了哪些頁面,以及訪問頁面時返回的HTTP狀態碼。
由此可以看出通過分析這些數據更有利于開展網站SEO優化。那么在SEO優化中應該如何進行網站日志分析?
一、網站日志的作用
1)通過網站日志可以了解蜘蛛對網站的基本爬取情況,可以知道蜘蛛的爬取軌跡和爬取量;
2)網站的更新頻率也和網站日志中蜘蛛抓取的頻率有關,一般來說更新頻率越高,蜘蛛的抓取頻率越高,而我們網站的更新不僅僅只是新內容的添加,同時還有我們的微調操作;
3)我們可以根據網站日志的反應情況,對我們的空間的某些事情和問題提前進行預警,因為服務器如果出問題的話在網站日志中會第一時間反映出來,要知道服務器的穩定速度和打開速度兩者都會直接影響我們的網站;
4)通過網站日志我們可以知道網站的那些頁面是很受蜘蛛歡迎的,而哪些頁面是蜘蛛連碰都不去碰的,同時我們還能發現有一些蜘蛛由于是過度爬取對我們的服務器資源損耗是很大的,我們要進行屏蔽工作。
二、如何下載網站日志
1)首先我們的空間要支持網站日志下載,一般都保存在你空間wwwlogs目錄下面,這一點是很重要的,在購買空間時候需事先了解下是否支持日志下載,因為有的服務商是不提供這項服務的,如果支持的話空間后臺一般都有日志WebLog日志下載這個功能把它下載到根目錄在用FTP傳到本地就可以,服務器的話可以設置將日志文件下載到指定路徑;
2)這里有個很重要的問題,網站日志強烈建議設置成每小時生成一次,小型的企業站和頁面內容較少的網站可以設置成一天,它默認是一天,如果內容多或者大型站設置成一天生成一次,那么一天只生成一個文件,這個文件會相當的大,我們有時電腦打開是會造成死機,設置的話找空間商協調設置即可。
三、網站日志數據分析
1)網站日志中數據量過大,所以我們一般需要借助網站日志分析工具來查看,例如光年日志分析、站長日志分析等等。下面我們來看看常規的日志格式:
分析如下:
220.181.108.144 訪問ip;
09/Jul/2018:01:25:06 +0800 訪問日期 -時區;
GET /seo/jzzx/jzzx561.htmlHTTP/1.1根據HTTP/1.1協議抓取(域名下)/index.php這個頁面(GET表示服務器動作);
200服務器響應狀態碼;
服務器響應狀態碼通常狀態碼有以下幾種:200,301,302,304,404,500等。200代表用戶成功的獲取到了所請求的文件,如果是搜索引擎,則證明蜘蛛在這次爬行中順利的發現了一些新的內容。而301則代表用戶所訪問的某個頁面url已經做了301重定向(永久性)處理,302則是暫時性重定向。404則代表所訪問的頁面已經不存在了,或者說訪問的url根本就是個錯誤的。500則是服務器的錯誤。
5653表示抓取了5653個字節;
Mozilla/5.0 (compatible; Baiduspider/2.0;+ 表示是百度搜索引擎的蜘蛛來訪問的信息,也就是說是百度過來抓取網站。
2)如果你的日志里格式不是如此,則代表日志格式設置不同;
3)很多日志里可以看到 200 0 0和200 0 64則都代表正常抓取;