首先,我們需要了解搜索捕獲系統(tǒng)的工作原理。根據工作原理,今天的編輯簡要介紹了如何建立一個符合搜索引擎捕獲系統(tǒng)習慣的網站。
蜘蛛抓取相當于遍歷網絡的有向圖,所以一個結構簡單清晰的網站一定是它的核心,并盡量保證蜘蛛的可讀性。
(1)樹形結構為“首頁頻道詳情頁”;
(2)小化了從平面主頁到細節(jié)頁的層次,便于抓取,并能很好地傳遞權重。
(3)mesh保證每個頁面至少有一個文本鏈接點,使網站盡可能全面地被捕獲,內鏈的構建也能對排序起到積極的作用。
(4)導航為每個頁面添加一個導航,方便用戶了解路徑。
(5)相信很多站長對子域和目錄的選擇有疑問。我們認為,當內容較少,相關性強時,建議以目錄的形式實現,有利于權重的繼承和收斂;當內部容量較大,與主站相關性稍差時,建議以子域的形式實現。
(1)在一個很好的網站中,相同的內容頁只對應一個的URL。太多的url會分散頁面的權重,目標url有可能被系統(tǒng)過濾掉;
(2)動態(tài)參數盡量少,URL盡量短。
(3)美學可以讓用戶和機器通過URL判斷頁面內容的主旨;
我們推薦以下幾種形式的URL:URL應該盡可能簡短易讀,以便用戶能夠快速理解,例如使用拼音作為目錄名;相同的內容在系統(tǒng)中只生成與之對應的URL,刪除無意義的參數;如果無法保證URL的性,請嘗試使不同形式的url301到目標url;防止用戶錯誤地將域301輸入到主域。
(1)不要忽略那些不幸的機器人文件。默認情況下,系統(tǒng)中的一些機器人被禁用的搜索引擎捕獲。網站建立后,及時檢查并編寫相應的機器人文件,在網站日常維護過程中注意定期檢查;
(2)建立網站站點地圖文件和死鏈文件,并通過百度站長平臺及時提交;
(3)部分電子商務網站存在區(qū)域跳躍問題。建議制作一個統(tǒng)一的頁面來標記頁面中是否有貨物。如果此區(qū)域沒有商品,將返回無效頁面。由于蜘蛛的出口有限,正常頁面將不包括在內。
(4)合理利用網站管理員平臺提供的機器人、網站地圖、索引量、抓取壓力、死鏈提交、網站改版等工具。對于百度難的圖片優(yōu)化,怎么辦?