做過SEO的朋友都知道,網(wǎng)站的一些頁面經(jīng)過很長一段時(shí)間都沒有被百度收錄。究竟為什么?接下來,讓我們排除一個(gè)原因,為什么這些網(wǎng)頁不收錄在網(wǎng)站上。
Robots協(xié)議:Robots協(xié)議將告訴spider不能對頁面進(jìn)行爬網(wǎng),因此不會對頁面進(jìn)行爬網(wǎng)和收錄。
網(wǎng)站地圖:網(wǎng)站地圖是指網(wǎng)站地圖。根據(jù)蜘蛛爬行的物理邏輯,蜘蛛通常先爬行網(wǎng)站地圖,因此制作好網(wǎng)站地圖也非常重要。
百度站長:如果網(wǎng)頁沒有收錄,把網(wǎng)頁提交給百度站長,這樣不收錄的網(wǎng)頁也可以收錄。
如果排除了上述三個(gè)小問題,那么無論網(wǎng)頁是否收錄在內(nèi),我們都需要考慮以下三個(gè)問題。
1、 頁面內(nèi)容質(zhì)量低
頁面內(nèi)容的質(zhì)量是搜索引擎蜘蛛判斷該頁面價(jià)值的一個(gè)重要因素
如何處理網(wǎng)站中未收錄的網(wǎng)頁
頁面內(nèi)容收錄:一是模板重復(fù);二是文章重復(fù)。收藏軟件的普及使得網(wǎng)站的建立變得太容易了。各種“抄襲”文章的工具,CMS的收藏和自助建站功能,讓很多站長一夜之間創(chuàng)造了上千個(gè)網(wǎng)頁。此外,征集規(guī)則的僵化、虛假的原創(chuàng)和網(wǎng)絡(luò)上的高層次重復(fù)內(nèi)容太多。
百度蜘蛛不累嗎?每個(gè)人都在挑選同樣的東西,也許你突然被百度收錄了幾十萬,但百度敦促你重新篩選。如果一切都是一樣的,百度對你一見鐘情。雖然很難原創(chuàng),但我不建議網(wǎng)站完全收集大量的東西。我們可以根據(jù)文章的中心思想,把自己的東西結(jié)合起來,發(fā)表一篇叫做原創(chuàng)的文章,對其進(jìn)行適當(dāng)?shù)氖占途庉嫛?/p>
2、 頁面優(yōu)化過度
百度對SEO網(wǎng)站的過度處罰越來越嚴(yán)重,會導(dǎo)致百度收錄少或不收錄。內(nèi)容是重要的。即使你有一個(gè)強(qiáng)大的外部鏈,暫時(shí)不更新原始內(nèi)容,百度也不會收錄你的文章。過度的優(yōu)化收錄大量的關(guān)鍵字堆積、垃圾外鏈、錯(cuò)誤的HTML編碼以及不合理的JS和flash。
3、 蜘蛛抓過它們嗎
一個(gè)正常的頁面只要蜘蛛抓取一次,這個(gè)頁面就可以收錄在內(nèi)。如果蜘蛛不爬上這一頁,它將不收錄在內(nèi)。如何查看蜘蛛是否已爬過此頁?我們可以分析我們的網(wǎng)站日志
這里還提醒一些新手朋友喜歡直接刪除不收錄的頁面,一定不要這么做。