索引和指數(shù)之間有什么關系?為什么有時包含大于索引,有時索引大于包含?當時,由于時間關系,我對朋友圈的前半個問題作了簡短的回答。一般內(nèi)容如下:在蜘蛛捕獲網(wǎng)頁后,如果蜘蛛認為網(wǎng)頁中的信息有價值,則將其包括在內(nèi)。所包含的網(wǎng)絡蜘蛛將被分為不同的數(shù)據(jù)庫。不同數(shù)據(jù)庫中的網(wǎng)頁將按spider進行排名,因此當用戶搜索相關信息時,搜索結果頁面會顯示網(wǎng)頁在數(shù)據(jù)庫中的相關排名位置。
簡而言之,只有在包含索引的情況下才會有索引。今天,我在這里就問題的后半部分發(fā)表我個人的觀點,并對問題的前半部分進行補充和改進。所謂的包含實際上是指網(wǎng)站的包含,更直接的是,網(wǎng)站頁面是由蜘蛛發(fā)現(xiàn)的,分析后有意義,然后由搜索引擎包含。
索引是指包含在網(wǎng)頁中的搜索引擎進行數(shù)據(jù)庫處理,并等待網(wǎng)民索引,在索引過程中會有一個篩選過程,即有效索引和無效索引。上面的解釋大致是相同的過程:抓取-包含-過濾-索引(這也是百度站長平臺給出的過程)。也就是說,網(wǎng)頁首先被包含,然后搜索引擎過濾包含的網(wǎng)頁數(shù)據(jù)庫,以索引有價值的網(wǎng)頁并將其呈現(xiàn)給網(wǎng)民。由于索引和索引之間存在這樣的關系,理論上索引的數(shù)量應該大于索引的數(shù)量。
然而,很多SEO的朋友和個人網(wǎng)站管理員會發(fā)現(xiàn)索引大于索引,所以讓我們看看索引和索引之間的區(qū)別。理論上大于指數(shù)的包含量大于指數(shù)。在良好的網(wǎng)站包含情況下,指數(shù)略低或大致等于索引量是一種相對健康的狀態(tài)。如果成交量比指數(shù)成交量高得多,那么我們應該看看這種情況是一直存在還是近才出現(xiàn)。如果這種情況發(fā)生在不遠的將來,有必要分析是什么變化導致了網(wǎng)頁的索引量在不遠的將來有如此大的波動。如果一直是這樣的話,我們應該認真考慮網(wǎng)站的整體結構、質量、權重等是否存在較大的問題,在同一行業(yè)中處于較低的水平。
指數(shù)大于包含指數(shù)的事實有些矛盾。畢竟,只有在有包含的情況下才能有索引。那么,指數(shù)多只能等于包含量。它怎么能比包容更重要呢?原因可能是:網(wǎng)站中有一定數(shù)量的重復頁面。在這些頁面上啟用301跳轉后,由于過濾,我們查詢的數(shù)據(jù)量小于索引的數(shù)據(jù)量;索引卷數(shù)據(jù)的查詢結果存在約6小時的時間延遲,采集的數(shù)據(jù)量是實時的,期間的鏈接可能是由于某些操作不當?shù)仍蛟斐傻摹R虼耍饕赡艽笥诎瑑?nèi)容。當然,對于索引和包含之間的關系還有另一個相反的觀點,有興趣的朋友可以去了解它。