發(fā)表日期:2021-01-12 18:45:54作者來(lái)源:瀏覽次數(shù):
做seo很大程度是做關(guān)鍵詞排名。把關(guān)鍵詞做到首頁(yè)是做seo的基本目標(biāo),有首頁(yè)排名才有更好的展現(xiàn)機(jī)會(huì),才可能有更好的轉(zhuǎn)化率。
一、搜索原理
網(wǎng)絡(luò)蜘蛛即WebSpider,如果把互聯(lián)網(wǎng)比喻成一個(gè)蜘蛛網(wǎng),那么Spider就是在網(wǎng)上爬來(lái)爬去的蜘蛛。網(wǎng)絡(luò)蜘蛛是通過(guò)網(wǎng)頁(yè)的鏈接地址來(lái)尋找網(wǎng)頁(yè),從網(wǎng)站某一個(gè)頁(yè)面(通常是首頁(yè))開(kāi)始,讀取網(wǎng)頁(yè)的內(nèi)容,找到在網(wǎng)頁(yè)中的其它鏈接地址,然后通過(guò)這些鏈接地址尋找下一個(gè)網(wǎng)頁(yè),這樣一直循環(huán)下去,直到把這個(gè)網(wǎng)站所有網(wǎng)頁(yè)都抓取完為止。如果把整個(gè)互聯(lián)網(wǎng)當(dāng)成一個(gè)網(wǎng)站,那么網(wǎng)絡(luò)蜘蛛就可以用這個(gè)原理把互聯(lián)網(wǎng)上所有的網(wǎng)頁(yè)都抓取下來(lái)。
1、抓取
搜索引擎會(huì)和普通訪問(wèn)者一樣,順著網(wǎng)頁(yè)上的鏈接一個(gè)個(gè)下載我們的網(wǎng)頁(yè),為下一步的預(yù)處理做準(zhǔn)備。
2、預(yù)處理
①.判斷是否符合其收錄規(guī)則,符合收錄規(guī)則的再繼續(xù)處理
②.對(duì)文章進(jìn)行分詞處理
把網(wǎng)頁(yè)中的文章切成一個(gè)個(gè)的詞語(yǔ)。度量文檔之間的相關(guān)性,以及為建立倒排索引做準(zhǔn)備。并記錄詞出現(xiàn)的位置。
③.建立倒排索引
在搜索引擎中每個(gè)文件都對(duì)應(yīng)一個(gè)文件ID,文件內(nèi)容被表示為一系列關(guān)鍵詞的集合
把文件ID對(duì)應(yīng)到關(guān)鍵詞的映射轉(zhuǎn)換為關(guān)鍵詞到文件ID的映射。
用詞來(lái)索引網(wǎng)頁(yè),好處在于:搜索引擎的用戶輸入的也是詞,這樣可以方便地查找到相關(guān)的網(wǎng)頁(yè)。
3、檢索
①.對(duì)用戶查詢的關(guān)鍵詞進(jìn)行分詞,取索引的交集
②.排序
重要性——網(wǎng)頁(yè)靜態(tài)質(zhì)量得分。搜索引擎把網(wǎng)站的各種表現(xiàn)情況轉(zhuǎn)換成一個(gè)個(gè)分值,這些分值加起來(lái),就得到一個(gè)頁(yè)面的質(zhì)量得分,即所謂的權(quán)重。
a、頁(yè)面信噪比:
頁(yè)面信噪比是指頁(yè)面內(nèi)正文與非正文的比例,頁(yè)面信噪比至少要大于1。
b、稀缺性
c、鏈接控制:
鏈接控制分鏈接數(shù)量和鏈接自然性。一個(gè)頁(yè)面權(quán)重是固定的,鏈接可以傳遞權(quán)重,鏈接越多,每一個(gè)鏈接傳遞的權(quán)重越低。
d、頁(yè)面的瀏覽量
相關(guān)性——上面通過(guò)倒排索引只能定性地知道網(wǎng)頁(yè)和查詢?cè)~之間是否相關(guān),但誰(shuí)更相關(guān)即定量是沒(méi)辦法知道的。百度處理方式:
a、記錄詞出現(xiàn)的位置,不同位置的關(guān)鍵詞權(quán)重不同。
b、tf-idf算法,即一個(gè)詞在一篇文章中出現(xiàn)的次數(shù)多,這個(gè)詞的權(quán)重越高;一個(gè)詞在整個(gè)互聯(lián)網(wǎng)中出現(xiàn)的次數(shù)越多,(如“我”、“的”這種詞,對(duì)于一篇文章主題的鑒別能力不強(qiáng),每篇文章幾乎都出現(xiàn))這個(gè)詞的權(quán)重越小。
4、常用的高級(jí)搜索指令:
site:SEO熟悉的高級(jí)搜索指令,用來(lái)搜索某個(gè)域名下的所有文件。
inurl:指令用于搜索查詢?cè)~出現(xiàn)在url中的頁(yè)面。
intitle:指令返回的是頁(yè)面title中包含關(guān)鍵詞的頁(yè)面。
domain:其作用就是來(lái)查詢域名下的反鏈(反鏈=外鏈+內(nèi)鏈)。
二、索引排名
1、收錄與索引
收錄:頁(yè)面被Baiduspider發(fā)現(xiàn)、分析過(guò)
索引:Baiduspider經(jīng)初步分析后認(rèn)為有意義,做建庫(kù)處理
收錄索引的關(guān)系是包含關(guān)系,先收錄才可以建索引,收錄量大于索引量。
百度表示第三方提供的所謂收錄查詢都是不靠譜的。
1-1、索引文章決定因素:
信任度;
文章質(zhì)量;
更新頻率;
網(wǎng)站結(jié)構(gòu);
熊掌號(hào)、站點(diǎn)地圖對(duì)百度收錄有促進(jìn)效果;
網(wǎng)站的年齡以及權(quán)重影響著百度對(duì)網(wǎng)站的收錄效果。
1-2、加快頁(yè)面索引方法:
做好網(wǎng)站TDK,并不要修改;
積累高質(zhì)量網(wǎng)站內(nèi)容;
每日定時(shí)定量的更新;
提交百度等搜索引擎,包括sitemap、熊掌號(hào)等;
重點(diǎn)做好熊掌號(hào),目前熊掌號(hào)提交已能實(shí)現(xiàn)移動(dòng)站收錄80%以上;
有針對(duì)性并有規(guī)律的發(fā)布高質(zhì)量外鏈。
2、文章質(zhì)量判斷(百度官方)
①.受眾
受眾群體的大小,即代表了用戶檢索需求的大小。
②.稀缺
稀缺主要是描述頁(yè)面在互聯(lián)網(wǎng)中的獨(dú)到性。
③.質(zhì)量
a不能是死鏈、網(wǎng)站訪問(wèn)速度是否令人滿意。
b主體內(nèi)容是否完整、版式和字體是否易讀、各類廣告會(huì)不會(huì)太多。
c信息是否豐富、延伸出的次級(jí)需求是否滿足。
④.時(shí)效
3、原創(chuàng)識(shí)別判斷
①.發(fā)布時(shí)間——蜘蛛抓取的日期
②.錨文本鏈接——網(wǎng)站頁(yè)面外鏈的多少
③.信息指紋——文章內(nèi)容雷同相似的程度
4、標(biāo)題優(yōu)化方法
從搜索引擎搜索到的內(nèi)容的標(biāo)題往往是網(wǎng)頁(yè)title的內(nèi)容,搜索引擎給與標(biāo)題的權(quán)重很高。
①.標(biāo)題通順、吸引人、符合文章實(shí)際。
②.標(biāo)題一定要原創(chuàng),包含核心關(guān)鍵詞和長(zhǎng)尾詞,與內(nèi)容關(guān)鍵詞保持一致
③.寫作要符合搜索引擎習(xí)慣,少用標(biāo)點(diǎn)
④.長(zhǎng)度要合適,控制在二十二個(gè)漢字以內(nèi)
5、內(nèi)容優(yōu)化方法
主要分為兩部分:一部分是原創(chuàng)/偽原創(chuàng),另一部分是采集素材庫(kù)審核。
至少首段需要純?cè)瓌?chuàng),且是有搜索可能的內(nèi)容,整段以玩家搜索需求來(lái)寫。
正文分小標(biāo)題有條理的展開(kāi)
以內(nèi)容價(jià)值為主偽原創(chuàng)方法
尋找有價(jià)值的文章,是當(dāng)天發(fā)布的,也可利用爬蟲(chóng)抓取的數(shù)據(jù)庫(kù)改寫
有價(jià)值的文章具有很好的可讀性、目標(biāo)明確、能夠吸引人的眼球。
①、修改文章的首尾部分:
首尾段重新概括,把正文里面的順序打亂,把一些不相關(guān)的去掉。加入觀點(diǎn)。
②、拆分重組原文:找?guī)灼嚓P(guān)性比較強(qiáng)的文章組合成一篇新的文章
③、相關(guān)內(nèi)容的合并組合
④、翻譯其他語(yǔ)言的文章
⑤、利用論壇、博客、新媒體等挖掘文章
6、圖片優(yōu)化方法
搜索引擎對(duì)于大多數(shù)圖片的原創(chuàng)性的識(shí)別已經(jīng)具備一定能力
針對(duì)圖片的算法主要有計(jì)算哈希值、pHash算法和SIFT算法,及將目標(biāo)圖像進(jìn)行編碼,形成“指紋”存儲(chǔ)起來(lái)。
①.在圖片上加水印;
②.改變?cè)袌D片的長(zhǎng)寬尺寸比,或者直接截取某一部分圖片;
③.圖片長(zhǎng)寬比盡量接近121*75,也就是接近百度搜索展示的縮略圖尺寸;
④.縮略圖內(nèi)鏈,與文字鏈接相比較,更能吸引訪客去點(diǎn)擊,注意相關(guān)性。
⑤.加上alt描述,可以增強(qiáng)頁(yè)面關(guān)鍵詞主題,但注意千萬(wàn)不要堆砌關(guān)鍵詞。
⑥.百度對(duì)原創(chuàng)內(nèi)容越來(lái)越喜歡,實(shí)際上圖片也是頁(yè)面的一部分。
7、關(guān)鍵詞優(yōu)化方法
關(guān)鍵詞分類:核心關(guān)鍵詞;相關(guān)關(guān)鍵詞;長(zhǎng)尾關(guān)鍵詞;錯(cuò)誤關(guān)鍵詞;生僻關(guān)鍵詞
①、要站在用戶的角度考慮,多想想用戶在搜索時(shí)會(huì)使用什么詞
②、不超過(guò)5個(gè),一般3個(gè):主關(guān)鍵詞、副關(guān)鍵詞、一個(gè)潛力的長(zhǎng)尾關(guān)鍵詞
③、關(guān)鍵詞密度不超過(guò)2%—8%(根據(jù)需要,不)