所謂的seo優(yōu)化就是讓你的網(wǎng)站被搜索引擎收錄,并能排名在一個(gè)好位置。要被搜索引擎收錄,你必須首先贏得搜索引擎蜘蛛的愛。只有當(dāng)蜘蛛在你的網(wǎng)站上爬行時(shí),它才能被包括在內(nèi)。讓我們來了解一下搜索引擎蜘蛛是什么,以及搜索引擎優(yōu)化應(yīng)該做什么:
搜索引擎蜘蛛通常指的是:網(wǎng)絡(luò)爬蟲
網(wǎng)絡(luò)爬蟲(也稱為網(wǎng)絡(luò)蜘蛛,網(wǎng)絡(luò)機(jī)器人,在FOAF社區(qū)更常被稱為網(wǎng)絡(luò)追蹤器),是一個(gè)軟件程序,可以自動(dòng)處理一系列網(wǎng)絡(luò)事務(wù),無需人工干預(yù)。它是根據(jù)特定規(guī)則自動(dòng)捕獲萬維網(wǎng)信息的程序或腳本。其他不常用的名稱包括螞蟻、自動(dòng)索引、模擬器或蠕蟲
搜索引擎爬蟲如何工作
網(wǎng)絡(luò)&;lt;--&;gt;Crawler&;lt;--&;gt;&;網(wǎng)絡(luò)內(nèi)容庫;lt;--&;gt;索引器&;lt;--&;gt;索引庫&;lt;--&;gt;搜索引擎&;lt;--&;gt;用戶
爬行動(dòng)物分類:
通用網(wǎng)絡(luò)爬蟲
又稱全網(wǎng)爬蟲,爬蟲對(duì)象從一些種子URL擴(kuò)展到整個(gè)web,主要為門戶網(wǎng)站、搜索引擎和大型web服務(wù)提供商收集數(shù)據(jù)。由于商業(yè)原因,它們的技術(shù)細(xì)節(jié)很少公布。該結(jié)構(gòu)大致可分為幾個(gè)部分:頁面爬行模塊、頁面分析模塊、鏈接過濾模塊、頁面數(shù)據(jù)庫、URL隊(duì)列和初始URL收集
關(guān)注網(wǎng)絡(luò)爬蟲
也稱為主題爬蟲,它指的是有選擇地抓取與預(yù)定義主題相關(guān)的頁面的網(wǎng)絡(luò)爬蟲[8]。與普通網(wǎng)絡(luò)爬蟲相比,焦點(diǎn)爬蟲只需抓取與主題相關(guān)的頁面,大大節(jié)省了硬件和網(wǎng)絡(luò)資源。由于數(shù)量較少,保存的頁面也會(huì)快速更新。它還可以很好地滿足某些特定人群對(duì)特定領(lǐng)域信息的需求
增量網(wǎng)絡(luò)爬蟲
它指的是以增量方式更新下載的網(wǎng)頁的爬蟲程序,只對(duì)新生成或更改的網(wǎng)頁進(jìn)行爬蟲。它可以確保爬行頁面在一定程度上盡可能新。增量爬蟲僅在需要時(shí)對(duì)新生成或更新的頁面進(jìn)行爬網(wǎng),不會(huì)再次下載未更改的頁面。它可以有效地減少數(shù)據(jù)下載量,但增加了爬行算法的復(fù)雜度和實(shí)現(xiàn)難度
DeepWebcrawler
根據(jù)存在方式,它可以分為表層網(wǎng)頁和深層網(wǎng)頁。表面網(wǎng)頁是指傳統(tǒng)搜索引擎可以索引的網(wǎng)頁,網(wǎng)頁主要由靜態(tài)網(wǎng)頁組成,這些網(wǎng)頁可以通過超鏈接訪問。DeepWeb是一個(gè)無法通過靜態(tài)鏈接獲得的網(wǎng)頁,隱藏在搜索表單后面,只能通過用戶提交一些關(guān)鍵字
獲得。蜘蛛陷阱
它是阻止蜘蛛程序在網(wǎng)站上爬行的障礙。它通常是顯示網(wǎng)頁的技術(shù)方法。目前,許多瀏覽器在設(shè)計(jì)時(shí)都考慮了這些因素,因此web界面可能看起來很正常,但這些蜘蛛陷阱會(huì)給蜘蛛程序帶來障礙。如果這些蜘蛛陷阱被消除,蜘蛛程序能包含更多的網(wǎng)頁嗎?在搜索引擎優(yōu)化工作中,網(wǎng)頁的收集是基礎(chǔ)工作,但對(duì)于搜索引擎來說,在極少數(shù)情況下,它們將100%包含您網(wǎng)站的所有網(wǎng)頁。無論爬蟲程序設(shè)計(jì)多么精致,都很難克服@thespidertrap
了解蜘蛛后,根據(jù)蜘蛛的特點(diǎn),在SEO中應(yīng)該做些什么來取悅搜索引擎蜘蛛
突出重要內(nèi)容
合理的標(biāo)題、描述和關(guān)鍵詞
標(biāo)題:只強(qiáng)調(diào)重點(diǎn)。重要的關(guān)鍵詞不應(yīng)出現(xiàn)兩次以上,每頁的標(biāo)題應(yīng)不同。說明:此處高度概括網(wǎng)頁內(nèi)容,長度應(yīng)合理。不要把關(guān)鍵詞堆得太多。每一頁的描述應(yīng)該是不同的。關(guān)鍵詞:列出幾個(gè)重要的關(guān)鍵詞,不要堆積太多
2。在語義上編寫符合W3C標(biāo)準(zhǔn)的HTML代碼
對(duì)于搜索引擎來說,最直接的界面是網(wǎng)頁的HTML代碼。如果代碼是按語義編寫的,搜索引擎將很容易理解網(wǎng)頁
3的含義。使用布局將重要內(nèi)容HTML代碼放在頂部
搜索引擎從上到下抓取HTML內(nèi)容。使用此功能,可以先讀取主代碼,爬蟲可以先抓取它
不要使用js輸出重要內(nèi)容
爬蟲不會(huì)讀取js中的內(nèi)容,因此重要內(nèi)容必須放在HTML
5中。盡量減少使用iframe框架
搜索引擎不會(huì)捕獲iframe中的內(nèi)容,重要內(nèi)容不應(yīng)放在框架中。但是現(xiàn)在他們都使用div+CSS,而且這個(gè)框架很少使用
將alt屬性添加到圖片
alt屬性的功能是在圖片無法顯示時(shí)用文本替換圖片。對(duì)于搜索引擎優(yōu)化,它可以讓搜索引擎有機(jī)會(huì)索引你網(wǎng)站的圖片
7。您可以在需要強(qiáng)調(diào)的地方添加title屬性
在SEO優(yōu)化中,將alt屬性設(shè)置為圖片的原始含義是合適的,而ttitle屬性則為設(shè)置屬性的元素提供提示信息
為圖片添加長度和寬度
圖片有特定的大小,沒有縮放,將位于前面
保留文本效果
如果我們需要考慮用戶體驗(yàn)和SEO效果,其中必須使用圖片,例如個(gè)性化字體的標(biāo)題,我們可以使用樣式控制使文本不出現(xiàn)在瀏覽器中,但網(wǎng)頁代碼中有標(biāo)題
注:顯示:無可使用;因?yàn)?strong>搜索引擎會(huì)過濾掉顯示:無;蜘蛛不會(huì)搜索里面的內(nèi)容
0。提高網(wǎng)站速度
網(wǎng)站速度是搜索引擎排名的重要指標(biāo)。網(wǎng)頁的圖片和代碼應(yīng)盡可能簡化,網(wǎng)頁應(yīng)靜態(tài)輸出。對(duì)于外部網(wǎng)站的鏈接,應(yīng)使用rel="e;“不跟隨”;屬性告訴爬蟲程序不要爬網(wǎng)其他頁面。