搜索引擎收錄原理
??????? 如果把整個(gè)網(wǎng)站看作是一棵樹,首頁(yè)就是根,每個(gè)頁(yè)面就是葉子。廣度優(yōu)先是一種橫向的頁(yè)面抓取方式,先從樹的較淺層開始抓取頁(yè)面,直至抓取完同層次的所有頁(yè)面后才進(jìn)入下一層。因此,在對(duì)網(wǎng)站進(jìn)行優(yōu)化時(shí),我們應(yīng)該把網(wǎng)站中相對(duì)重要的信息展示在層次較淺的頁(yè)面上(例如,在首頁(yè)上推薦一些熱門產(chǎn)品或者內(nèi)容)。反過(guò)來(lái),通過(guò)廣度優(yōu)先的抓取方式,搜索引擎就可以優(yōu)先抓取到網(wǎng)站中相對(duì)重要的頁(yè)面。(高端網(wǎng)站建設(shè))
??????? 首先,搜索引擎從網(wǎng)站首頁(yè)出發(fā),抓取首頁(yè)上所有鏈接指向的頁(yè)面,形成頁(yè)面集合A,并解析出集合A中所有頁(yè)面的鏈接;再跟蹤這些鏈接抓取下一層的頁(yè)面,形成頁(yè)面集合B;就這樣遞歸地從線層頁(yè)面中解析出鏈接,從而抓取深層頁(yè)面,直至滿足了某個(gè)設(shè)定的條件才停止抓取進(jìn)程。 ?????? >>深度優(yōu)先 ?????? 與廣度優(yōu)先的抓取方式相反,深度優(yōu)先首先跟蹤線層頁(yè)面中的某一鏈接逐步抓取深層頁(yè)面,直至抓取完最深層的頁(yè)面后才返回淺層頁(yè)面再跟蹤其另一鏈接,繼續(xù)向深層頁(yè)面抓取,這是一種頁(yè)面,這樣就能滿足更多用戶的需求。