我們在優(yōu)化網(wǎng)站的時候都會遇到頁面的相識度,頁面的相識度指的是網(wǎng)站頁面與頁面的相識度。搜索引擎在抓取頁面的時候,通常都會對頁面就行比較,如果一個頁面的相識度達到80%以上搜索引擎就會認為是垃圾內(nèi)容,就不會給予收錄,在70%到80%之間的搜索引擎會收錄,但是給予的權(quán)重不高;搜索引擎在判斷價相識度高度的同時會采用兩種算法,一種叫做MD5的算法,( MD5的全英文就是 Message Digest Algorithm MD5(中文名為消息摘要算法第五版) ),如果摘要太過于相識就會認為是抄襲;另外一種就是關(guān)鍵詞的出現(xiàn)程度,搜索引擎在判斷頁面內(nèi)容是否是高價值的時候會吧你網(wǎng)站上面所出現(xiàn)的文字進行組合,組合成可以匹配的關(guān)鍵詞,在用這些關(guān)鍵詞去搜索引擎的數(shù)據(jù)庫里面進行匹配,如果大部分的關(guān)鍵詞都在同一另個網(wǎng)站頁面上的時候,就證明你的這個頁面是垃圾頁面。
1、布局
網(wǎng)站頁面的布局都是導(dǎo)航、頁面的邊欄、底部跟主要區(qū)域,不同的就是樣式、代碼跟內(nèi)容,所以我們最主要的就是解決這三個個問題,不懂代碼的只要解決內(nèi)容就可以了。
2、模板
頁面的相識度也可以不是在同一個網(wǎng)站上面的頁面。很多人建網(wǎng)站都是用一些開源的程序,然后在尋找一個適合自己行業(yè)的模板,但是這些模板都是有很多人在用了的,我們在去用就會產(chǎn)生跟其網(wǎng)站上面的相識度,仿別人網(wǎng)站上面的模板來用,即使你使用不同的開源程序或者不用語言編寫出來的程序都會產(chǎn)生頁面的相識度過高。
3、內(nèi)容
網(wǎng)站上面的樣板文字是大多數(shù)企業(yè)網(wǎng)站都會有的,這些樣板文字的產(chǎn)生大多數(shù)都是站長在做網(wǎng)站的時候都喜歡在在網(wǎng)站的邊欄上面放上一些全站使用的文章或者文字,比如說公司簡介、聯(lián)系我們…等一些無關(guān)緊要的,對于這些無關(guān)緊要的我們可以把它做成一張圖片,添加上去就可以了。
4、采集
采集的文章無論是從MD5算法,還是關(guān)鍵詞匹配,都是在同一個網(wǎng)站上面,想要相識度不高,怎么會可能呢?
至于跟別人網(wǎng)站上面的相識度我們只要內(nèi)容,跟他們不一樣就可以了。
有問題不可怕,知道了問題的產(chǎn)生我們改正就可以了,避免下次反同樣的錯誤,建議大家盡量努力寫原創(chuàng)的文章,原創(chuàng)的文章不僅僅搜索引擎喜歡,而且還能夠降低網(wǎng)站頁面與外部頁面的相識度。