av狼友永久免费网址观看,亚洲另类激情综合偷自拍图,亚洲中文字幕无码永久在线不卡,潮喷中文字幕在线精品无码

堅持為客戶提供有價值的服務和內(nèi)容

快速解鎖搜索引擎的幾大知識點

商企云 | 2018-09-10 | 分享至:

提起Search Engine Optimization(seo),想必大家一定熟悉又陌生。SEO是最先被我們所熟悉的數(shù)字營銷概念之一。那為何又用 “陌生” 來形容它呢?

是因為從業(yè)以來,大多數(shù)人僅對SEO的部分概念和術語有所了解,而對搜索引擎如何工作,如何解讀日常所接觸到的SEO報告,如何發(fā)現(xiàn)問題,如何進行優(yōu)化存在諸多盲點,對于如何針對自身情況制定SEO策略,更是無從下手。

那么從今天起,商企云將通過一個系列文章,力爭為大家梳理SEO知識點,希望大家在讀完該系列文章后,能夠獲得些許啟發(fā),更好地為所任職崗位服務。

作為第一篇,我們先來了解一些基礎內(nèi)容,大家是否曾思考過以下問題:

SEO是什么?我們?nèi)绾稳ザx它?

為什么要做SEO?

移動互聯(lián)時代,還需要做SEO嗎?

搜索引擎的工作原理是什么?在簡單的 “輸入-搜索” 這幾步簡單的操作后,搜索引擎是如何從海量的數(shù)據(jù)中,找尋到我們所需要的內(nèi)容,并展現(xiàn)給我們的?

帶著這些疑問,一起√get今天的知識吧!

知識點1:SEO是什么?我們?nèi)绾味x它?

SEO的全稱是 “Search Engine Optimization”,中文譯為 “搜索引擎優(yōu)化”。

簡單地理解,SEO是一個從自然搜索結(jié)果中獲取網(wǎng)站流量的手段和過程;

更加嚴謹?shù)厝ザx的話,SEO是一個 “在了解搜索引擎自然排名機制的基礎上,對網(wǎng)站進行內(nèi)部和外部的調(diào)整和優(yōu)化,改進網(wǎng)站在搜索引擎中的關鍵詞自然排名,以便爭奪流量,進而促成網(wǎng)站銷售或品牌曝光” 的一個過程。


快速解鎖搜索引擎的幾大知識點


知識點2:為什么要做SEO?

網(wǎng)站所有者都希望自己的網(wǎng)站流量越大越好,無論網(wǎng)站盈利模式和目標是什么,有人訪問是前提。SEO則是給網(wǎng)站帶來訪問者的最好方法。讓我們一起來了解一下SEO的 “優(yōu)勢”:

低成本:雖可能會產(chǎn)生費用,但成本相對較低

高回報:來自SEO的用戶多數(shù)情況下是在 “主動地找尋” 酒店,目標非常精準

可遷移:搜索引擎是用戶搜索、比較、購買商品的重要渠道,即便移動互聯(lián)網(wǎng)發(fā)展迅猛,SEO核心仍在,只不過載體有所變化

夠持久:精準廣告投放、付費搜索等類型推廣模式,一旦停止投放,流量將急劇下降;線上活動等事件營銷效果明顯,但話題過后流量隨即下降。而搜索排名一旦上去,可相對穩(wěn)定地維持比較久的時間,流量也因此會源源不斷地輸送過來

可擴展:掌握關鍵詞研究和內(nèi)容擴展方法后,我們可以持續(xù)地,為網(wǎng)站增加目標關鍵詞及流量

知識點3:移動互聯(lián)時代,還需要做SEO嗎?

讓我們來看一些行業(yè)調(diào)查數(shù)據(jù),了解一下SEO是否還有效?

2017 年上半年,即時通信、搜索引擎、網(wǎng)絡新聞作為基礎的互聯(lián)網(wǎng)應用,用戶規(guī)模趨于穩(wěn)定,搜索引擎應用繼續(xù)保持移動化趨勢。

雖然即時通信作為移動互聯(lián)網(wǎng)流量核心入口的地位已經(jīng)確立。在新網(wǎng)民各類應用中的滲透率排名第一,高于排名第二的搜索引擎16. 9 個百分點,但搜索引擎在目前仍舊穩(wěn)居第二位。

截至 2017 年6 月,我國搜索引擎用戶規(guī)模達 6.09 億,使用率為81.1%,用戶規(guī)模較 2016 年底增加707 萬,增長率為 1.2%

知識點4:搜索引擎的工作原理?

面對數(shù)以萬億的信息,搜索引擎如何做到在 1 秒鐘甚至更短的時間內(nèi),返回我們想要的內(nèi)容?回答這個問題,需要對搜索引擎工作原理做個分解,大致分為 3 個階段:

爬行和抓?。核阉饕娉绦蛲ㄟ^訪問網(wǎng)頁,獲得頁面HTML代碼存入數(shù)據(jù)庫

預處理:程序?qū)?shù)據(jù)庫網(wǎng)頁進行一系列處理,為排名程序調(diào)用做準備

排名:用戶輸入關鍵詞后,程序調(diào)用預處理好的數(shù)據(jù),計算相關性,生成結(jié)果

首先看第一階段,即 “爬行和抓取”

對于搜索引擎來說,首要任務是完成對互聯(lián)網(wǎng)內(nèi)網(wǎng)頁數(shù)據(jù)收集。而用于數(shù)據(jù)收集的工具,就是我們常常聽到的 “蜘蛛”,它是搜索引擎用來爬行和訪問頁面的程序。蜘蛛發(fā)出頁面訪問請求后,服務器返回HTML代碼,蜘蛛把收到的代碼存入數(shù)據(jù)庫中。蜘蛛會對鏈接進行跟蹤,根據(jù)一個頁面上的鏈接,爬行(讀取)至下一個,這也是為什么被人稱之為 “蜘蛛”。



快速解鎖搜索引擎的幾大知識點





在數(shù)據(jù)收集過程中,聰明的蜘蛛為了提升效率,避免重復讀取網(wǎng)頁數(shù)據(jù),搜索引擎會建立地址庫,記錄 “被讀取的”,和 “發(fā)現(xiàn)但未被讀取的” 頁面。構(gòu)建原始頁面數(shù)據(jù)庫,以儲存讀取后的頁面數(shù)據(jù)。

讀取結(jié)束,構(gòu)建好原始數(shù)據(jù)庫后,搜索引擎將進行第二階段的任務 - “預處理”。什么是 “預處理” 呢?原始數(shù)據(jù)庫中存在數(shù)以萬億的網(wǎng)頁數(shù)據(jù),排名程序無法做到每時每刻,對數(shù)量如此龐大的數(shù)據(jù)進行分析,也就無法在1- 2 秒內(nèi)返回搜索結(jié)果。因此必須處理這些數(shù)據(jù),為最后排名程序調(diào)用做準備。

預處理的第一步是對數(shù)據(jù)進行篩選,去除無用的信息,提取文字。現(xiàn)在搜索引擎仍以文字內(nèi)容為基礎,數(shù)據(jù)庫中的頁面數(shù)據(jù),除了我們在網(wǎng)頁上看到的文字外,還包含HTML標簽、JavaScript程序等無法用于排名的內(nèi)容。程序需要去除這些無用信息,提取出可用于排名的內(nèi)容。除文字外,程序也會提取出一些特殊的包含文字信息的代碼,例如Meta標簽中的文字、圖片替代文字、Flash文件的替代文字、鏈接錨文字等。

隨后,我們需要介紹一個小知識,即中文搜索引擎所獨有的步驟 - “中文分詞”?!霸~” 是程序處理數(shù)據(jù)、用戶查詢的單位和基礎。與英文不同,搜索引擎必須區(qū)分用戶搜索的中文內(nèi)容里,哪幾個字組成一個單詞,才能進行下一步工作。

在分詞過后,程序需要進行另一個步驟,即剔除 “停止詞”。在任何語言里,都存在出現(xiàn)頻率高,但對內(nèi)容影響不大的詞匯,例如中文 “的”、“啊”、“卻”;英文中 “the” “a” “and” “to”“of”等。這些被稱作 “停止詞”,程序會去除這些停止詞,使搜索內(nèi)容更突出,減少程序計算上內(nèi)耗。

此外程序會對版權聲明文字、導航欄文字等對搜索無用的內(nèi)容進行剔除,消除噪聲。

緊接著,程序還會對網(wǎng)頁數(shù)據(jù)進行去重,同一內(nèi)容可能會重復發(fā)布在多個網(wǎng)站,為了避免將多篇重復的內(nèi)容返回給擁護,所以需要在預先剔除重復內(nèi)容。

在完成上述后,程序得到的是 “獨特的,能反應頁面主題的,以詞匯為單位的” 內(nèi)容,緊隨其后,程序?qū)⒄蛩饕Mㄟ^提取關鍵詞,把內(nèi)容轉(zhuǎn)化成 “以關鍵詞為單位” 的集合,同時記錄關鍵詞出現(xiàn)頻次、格式(黑體、加粗錨文字)、位置(標題、頁面段首、段尾)等屬性。然后將其轉(zhuǎn)化為如下結(jié)構(gòu),儲存進數(shù)據(jù)庫:

經(jīng) “正向索引” 后的數(shù)據(jù),無法直接排名,因為同一關鍵詞可能出現(xiàn)在多個文件中,所以聰明的程序猿們,發(fā)明了 “倒排索引” ,將文件重新構(gòu)造為倒排索引:

現(xiàn)在,搜索引擎已經(jīng)做好了隨時處理用戶搜索請求的準備,那么隨之而來的,就是搜索引擎第三階段的任務,即排名。


快速解鎖搜索引擎的幾大知識點


每當搜索引擎接受到用戶搜索的內(nèi)容后,會進行這樣的處理:

分詞(與預處理一樣,將我們搜索的內(nèi)容,劃分為以“詞”為基礎組合)

剔除停止詞(與預處理一樣,剔除不相關詞匯)

指令處理(搜索引擎默認是在關鍵詞之間運用 “與”的邏輯)

拼寫矯正(對程序檢測判定為錯誤的內(nèi)容,進行矯正)

經(jīng)過以上處理并進行匹配后,程序會在倒排索引數(shù)據(jù)庫中找出符合搜索內(nèi)容關鍵詞的文件集合。例如,搜索內(nèi)容包括 “關鍵詞1” “關鍵詞2”,排名程序僅需要找到含有這 2 個關鍵詞的文件,即 “文件2” “文件3”。

由于數(shù)量龐大,因此搜索引擎程序不會對這些龐大的數(shù)據(jù)進行處理,只會針對最重要的部分頁面數(shù)據(jù)進行排名,此外用戶通常也只會查看前兩頁搜索結(jié)果,因此,搜索引擎也不需要大費周折地去對所有數(shù)據(jù)進行排名。那么,怎樣針對 “最重要的部分頁面數(shù)據(jù)” 去排名呢,這里就要依賴于自身算法 - 相關性計算的幫助,該算法會計算某個頁面數(shù)據(jù)與用戶搜索內(nèi)容的相關性,從而完成排名。

到這里,搜索引擎已基本完成用戶的 “搜索請求”,但根據(jù)2/ 8 定律,約20%的搜索內(nèi)容,占總搜索次數(shù)的80%左右。搜索引擎會把常見詞匯的排名以及數(shù)據(jù)進行緩存,在用戶搜索時會直接調(diào)用緩存數(shù)據(jù),從而減少一系列龐大又耗能的步驟,縮短反饋時間、提升用戶體驗。

掃二維碼與項目經(jīng)理溝通

7*24小時為您服務

解答:網(wǎng)站優(yōu)化,網(wǎng)站建設,APP開發(fā),小程序開發(fā),H5開發(fā),品牌推廣,新聞推廣,輿情監(jiān)測等

  非常感謝您有耐心的讀完這篇文章:"快速解鎖搜索引擎的幾大知識點",更多內(nèi)容請繼續(xù)瀏覽,我們將為您提供更多參考使用或?qū)W習交流的信息。我們還可為您提供:網(wǎng)站建設與開發(fā)、網(wǎng)站優(yōu)化、品牌推廣、APP開發(fā)、小程序開發(fā)、新聞推廣等服務,我們以“降低營銷成本,提高營銷效果”的服務理念,自創(chuàng)立至今,已成功服務過不同行業(yè)的1000多家企業(yè),獲得國家高新技術企業(yè)認證,且擁有14項國家軟件著作權,將力爭成為國內(nèi)企業(yè)心目中值得信賴的互聯(lián)網(wǎng)產(chǎn)品及服務提供商。如您需要合作,請掃碼咨詢,我們將誠摯為您服務。
我要咨詢
姓名 :
電話 :
文章分類
<蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>