關(guān)于搜索引擎工作原理,這些知識(shí)你知道嗎

2014-02-11    分類: 網(wǎng)站建設(shè)

大家都知道,我們平時(shí)習(xí)慣用百度進(jìn)行搜索,而百度正好能夠展現(xiàn)給用戶想要的,而這里就涉及一個(gè)百度搜索引擎的工作原理,其他搜索引擎比如360、搜狗也都一樣,機(jī)器有一套的程序算法,當(dāng)用戶搜索相關(guān)詞時(shí),能夠給與展現(xiàn)的機(jī)會(huì)。

搜索引擎工作原理流程主要分為四個(gè)階段:

第一,抓取階段:在互聯(lián)網(wǎng)中,搜索引擎蜘蛛來(lái)網(wǎng)站頁(yè)面進(jìn)行深度、廣度的信息抓取;我們知道的搜索蜘蛛名稱有baiduspider(百度蜘蛛)、360Spider(360蜘蛛)、Googlebot(谷歌蜘蛛)、SogouNews Spider(搜狗蜘蛛)、Yahoo! Slurp China或者Yahoo(雅虎蜘蛛)、YoudaoBot(有道蜘蛛)等等。

第二,過(guò)濾階段:

搜索引擎蜘蛛過(guò)濾掉低價(jià)值質(zhì)量的網(wǎng)站內(nèi)容信息,建立臨時(shí)數(shù)據(jù)庫(kù)。比如過(guò)濾掉沒(méi)有內(nèi)容,過(guò)濾掉頁(yè)面僅一個(gè)圖片的,或者過(guò)濾重復(fù)內(nèi)容的。網(wǎng)站收錄,就是這一個(gè)步驟實(shí)現(xiàn)的。

第三,索引階段:

搜索引擎對(duì)有質(zhì)量?jī)r(jià)值的信息進(jìn)行提取,將提取信息組織并放到所建立的索引庫(kù)中存儲(chǔ)。蜘蛛抓取之后,會(huì)將數(shù)據(jù)存放在一個(gè)臨時(shí)數(shù)據(jù)庫(kù),再?gòu)呐R時(shí)數(shù)據(jù)庫(kù)中調(diào)出更有價(jià)值的數(shù)據(jù)建立索引庫(kù)。

第四,展示排序階段:

當(dāng)用戶在搜索引擎上輸入一個(gè)關(guān)鍵詞時(shí),檢索系統(tǒng)處理搜索請(qǐng)求,將其搜索根據(jù)各種算法進(jìn)行計(jì)算排序,把用戶搜索的某個(gè)關(guān)鍵詞或用戶搜索相近的關(guān)鍵詞展現(xiàn)在首頁(yè)的位置(漂紅的內(nèi)容),這就是用戶在搜索引擎上輸入一個(gè)詞看到的內(nèi)容展示排序的結(jié)果。

頁(yè)面排序取決于頁(yè)面的權(quán)重,權(quán)重取決于三個(gè)方面: 相關(guān)性、 鏈接權(quán)重 、用戶行為

當(dāng)然,第一和第二階段也可稱為爬行和抓取過(guò)程,接下來(lái)是索引過(guò)程,最后就是用戶檢索過(guò)程,搜索詞經(jīng)過(guò)處理后進(jìn)行排序。搜索引擎發(fā)展到爬蟲抓取2.0時(shí)代時(shí),是由計(jì)算機(jī)算法決定的,計(jì)算機(jī)算法也不斷在更新升級(jí)以及人工智能化,才最終展現(xiàn)的越來(lái)越精準(zhǔn)。seo實(shí)際就是配合搜索引擎的工作原理而產(chǎn)生的,是為了更好的用戶體驗(yàn)而存在的。

分享標(biāo)題:關(guān)于搜索引擎工作原理,這些知識(shí)你知道嗎
標(biāo)題來(lái)源:http://www.bm7419.com/news30/24780.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站設(shè)計(jì)、關(guān)鍵詞優(yōu)化、定制網(wǎng)站、自適應(yīng)網(wǎng)站、微信公眾號(hào)、品牌網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁(yè)設(shè)計(jì)公司