SEO搜索引擎的工作原理

2014-01-29    分類(lèi): 網(wǎng)站建設(shè)

所謂的搜索引擎是一個(gè)為用戶(hù)提供搜索服務(wù)的系統(tǒng)平臺(tái),因?yàn)樗阉饕嬗幸粋€(gè)特定的爬蟲(chóng)(百度蜘蛛)來(lái)使用這個(gè)爬蟲(chóng)在互聯(lián)網(wǎng)上收集信息。經(jīng)過(guò)處理和整理,這些網(wǎng)站文件將為它排名。對(duì)于網(wǎng)民在搜索引擎中搜索的關(guān)鍵詞,搜索引擎會(huì)根據(jù)排名顯示流量大、匹配度高的網(wǎng)站。我們熟悉哪些搜索引擎?例如:百度、谷歌、360、搜狐等,中國(guó)大陸最常用、最常用的搜索引擎是百度。

所以我們知道什么是搜索引擎,那么什么是SEO?SEO可以理解為SEO,所以沒(méi)有太多的廢話(huà),讓我們直接談?wù)勥@個(gè)搜索引擎的工作原理吧!

搜索引擎工作原理:搜索引擎的工作過(guò)程可以分為五個(gè)步驟。

第一步:抓取

搜索引擎有一種自動(dòng)爬行網(wǎng)站頁(yè)面程序(spider),沿著網(wǎng)站的鏈接爬行找到相應(yīng)的頁(yè)面。我們的網(wǎng)站不能有死鏈接。一定要讓蜘蛛在網(wǎng)站內(nèi)暢通無(wú)阻地抓取頁(yè)面。

那么蜘蛛的抓取策略是什么呢?蜘蛛抓取策略可分為兩種優(yōu)化策略:

一、深度優(yōu)先是搜索引擎蜘蛛在一個(gè)頁(yè)面上找到一個(gè)鏈接并向下爬行,然后在下一個(gè)頁(yè)面上找到另一個(gè)鏈接,再次爬行并捕獲所有鏈接。

二、寬度優(yōu)先是搜索引擎蜘蛛先抓取整個(gè)頁(yè)面的所有鏈接一次,然后抓取下一頁(yè)的所有鏈接。蜘蛛也不喜歡層次太多的網(wǎng)站。所以我們不能有太多級(jí)別的網(wǎng)站。這將導(dǎo)致網(wǎng)站收集的困難。因?yàn)樗璧K了搜索引擎蜘蛛寬度優(yōu)先的策略。

那么,我們?nèi)绾尾拍芪┲肱牢覀兊木W(wǎng)頁(yè),收集我們的文章網(wǎng)站?

一、具有高權(quán)重、高質(zhì)量和老資格的網(wǎng)站和頁(yè)面通常被認(rèn)為是好的。蜘蛛會(huì)優(yōu)先抓取,而且抓取的深度會(huì)更高,所以這種網(wǎng)站比較好收錄。

二、快速更新頁(yè)面。網(wǎng)頁(yè)更新快的網(wǎng)站,蜘蛛也能經(jīng)常訪問(wèn)。新的鏈接出現(xiàn)在頁(yè)面上,蜘蛛會(huì)快速跟蹤并抓取它們。

三、導(dǎo)入鏈接。高質(zhì)量的導(dǎo)入鏈接將使頁(yè)面上的導(dǎo)出鏈接爬網(wǎng)。報(bào)名人數(shù)也會(huì)增加。

四、單擊主頁(yè)越近,頁(yè)面權(quán)重越高,被蜘蛛抓取的機(jī)會(huì)就越大。

第二步:儲(chǔ)存

抓取與鏈接對(duì)應(yīng)的頁(yè)面會(huì)將這些頁(yè)面的內(nèi)容存儲(chǔ)在搜索引擎的原始數(shù)據(jù)庫(kù)中。抓取是關(guān)于文本內(nèi)容的。因此,在優(yōu)化過(guò)程中,建議不要盲目地在網(wǎng)站中添加過(guò)多圖片或flash文件,這不利于搜索引擎蜘蛛的捕獲。捕獲原始數(shù)據(jù)庫(kù)的內(nèi)容并不意味著搜索引擎將采用它,而是需要進(jìn)一步處理。

第三步:預(yù)處理(也稱(chēng)為過(guò)濾)

一、提取文本:搜索引擎主要基于文本內(nèi)容。HTML和JS程序不能參與排名。

二、分詞:蜘蛛會(huì)在第一步將漢字分割重組,形成新詞。

三、反重新處理:刪除一些重復(fù)的內(nèi)容和已存在的搜索引擎數(shù)據(jù)。

四、停止詞:搜索引擎在索引前刪除這些詞。減少不必要的計(jì)算。

標(biāo)題名稱(chēng):SEO搜索引擎的工作原理
標(biāo)題來(lái)源:http://www.bm7419.com/news/5801.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供面包屑導(dǎo)航、小程序開(kāi)發(fā)虛擬主機(jī)、定制開(kāi)發(fā)全網(wǎng)營(yíng)銷(xiāo)推廣、軟件開(kāi)發(fā)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)