SEO從業(yè)者必須了解搜索引擎的工作原理和步驟

2014-01-25    分類: 網(wǎng)站建設(shè)

搜索引擎是指使用特定的程序(如“百度蜘蛛”,或“機器人”),主要是收集互聯(lián)網(wǎng)上的信息。對于收集到的信息,它會進行處理和排序,留下它認為有價值的內(nèi)容信息。當用戶使用本搜索引擎平臺搜索相關(guān)信息時,本平臺直接將其收集的信息處理并顯示給用戶的系統(tǒng)。我們稱之為搜索引擎。

百度是大的中文搜索引擎,谷歌是大的英文搜索引擎。2010年,谷歌退出中國內(nèi)地市場。

搜索引擎的分類是什么?有四類:

通俗地說,可以搜索的關(guān)鍵詞有很多類別,比如“SEO優(yōu)化”的關(guān)鍵詞,可以搜索網(wǎng)頁、新聞、圖片、貼吧等類別。這是全文搜索引擎。例如:百度、谷歌、360

這種搜索引擎不具備自動抓取互聯(lián)網(wǎng)內(nèi)容的功能。它需要手動提交網(wǎng)站到搜索引擎,然后手動審查。審核通過后,用戶可以在上面搜索您的網(wǎng)站信息。

現(xiàn)在中國幾乎沒有這樣的搜索引擎,國外也有其他的搜索引擎。這個搜索引擎意味著沒有人自己的抓取程序來抓取互聯(lián)網(wǎng)上的信息并直接顯示其他搜索引擎的結(jié)果。例如,使用360搜索引擎搜索一個關(guān)鍵詞,顯示的搜索結(jié)果就是百度的結(jié)果。

對一個行業(yè)或地區(qū)的深入調(diào)查。比如,“搜房網(wǎng)”只能在這個網(wǎng)站上搜索與房地產(chǎn)相關(guān)的信息,不能搜索到網(wǎng)上營銷的SEO優(yōu)化信息。

那么搜索引擎的工作原理和步驟是什么呢?只有了解了搜索引擎的工作原理,才能更好地優(yōu)化我們的網(wǎng)站。

第一步,爬行

我們以百度為例說明百度搜索引擎稱之為“百度蜘蛛”,這里的“爬行”是一個圖像。搜索引擎通過它的爬行程序沿著網(wǎng)站的鏈接爬行。我們的網(wǎng)站鏈接就像“蜘蛛網(wǎng)”。你怎么能想到如何讓蜘蛛在你的蜘蛛網(wǎng)上再爬幾個圈呢?也就是說,我們的網(wǎng)站鏈接應該豐富合理,不應該有死鏈接。這樣,蜘蛛就可以在你的網(wǎng)站上自由爬行,獲取更多的網(wǎng)站內(nèi)容。應該注意的是,當蜘蛛通常抓取頁面時,它們首先抓取主頁,然后抓取內(nèi)部頁面。

第二步:抓取存儲

蜘蛛沿著網(wǎng)站上的鏈接爬行,抓取與鏈接對應的內(nèi)容,并將此頁面的內(nèi)容存儲在原始數(shù)據(jù)庫中。目前,spider只能捕獲文本信息,不能捕獲大圖像、視頻、JS等文件。這就要求我們在網(wǎng)站seo優(yōu)化時要注意。對于SEO優(yōu)化的網(wǎng)站,我們不建議使用大量圖片和JS特效,因為蜘蛛不容易抓到。我們建議添加更多的文章內(nèi)容,以增加被蜘蛛抓住的機會。

第三步:預處理

對于百度蜘蛛抓取的內(nèi)容,它并不能馬上顯示出來,它必須經(jīng)過自己的處理。

蜘蛛捕獲的內(nèi)容將與百度數(shù)據(jù)庫中的內(nèi)容進行比較。如果與現(xiàn)有數(shù)據(jù)庫中的內(nèi)容重復,則將丟棄該內(nèi)容,并且不包括該內(nèi)容。所有的站長,發(fā)表文章和創(chuàng)作原創(chuàng)文章是非常重要的。

根據(jù)網(wǎng)頁的標簽代碼,搜索引擎將提取網(wǎng)頁的關(guān)鍵詞,記錄關(guān)鍵詞出現(xiàn)的次數(shù),分析出現(xiàn)在網(wǎng)頁上的關(guān)鍵詞密度,分析判斷關(guān)鍵詞與網(wǎng)站內(nèi)容的相關(guān)性。至于關(guān)鍵詞密度,最好控制在2%-8%之間,因為這個范圍是搜索引擎最喜歡的范圍,應該不會太低。如果太低,關(guān)鍵字和內(nèi)容之間的相關(guān)性就不會太高,也不會太高。如果太高,搜索引擎會認為你有堆積關(guān)鍵字的行為,這將導致網(wǎng)站的正確減少。內(nèi)容相關(guān)性也很重要,你的網(wǎng)站是哪個行業(yè),哪個行業(yè)的內(nèi)容會被發(fā)送。你不能隨意發(fā)送一些與網(wǎng)站無關(guān)的內(nèi)容。即使內(nèi)容寫得很好,也不會被搜索引擎捕獲。

例如,單詞“de”、“de”、“Di”、“ah”和“you”被稱為停止詞。例如,搜索引擎中包含了“美麗的西湖”這個詞。如果你再發(fā)表一篇名為“美麗西湖”的文章,它會自動刪除停止字,變成“美麗西湖”。這樣,它會認為你的文章是一個副本,所以不會包括在內(nèi)。這里我們建議名字可以長一些,這樣被收錄的概率會很大。

這里的噪音指的是網(wǎng)頁上的一些彈出窗口、版權(quán)和其他信息。搜索引擎將在基于關(guān)鍵字和網(wǎng)頁內(nèi)容構(gòu)建索引庫之前刪除這些信息,并將您的信息存儲在索引庫中。索引是什么樣子的?它是一個鏈接地址,然后是web內(nèi)容。所有的,我們以前做SEO優(yōu)化的站點,最好不要添加彈出窗口,因為這樣不利于搜索引擎的收錄。

第四步:顯示結(jié)果

當用戶使用搜索引擎搜索關(guān)鍵字時,搜索引擎將顯示與您搜索的關(guān)鍵字匹配度高的頁面。

當前文章:SEO從業(yè)者必須了解搜索引擎的工作原理和步驟
文章地址:http://www.bm7419.com/news/5720.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信小程序、面包屑導航、App設(shè)計、標簽優(yōu)化、網(wǎng)站改版、響應式網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都做網(wǎng)站