昆明網(wǎng)站建設(shè)中爬行、抓取等分別指的是什么?

2022-08-07    分類: 網(wǎng)站建設(shè)

昆明網(wǎng)站建設(shè)的客戶在網(wǎng)站做完以后都會自己來研究SEO,在SEO領(lǐng)域會有一些專業(yè)術(shù)語,比如說爬行、抓取、索引、收錄等等,那么這些詞語是什么意思呢?小編來給大家解答。
索引
索引指的是將一個URL的信息進行整理,存入數(shù)據(jù)庫,也就是索引庫,用戶搜索時,搜索引擎從索引庫中提取URL信息并排序展現(xiàn)出來。索引的英文是index。索引庫是用于搜索的,所以被索引的URL是可以被用戶搜索到的,沒有被索引的URL用戶在搜索結(jié)果中是看不到的。
要注意的是,所謂“一個URL的信息“,并不限于蜘蛛從URL上抓取來的內(nèi)容,還有來自其它來源的信息,如外部鏈接、鏈接的錨文字等。有的時候,索引庫中關(guān)于這個URL的的信息,根本沒有從這個URL抓取來的內(nèi)容,但搜索引擎知道這個URL的存在,并且有一些其它信息。
抓取和索引不是一回事。
爬行
爬行指的是搜索引擎蜘蛛從已知頁面上解析出鏈接指向的URL,然后沿著鏈接發(fā)現(xiàn)新頁面(也就是鏈接指向的URL)的過程。當然,蜘蛛并不是發(fā)現(xiàn)新URL馬上就爬過去抓取新頁面,而是把發(fā)現(xiàn)的URL存放到待抓地址庫中,蜘蛛按照一定順序從地址庫中提取要抓取的URL。
收錄
我個人覺得收錄和索引沒有區(qū)別。只不過收錄是從搜索用戶角度看的,搜索時能找到這個URL,就是這個URL被收錄了。從搜索引擎角度看,URL被收錄了,也就是這個URL的信息在索引庫中存在。英文并沒有收錄這個詞,和索引用的是同一個詞index。
抓取
抓取是搜索引擎蜘蛛從待抓地址庫中提取要抓的URL,訪問這個URL,把讀取的HTML代碼存入數(shù)據(jù)庫。蜘蛛的抓取就是像瀏覽器一樣打開這個頁面,和用戶瀏覽器訪問一樣,也會在服務(wù)器原始日志中留下記錄。

網(wǎng)站題目:昆明網(wǎng)站建設(shè)中爬行、抓取等分別指的是什么?
文章鏈接:http://www.bm7419.com/news25/186725.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站維護、域名注冊、企業(yè)建站網(wǎng)頁設(shè)計公司、定制開發(fā)、網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都定制網(wǎng)站網(wǎng)頁設(shè)計