SEM一家之言:豐富網(wǎng)頁(yè)摘要讓網(wǎng)站與眾不同

2023-01-01    分類(lèi): 網(wǎng)站建設(shè)

在6月15的《谷歌中文網(wǎng)站管理員博客》中,出現(xiàn)了一篇介紹“豐富網(wǎng)頁(yè)摘要”的文章。看到這篇博客,我就知道3年前對(duì)google的預(yù)測(cè),現(xiàn)在終于變成現(xiàn)實(shí)了。不過(guò)沒(méi)想到在眾多網(wǎng)站還沒(méi)普及這些新技術(shù)的情況下,google這么快就開(kāi)始應(yīng)用了。

關(guān)于“豐富網(wǎng)頁(yè)摘要”的詳細(xì)介紹,大家可以點(diǎn)上面的鏈接去了解。“豐富網(wǎng)頁(yè)摘要”,用一句話說(shuō)明一下就是:你給你的網(wǎng)站的某些內(nèi)容,用特定的格式標(biāo)注一下,就可以讓你的網(wǎng)頁(yè)在google的搜索結(jié)果中,顯示更多的結(jié)構(gòu)化的信息。比如那個(gè)博客上的截圖:

豐富網(wǎng)頁(yè)摘要

豐富網(wǎng)頁(yè)摘要

當(dāng)用戶(hù)搜索“drooling dog”,用戶(hù)能在搜索結(jié)果頁(yè)直接看到網(wǎng)頁(yè)上的產(chǎn)品有多少人評(píng)論以及價(jià)格范圍。

這些信息是在原網(wǎng)頁(yè)中本來(lái)就有的:http://www.yelp.com/biz/drooling-dog-bar-b-q-colfax

如果你的網(wǎng)站也能這樣呈現(xiàn)搜索結(jié)果給用戶(hù),有什么好處自然是不用說(shuō)的。接下來(lái)要講的是google為什么會(huì)采用“豐富網(wǎng)頁(yè)摘要”。下面給大家呈現(xiàn)一下以前我的分析過(guò)程。這樣你也能預(yù)測(cè)搜索引擎以后會(huì)做些什么了。

我們?nèi)绻驹谒阉饕娴慕嵌热タ?,就發(fā)現(xiàn)作為一個(gè)通用搜索引擎,其實(shí)是非常不容易的。搜索引擎面對(duì)的是上百億的網(wǎng)頁(yè),先不說(shuō)分詞、索引、以及抓取和排序等等的技術(shù)。先來(lái)看搜索引擎如何判斷網(wǎng)頁(yè)上有什么內(nèi)容,就發(fā)現(xiàn)是件很復(fù)雜的事情。

互聯(lián)網(wǎng)上可以說(shuō)什么樣的網(wǎng)站都有,體現(xiàn)在網(wǎng)頁(yè)的代碼里,什么樣的HTML寫(xiě)法都有的。 在具體的網(wǎng)頁(yè)設(shè)計(jì)上,有些網(wǎng)站用模版做網(wǎng)站,可能僅僅只有一個(gè)區(qū)域內(nèi)的內(nèi)容是有效的;而有些不用模版,網(wǎng)頁(yè)上從頭到尾都是有價(jià)值的內(nèi)容;每個(gè)網(wǎng)站的代碼都是如此不相同而且混亂,但是搜索引擎還要通過(guò)這些HTML代碼來(lái)判斷你的重點(diǎn)內(nèi)容。搜素引擎要從這么多繁雜的網(wǎng)頁(yè)里提煉有價(jià)值的內(nèi)容給用戶(hù),那個(gè)過(guò)程非常的痛苦。

我曾經(jīng)和前yahoo中國(guó)的工程師一起做過(guò)一些事情,發(fā)現(xiàn)這樣的互聯(lián)網(wǎng)現(xiàn)狀太考驗(yàn)一個(gè)公司的技術(shù)水平了。到如今,像google這樣的公司,在處理網(wǎng)頁(yè)噪音的時(shí)候都還遇到很多困難的。 所以,如果有一種統(tǒng)一的格式和標(biāo)準(zhǔn),讓大家來(lái)遵守,大家把網(wǎng)站里的內(nèi)容都用這個(gè)標(biāo)準(zhǔn)把信息結(jié)構(gòu)化的話,那對(duì)搜索引擎來(lái)說(shuō)是一件非常幸福的事情。

現(xiàn)在博客搜索里,google已經(jīng)開(kāi)始應(yīng)用一些現(xiàn)成的標(biāo)準(zhǔn)了。如:

在google的博客搜索里搜索“SEM一家之言”,出現(xiàn)這樣的搜索結(jié)果:

google博客搜索

大家看這個(gè)搜索結(jié)果,已經(jīng)把博客發(fā)布的時(shí)間和作者給列出來(lái)了的。但是可以看到,這兩個(gè)頁(yè)面的排版和頁(yè)面代碼都是不一樣的。那搜索引擎是怎么準(zhǔn)確的知道這兩個(gè)信息的呢? 特別是第二個(gè)結(jié)果,google列出的那個(gè)時(shí)間的格式和我博客上的格式是不一樣的。

原因倒非常簡(jiǎn)單。因?yàn)檫@兩個(gè)博客都提供了RSS供稿,在RSS文件里,都用一個(gè)標(biāo)準(zhǔn)的格式寫(xiě)明了時(shí)間和作者這些信息的。

RRS文件

google通過(guò)讀取這個(gè)標(biāo)準(zhǔn)化的RSS文件準(zhǔn)確的抓取到了這些信息。

除了應(yīng)用RSS這個(gè)通用的標(biāo)準(zhǔn),google還試圖創(chuàng)立一個(gè)自己的標(biāo)準(zhǔn)來(lái)規(guī)范化很多信息。像google base就是其中的一個(gè)實(shí)驗(yàn)的項(xiàng)目。google base 這個(gè)項(xiàng)目以后會(huì)有專(zhuān)門(mén)的介紹。它試圖把很多的信息都規(guī)范化,如你賣(mài)的東西的價(jià)格和產(chǎn)地,是否提供運(yùn)輸?shù)鹊?你的房屋租售價(jià)格和位置;甚至一個(gè)學(xué)校的課程表,都可以用特定的格式標(biāo)準(zhǔn)化。

google base還在不斷的發(fā)展和完善中,在目前的應(yīng)用中,凡是google base 里的信息,都有可能在相關(guān)的搜索結(jié)果中排在靠前的位置。

比起自己去創(chuàng)立和推廣一個(gè)標(biāo)準(zhǔn)來(lái),應(yīng)用現(xiàn)成的標(biāo)準(zhǔn)無(wú)疑是最省事的。“微格式”和 “RDFa”就是一個(gè)這樣的現(xiàn)成的標(biāo)準(zhǔn)。具體的應(yīng)用在《谷歌中文網(wǎng)站管理員博客》的那篇文章中已經(jīng)說(shuō)明了。

這些標(biāo)準(zhǔn)的應(yīng)用起來(lái)效果是非常好的。

還是同一個(gè)詞語(yǔ)“drooling dog”, 用美國(guó)IP,在英文版的google上搜索,在第2個(gè)搜索結(jié)果中,還是出現(xiàn)那那家“Bar B Q”,而且有個(gè)地圖標(biāo)明了地址,地圖旁邊還有地址和電話。

單獨(dú)的地圖和地址電話信息

單獨(dú)的地圖和地址電話信息

這個(gè)搜索結(jié)果不是那個(gè)“本地商家”的搜索結(jié)果。因?yàn)檫@個(gè)結(jié)果只顯示這一家店的地址,而且特別標(biāo)注了這家店的地址和電話。

這幅地圖和地址信息在那個(gè)網(wǎng)頁(yè)上本來(lái)就有的,只是這個(gè)網(wǎng)站把它們用特定的標(biāo)準(zhǔn)標(biāo)注了才有了這種效果。

我的這個(gè)分析方式,就是站在搜索引擎的角度,來(lái)考慮如何提供更好的搜索結(jié)果給用戶(hù)。這是一種很好的SEO方法。以后大家也可以從這個(gè)角度來(lái)考慮SEO。

順便說(shuō)一下的是,上面那個(gè)博客搜索里的時(shí)間都比RSS文件里的時(shí)間慢一天的,這是因?yàn)間oogle服務(wù)器所在的時(shí)區(qū)比中國(guó)時(shí)間慢的緣故。當(dāng)然谷歌是不會(huì)處理這些小細(xì)節(jié)的,包括最近谷歌的首頁(yè)上找不到登陸的地方也是。

網(wǎng)站名稱(chēng):SEM一家之言:豐富網(wǎng)頁(yè)摘要讓網(wǎng)站與眾不同
文章地址:http://bm7419.com/news/227276.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名、軟件開(kāi)發(fā)、網(wǎng)站設(shè)計(jì)、動(dòng)態(tài)網(wǎng)站、App開(kāi)發(fā)、Google

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

搜索引擎優(yōu)化