成都網(wǎng)站建設(shè)中如何使用php自動(dòng)獲取文章內(nèi)容關(guān)鍵字

2022-08-23    分類: 網(wǎng)站建設(shè)

成都網(wǎng)站建設(shè)中了解網(wǎng)站的優(yōu)化的人員都很清楚,對(duì)于一個(gè)網(wǎng)站來(lái)說,網(wǎng)站內(nèi)部結(jié)構(gòu)的優(yōu)化對(duì)于搜索引擎蜘蛛的爬行起到一個(gè)決定性的作用。網(wǎng)站內(nèi)部?jī)?yōu)化的越好搜索引擎蜘蛛爬行的深度和時(shí)間也就越長(zhǎng)和越深。淡然蜘蛛爬行的規(guī)律還有很多因素的影響,比如網(wǎng)站權(quán)重,網(wǎng)站內(nèi)容質(zhì)量,蜘蛛類型等,都會(huì)決定網(wǎng)站爬行的深度問題。

怎么樣才算是網(wǎng)站內(nèi)部?jī)?yōu)化的好呢,網(wǎng)站內(nèi)部?jī)?yōu)化可分為兩個(gè)部分,一是網(wǎng)站內(nèi)部代碼的優(yōu)化,這其中包括html標(biāo)簽的使用規(guī)范,DIV+CSS的使用優(yōu)化技巧兩方面。二是網(wǎng)站結(jié)構(gòu)的優(yōu)化,網(wǎng)站結(jié)構(gòu)優(yōu)化歸根到底就是能夠讓網(wǎng)站的內(nèi)部結(jié)構(gòu)符合人們的瀏覽習(xí)慣,能夠在網(wǎng)站瀏覽者對(duì)網(wǎng)站的任何一個(gè)頁(yè)面進(jìn)行瀏覽的時(shí)候都能夠快速方便的找到自己喜歡的東西。

我們進(jìn)入正題,想要提高網(wǎng)站的內(nèi)部結(jié)構(gòu),讓瀏覽者在適當(dāng)?shù)奈恢茫业竭m當(dāng)?shù)挠行畔?。在網(wǎng)站中的文章增加自動(dòng)獲取關(guān)鍵字的功能就成為了一個(gè)很好的選擇。試想,當(dāng)你對(duì)網(wǎng)站中的一篇文章進(jìn)行瀏覽的時(shí)候,在文章的最后,有本文相關(guān)關(guān)鍵字,本問相關(guān)搜索等信息的話,既有可能你會(huì)接著往下看和本文相關(guān)的內(nèi)容,從而降低了網(wǎng)站的跳出率,提高了網(wǎng)能瀏覽性。

網(wǎng)站文章內(nèi)容關(guān)鍵字自動(dòng)獲取

一、文章內(nèi)容關(guān)鍵字自動(dòng)獲取的思路

通過獲取php獲取到所需提取的內(nèi)容,通過字典中定義的分詞方法,對(duì)獲取到的內(nèi)容進(jìn)行分詞,最后將得到的分次進(jìn)行最終匹配,將最終得到的結(jié)果以數(shù)組的形式返回給函數(shù)。

二、文章內(nèi)容關(guān)鍵字自動(dòng)獲取實(shí)現(xiàn)方法

首先我們把已經(jīng)寫好的字典文件和分次函數(shù)以及測(cè)試文件下載到本地,然后打開其中的index.php文件,把其中的//print_r(get_tags_arr($con));這行代碼的注視刪掉,運(yùn)行此文件,查看是否有分次輸出。正常輸出結(jié)果如下圖所示。

內(nèi)容自動(dòng)獲取關(guān)鍵字測(cè)試結(jié)果

通過圖可以看到,只需要使get_tags_arr這個(gè)函數(shù)得到我們所需要的分次的文字就可以了,代碼中的實(shí)現(xiàn)方法:

$a=trim(strip_tags(content('jianjie'))); //得到所需要提取關(guān)鍵字的文字部分并去除文字中的html標(biāo)簽和空格標(biāo)簽

$arr=get_tags_arr($a); // 使用get_tags_arr函數(shù)將文字進(jìn)行分詞處理,并返回?cái)?shù)組

foreach($arr as $k=>$val){

echo "$val    ";

}

//通過foreach將數(shù)組循環(huán),并輸出html格式

?>

通過以上步驟就會(huì)發(fā)現(xiàn)我們已經(jīng)得到自己想要的分詞結(jié)果,就是這么簡(jiǎn)單,文章內(nèi)容自動(dòng)獲取關(guān)鍵字的功能就完成了。

三、文章內(nèi)容自動(dòng)獲取關(guān)鍵字常見錯(cuò)誤

①、分詞關(guān)鍵字中出現(xiàn)html標(biāo)簽

解決方法:在輸出內(nèi)容之前加入strip_tags()函數(shù),將輸出內(nèi)容中的html標(biāo)簽去除。

②、輸出字符中出現(xiàn)亂碼

解決方法:將分詞在輸出之前進(jìn)行轉(zhuǎn)碼處理,所使用函數(shù)mb_convert_encoding()。

瀏覽器亂碼現(xiàn)象

③、在不同瀏覽器中,分詞轉(zhuǎn)碼之后,會(huì)發(fā)生亂碼現(xiàn)象

解決方法:通過判斷瀏覽器的類型,設(shè)置是否需要對(duì)分詞進(jìn)行轉(zhuǎn)碼處理,所使用函數(shù)strpos($_SERVER['HTTP_USER_AGENT']。

瀏覽器判斷和轉(zhuǎn)碼處理

在進(jìn)行成都網(wǎng)站建設(shè)的過程中,我們需要對(duì)客戶進(jìn)行網(wǎng)站建設(shè)的工作時(shí),要記住盡可能的把網(wǎng)站的每個(gè)細(xì)節(jié)都處理好,其實(shí)像網(wǎng)站內(nèi)容自動(dòng)提取關(guān)鍵字這個(gè)功能,對(duì)于一般性的網(wǎng)站來(lái)說都是可有可無(wú)的,甚至在實(shí)際中不加入這個(gè)功能對(duì)網(wǎng)站正常開發(fā)和運(yùn)營(yíng)都沒有什么影響,但是考慮到網(wǎng)站用戶體驗(yàn)上來(lái)說,適當(dāng)?shù)募尤腩愃七@樣的功能,在很大程度上有助于提高網(wǎng)站的可讀性和吸引力,從而提高了網(wǎng)站的權(quán)重和關(guān)鍵字的排名。

相關(guān)文檔下載:自動(dòng)提取文章內(nèi)容關(guān)鍵字

文章名稱:成都網(wǎng)站建設(shè)中如何使用php自動(dòng)獲取文章內(nèi)容關(guān)鍵字
本文鏈接:http://www.bm7419.com/news/192621.html

網(wǎng)站建設(shè)、網(wǎng)絡(luò)推廣公司-創(chuàng)新互聯(lián),是專注品牌與效果的網(wǎng)站制作,網(wǎng)絡(luò)營(yíng)銷seo公司;服務(wù)項(xiàng)目有網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

手機(jī)網(wǎng)站建設(shè)