百度如何分辨文章是否為原創(chuàng)

2021-12-24    分類: 網(wǎng)站建設

現(xiàn)在百度提倡用戶體驗,更加強調網(wǎng)站內容的原創(chuàng)度,但是百度蜘蛛是怎樣分辨一篇文章是不是原創(chuàng)呢同一篇文章發(fā)在不同平臺上被收錄后百度是如何辨別哪篇是原創(chuàng)哪篇不是原創(chuàng)呢

1、文章對比

搜索引擎來到這個網(wǎng)站并且抓取到了這篇文章,放到數(shù)據(jù)庫,并且在收錄數(shù)據(jù)庫中沒有發(fā)現(xiàn)類似內容,那么就會被認為是原創(chuàng),也有站長朋友認為是用公式計算出的,即:TF IDF ,TF是TermFrequency的縮寫,譯成中文是詞頻,指的是某一個詞在文章中出現(xiàn)的次數(shù);IDF是 InverseDocumentFrequency的縮寫,中文譯成反文檔頻率,IDF越大,表明這個詞在其它文章中出現(xiàn)的次數(shù)很少,說明這個詞有很好的類別區(qū)分能力。

2、文章與網(wǎng)站主題的相關性

在網(wǎng)站初期就會對此網(wǎng)站規(guī)劃一個主題,那么百度等搜索引擎在收錄此網(wǎng)站的時候,就已經(jīng)為這個站確定了主題范圍。如果某篇文章的主題與整個站點的主題相關度很低,比如你的站是一個做seo的站,其中卻有篇文章是說教育類的,那么百度蜘蛛就會認為這篇文章與網(wǎng)站主題不符,即不會判斷為原創(chuàng)。

搜索引擎比較喜歡原創(chuàng)類文章,那么在網(wǎng)站制作完成后在做關鍵詞布署時一定要考慮是否與網(wǎng)站主題相關,因為站內不相關的文章或者網(wǎng)頁占到一定幅度,就可能被降權甚至K站,所以網(wǎng)站的主題相關性也很重要。

3、網(wǎng)站權重

同一篇文章發(fā)在不同平臺上,收錄快慢都是有區(qū)別的,如果你寫了一篇文章,在未收錄前被別人轉載了,并且沒有保留你網(wǎng)站的鏈接,那么他發(fā)在一個權重較高的網(wǎng)站上,隔天收錄了,這個時候如果百度再去收錄你網(wǎng)站中這篇文章時,在數(shù)據(jù)庫里面發(fā)現(xiàn)了同一篇文章,那么百度就會認為你這邊是抄襲的,并且不會被收錄,所以很多站長朋友都很清楚,寫的原創(chuàng)文章一定是發(fā)布在自己網(wǎng)站上等收錄后再發(fā)到其他網(wǎng)站上。

4、網(wǎng)站的跳出率等

百度現(xiàn)在更多的是考慮用戶體驗,所以偽原創(chuàng)文章,尤其是程序生成的偽原創(chuàng)文章,大量存在網(wǎng)站中,用戶體驗是非常差的,這樣會導致用戶快速跳出頁面,并且點擊其他搜索結果,如果跳出率過高的話,百度就會認為這個站點是垃圾站點,那么以后這個網(wǎng)站內的文章,也會被認為是偽原創(chuàng)文章。

通過以上的分析我們可以發(fā)現(xiàn),現(xiàn)在的seo不僅僅是簡單的偽原創(chuàng)外鏈那么簡單的,更要充分注重用戶的感受,所以偽原創(chuàng)之路已經(jīng)不可取了,建議站長朋友更多的去寫原創(chuàng)類的文章。

網(wǎng)頁標題:百度如何分辨文章是否為原創(chuàng)
分享URL:http://www.bm7419.com/news38/141838.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供搜索引擎優(yōu)化、建站公司、品牌網(wǎng)站設計、標簽優(yōu)化、網(wǎng)站維護、面包屑導航

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

營銷型網(wǎng)站建設