如何通過技術手段來識別原創(chuàng)和轉載呢

2021-10-11    分類: 網(wǎng)站建設

據(jù)悉百度將今年推出原創(chuàng)星火計劃,重點整治互聯(lián)網(wǎng)上低質量的垃圾內容,并且提升內容優(yōu)質的原創(chuàng)網(wǎng)站,這對于站長界和SEO界來說似乎是一件天大的好事??梢钥隙ǖ氖前俣冗t早會推出這樣的計劃或者算法,谷歌在2011年推出了熊貓算法,意在打擊垃圾內容,百度之前也推出過類似的算法,但圍繞原創(chuàng)和轉載之間的矛盾依舊得不到根治,事實上從技術的角度上很難去根治。例如:一篇文章在a站上先發(fā)表,百度還沒有收錄就被B站轉載,而B站的權重比a站高很多,這樣一來B站會先收錄,百度就誤以為文章屬于B站的原創(chuàng)。那么通過技術手段識別原創(chuàng)和轉載的方法有哪些呢 
根據(jù)文章收錄的時間判斷<原則就是誰先被收錄判定誰是原創(chuàng),舉個例子:我寫了這篇文章先發(fā)布到自己的小站,然后再投稿到a5站長網(wǎng),但是a5站長網(wǎng)權重高,因此先收錄了這篇文章,這樣我自己的小站就成了轉載別人的文章了,顯然這是很不公平的,以往這種現(xiàn)象一種存在,站長們也是無可奈何。根據(jù)時間去判斷是否原創(chuàng)還要求百度蜘蛛的爬行速率更快,肯定要比現(xiàn)在快很多,當然這對服務器的壓力肯定不小根據(jù)文章的標題去判斷這種方法更簡單,根據(jù)互聯(lián)網(wǎng)上是否有相同標題的文章,以此來判斷某篇文章是不是原創(chuàng)
平常用intitle這個命令就可以搜索到所有相同標題的文章,但這種方法比第一種更草率,互聯(lián)網(wǎng)上同樣標題不同內容的文章實在太多了,也許可以再根據(jù)文章內容的字節(jié)數(shù)來判斷。以上筆者說的兩種方法都很不靠譜,內容的原創(chuàng)性實在很難去判斷,其實互聯(lián)網(wǎng)上有太多的轉載內容,包括一些門戶類網(wǎng)站不也是經(jīng)常轉載別人的文章嗎,像新浪、網(wǎng)易等等。還有大量的小說網(wǎng)站和電影網(wǎng)站都涉及到侵權的,那些小說和視頻也都是無版權的,如果百度的原創(chuàng)星火計劃真的要趕盡殺絕,那恐怕就不光是百度技術的問題了,還牽涉到互聯(lián)網(wǎng)版權的問題
而且那么多站點都是會受到影響,被服務商關閉站點,被百度K站。話說回來不一定原創(chuàng)的內容就是用戶想要的東西,那些小說站和電影站都有存在的意義,百度重視用戶體驗,所以肯定不會這么干,我估計百度的原創(chuàng)星火計劃會針對某些行業(yè)下手。猜想一下會是哪些類型的站點呢個人感覺是中小型站點,重點是企業(yè)站和SEO類的站點還有醫(yī)療行業(yè)的站點。這些類型的站點也許是百度星火計劃重點整治的對象,比方說為數(shù)眾多的企業(yè)站,可以說絕大多數(shù)企業(yè)站的內容都比較垃圾

文章名稱:如何通過技術手段來識別原創(chuàng)和轉載呢
URL標題:http://www.bm7419.com/news36/130686.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供移動網(wǎng)站建設、Google、面包屑導航、商城網(wǎng)站、關鍵詞優(yōu)化、網(wǎng)站制作

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設