如何通過技術(shù)手段來識別原創(chuàng)和轉(zhuǎn)載呢

2021-10-11    分類: 網(wǎng)站建設(shè)

據(jù)悉百度將今年推出原創(chuàng)星火計劃,重點整治互聯(lián)網(wǎng)上低質(zhì)量的垃圾內(nèi)容,并且提升內(nèi)容優(yōu)質(zhì)的原創(chuàng)網(wǎng)站,這對于站長界和SEO界來說似乎是一件天大的好事??梢钥隙ǖ氖前俣冗t早會推出這樣的計劃或者算法,谷歌在2011年推出了熊貓算法,意在打擊垃圾內(nèi)容,百度之前也推出過類似的算法,但圍繞原創(chuàng)和轉(zhuǎn)載之間的矛盾依舊得不到根治,事實上從技術(shù)的角度上很難去根治。例如:一篇文章在a站上先發(fā)表,百度還沒有收錄就被B站轉(zhuǎn)載,而B站的權(quán)重比a站高很多,這樣一來B站會先收錄,百度就誤以為文章屬于B站的原創(chuàng)。那么通過技術(shù)手段識別原創(chuàng)和轉(zhuǎn)載的方法有哪些呢 
根據(jù)文章收錄的時間判斷<原則就是誰先被收錄判定誰是原創(chuàng),舉個例子:我寫了這篇文章先發(fā)布到自己的小站,然后再投稿到a5站長網(wǎng),但是a5站長網(wǎng)權(quán)重高,因此先收錄了這篇文章,這樣我自己的小站就成了轉(zhuǎn)載別人的文章了,顯然這是很不公平的,以往這種現(xiàn)象一種存在,站長們也是無可奈何。根據(jù)時間去判斷是否原創(chuàng)還要求百度蜘蛛的爬行速率更快,肯定要比現(xiàn)在快很多,當然這對服務(wù)器的壓力肯定不小根據(jù)文章的標題去判斷這種方法更簡單,根據(jù)互聯(lián)網(wǎng)上是否有相同標題的文章,以此來判斷某篇文章是不是原創(chuàng)
平常用intitle這個命令就可以搜索到所有相同標題的文章,但這種方法比第一種更草率,互聯(lián)網(wǎng)上同樣標題不同內(nèi)容的文章實在太多了,也許可以再根據(jù)文章內(nèi)容的字節(jié)數(shù)來判斷。以上筆者說的兩種方法都很不靠譜,內(nèi)容的原創(chuàng)性實在很難去判斷,其實互聯(lián)網(wǎng)上有太多的轉(zhuǎn)載內(nèi)容,包括一些門戶類網(wǎng)站不也是經(jīng)常轉(zhuǎn)載別人的文章嗎,像新浪、網(wǎng)易等等。還有大量的小說網(wǎng)站和電影網(wǎng)站都涉及到侵權(quán)的,那些小說和視頻也都是無版權(quán)的,如果百度的原創(chuàng)星火計劃真的要趕盡殺絕,那恐怕就不光是百度技術(shù)的問題了,還牽涉到互聯(lián)網(wǎng)版權(quán)的問題
而且那么多站點都是會受到影響,被服務(wù)商關(guān)閉站點,被百度K站。話說回來不一定原創(chuàng)的內(nèi)容就是用戶想要的東西,那些小說站和電影站都有存在的意義,百度重視用戶體驗,所以肯定不會這么干,我估計百度的原創(chuàng)星火計劃會針對某些行業(yè)下手。猜想一下會是哪些類型的站點呢個人感覺是中小型站點,重點是企業(yè)站和SEO類的站點還有醫(yī)療行業(yè)的站點。這些類型的站點也許是百度星火計劃重點整治的對象,比方說為數(shù)眾多的企業(yè)站,可以說絕大多數(shù)企業(yè)站的內(nèi)容都比較垃圾

本文題目:如何通過技術(shù)手段來識別原創(chuàng)和轉(zhuǎn)載呢
本文網(wǎng)址:http://bm7419.com/news/130686.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站營銷、定制開發(fā)微信公眾號、網(wǎng)站維護、ChatGPT、虛擬主機

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

h5響應(yīng)式網(wǎng)站建設(shè)