深度分析關(guān)于鏡像網(wǎng)站的相關(guān)內(nèi)容

2014-12-01    分類: 網(wǎng)站建設(shè)

涉及到網(wǎng)站建設(shè)就不得不提一下網(wǎng)站惡意鏡像了。鏡像我們的網(wǎng)站就像是一面鏡子一樣,自己的網(wǎng)站有什么東西,對方網(wǎng)站就會同步出現(xiàn)什么東西,比如你自己網(wǎng)站新增了一篇新聞后,只要有人訪問了該篇新聞,那么鏡像你的網(wǎng)站也會同步更新上去了該篇新聞,這采集網(wǎng)站還不太一樣,小編為大家深度分析關(guān)于鏡像網(wǎng)站的相關(guān)內(nèi)容。

鏡像對網(wǎng)站的危害性


1.什么是惡意鏡像的網(wǎng)站?

鏡像網(wǎng)站指的是和你的網(wǎng)站基本一樣、并且實時同步的其它網(wǎng)站。就像照鏡子一樣,所以名為鏡像。

有的鏡像網(wǎng)站是沒有惡意的,很可能是你自己設(shè)置的,為了方便用戶能從多個域名訪問網(wǎng)站,被封了一個,還有其它的域名。比如著名的草榴社區(qū),好像就有很多鏡像可以訪問。有的鏡像,也就是這里討論的鏡像,是不懷好意的,通常是別人設(shè)置的,要么為了負(fù)面SEO你的網(wǎng)站,要么為了利用你的內(nèi)容獲得排名,然后把用戶轉(zhuǎn)向到敏感、非法內(nèi)容網(wǎng)站上去。網(wǎng)上有的文章把采集和鏡像混在一起。雖然表現(xiàn)形式差不多,但嚴(yán)格來說,采集和鏡像實現(xiàn)方法、表現(xiàn)形式是有區(qū)別的。

采集的網(wǎng)站一般是提前抓取別人網(wǎng)站的內(nèi)容,放入自己數(shù)據(jù)庫,再用程序調(diào)用到頁面上。被采集網(wǎng)站有新內(nèi)容時,采集網(wǎng)站并不能實時同步更新,要再采集之后才能出現(xiàn)。一旦被采集,內(nèi)容已經(jīng)在對方數(shù)據(jù)庫里了,從技術(shù)上是無法阻止采集網(wǎng)站顯示這些內(nèi)容的。鏡像網(wǎng)站并不事先抓取內(nèi)容,而是有人訪問網(wǎng)站時,實時從被鏡像的網(wǎng)站調(diào)取內(nèi)容,做些處理(替換URL、文字,加文字、加JS等),然后實時顯示。被鏡像的網(wǎng)站有任何更新,鏡像網(wǎng)站是實時同步的。

網(wǎng)上有賣用于鏡像網(wǎng)站的小偷程序的。小偷程序通常也可以用來做采集。為了不給他們做宣傳,就不提名字了。從他們的官網(wǎng)摘取幾條程序功能,有助于理解后面的內(nèi)容:全自動分析,內(nèi)外鏈接自動轉(zhuǎn)換、圖片地址、css、js,自動分析CSS內(nèi)的圖片,內(nèi)置強大替換和過濾功能,標(biāo)簽過濾、站內(nèi)外過濾、字符串替換、等等。偽原創(chuàng),近義詞替換有利于seo(什么是網(wǎng)站SEO),增加URL路由,實現(xiàn)全站URL變換,個性化本站URL地址。超級模板增加移動模板、自定義欄目功能

增加自動獲取301、302重定向的采集,解決跳www,跳https采集。代理IP、偽造IP、隨機IP、偽造user-agent、偽造referer來路、自定義cookie,以便應(yīng)對防采集措施。

2.網(wǎng)站被鏡像有什么危險?

從SEO角度看,權(quán)重不高的小站、新站,被鏡像意味著有其它網(wǎng)站和你的網(wǎng)站內(nèi)容基本一樣,搜索引擎有可能認(rèn)為你的網(wǎng)站不是原版,鏡像網(wǎng)站才是,所以把排名、流量給了鏡像網(wǎng)站。

對有一定歷史、權(quán)重的網(wǎng)站,鏡像網(wǎng)站取代原版網(wǎng)站的可能性微乎其微。但從心情角度考慮,被別人鏡像,內(nèi)容被別人偷走,即使沒有其它明顯后果,也還是挺煩人的一件事。另一個煩人的事是,鏡像網(wǎng)站一般來說并不是要和你提供同樣的產(chǎn)品或服務(wù),而是把用戶轉(zhuǎn)到賭博、色情等服務(wù)上去。有的是通過JS把賭博、色情內(nèi)容顯示給用戶,有的直接把用戶轉(zhuǎn)向到另外的網(wǎng)站上去。

3.怎樣發(fā)現(xiàn)自己網(wǎng)站被鏡像了?

有時候注意到被鏡像了是因為自己網(wǎng)站排名下降,懷疑有人負(fù)面SEO。有時候是搜索品牌名稱,看到鏡像網(wǎng)站。已經(jīng)知道自己被鏡像了好辦,直接看下面怎么處理部分。很多站長則完全不知道自己網(wǎng)站是否被鏡像了。

①是百度統(tǒng)計后臺

受訪域名部分列出了使用相同百度統(tǒng)計代碼的域名。其中出現(xiàn)快照、百度/谷歌翻譯等是正常的,但出現(xiàn)一些奇奇怪怪的域名就要查看一下了,比如上圖里的第5、7、8個,訪問一下就知道都是鏡像SEO每天一帖,引誘用戶賭博的網(wǎng)站,然后站長把SEO每天一帖的統(tǒng)計代碼也照抄過去了。

②搜索網(wǎng)站的特征句子

最容易想到的是網(wǎng)站品牌名稱、首頁標(biāo)題等,確實可以發(fā)現(xiàn)一些鏡像網(wǎng)站。但如前所述,品牌名絕大多數(shù)是會被替換的,所以我更喜歡搜索一些頁面上的特征句子,比如本官網(wǎng)的標(biāo)題【創(chuàng)新互聯(lián)】。


4.網(wǎng)站被鏡像了怎么辦?

網(wǎng)頁標(biāo)題:深度分析關(guān)于鏡像網(wǎng)站的相關(guān)內(nèi)容
網(wǎng)頁網(wǎng)址:http://www.bm7419.com/news/16315.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信小程序標(biāo)簽優(yōu)化、營銷型網(wǎng)站建設(shè)商城網(wǎng)站、品牌網(wǎng)站設(shè)計Google

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

h5響應(yīng)式網(wǎng)站建設(shè)