大數(shù)據(jù)公司又被查,爬蟲(chóng)程序員在內(nèi)20余人被抓!

2021-02-04    分類: 網(wǎng)站建設(shè)

技術(shù)領(lǐng)導(dǎo)力社區(qū)來(lái)源:

警方發(fā)現(xiàn),在廣州諾涵科技公司,公民個(gè)人信息被稱為“流量”,公司自己開(kāi)發(fā)有“樂(lè)花管家”等多個(gè)小貸平臺(tái),在自身購(gòu)買公民個(gè)人信息用于推銷貸款、軟暴力催收的同時(shí),也和其他公司相互交換公民個(gè)人信息,還開(kāi)發(fā)有爬蟲(chóng)云等軟件,通過(guò)技術(shù)手段爬取其他小貸公司的公民個(gè)人信息,用于公司放貸和非法出售牟利。


鎖定相關(guān)犯罪證據(jù)后,淮安警方在長(zhǎng)沙、深圳分別將湖南九象公司的法定代表人和技術(shù)主管抓獲。

審訊得知,九象公司黑爬蟲(chóng)網(wǎng)站的“身份核驗(yàn)返照”業(yè)務(wù)端口來(lái)自北京黑格科技有限公司,而黑格公司是從北京考拉征信服務(wù)有限公司等四家公司購(gòu)買的查詢接口。

隨即,警方將北京黑格公司和考拉征信服務(wù)有限公司的法定代表人、董事長(zhǎng)、銷售、技術(shù)等 20 余名涉案人員抓獲,并于今年 4 月在北京將他們上游公司的 5 名涉案人員抓獲。

經(jīng)查,北京考拉征信服務(wù)有限公司從上游公司獲取接口后又違規(guī)將查詢接口出賣,并非法緩存公民個(gè)人身份信息,供下游公司查詢牟利,從而造成公民身份信息包括身份證照片的大量泄露。

違規(guī)緩存相當(dāng)于把公民個(gè)人信息復(fù)制了一份,存在那邊,下游公司再向它通過(guò)數(shù)據(jù)接口調(diào)取數(shù)據(jù)的時(shí)候,它就不需要再向上游調(diào)取,也是節(jié)省了開(kāi)支,這個(gè)是違法的。

(圖片文字來(lái)自新浪網(wǎng))

案例三:用爬蟲(chóng)技術(shù)擾亂對(duì)方網(wǎng)站經(jīng)營(yíng)規(guī)則,且牟利。比如這個(gè):

(圖片文字來(lái)自中國(guó)永嘉公號(hào))

圖上描述做搜索引擎排名的技術(shù),其實(shí)就是利用爬蟲(chóng)技術(shù)規(guī)?;脑L問(wèn)網(wǎng)頁(yè)。

在我們通常的認(rèn)知里,因?yàn)榛ヂ?lián)網(wǎng)推崇分享精神,所以認(rèn)為只要是網(wǎng)絡(luò)公開(kāi)數(shù)據(jù)就可以抓取,但是通過(guò)上面的案例來(lái)看,有幾個(gè)禁忌,抓取的數(shù)據(jù)最好不要直接商用,涉及社交信息/用戶信息要謹(jǐn)慎。

老板交代你抓取敏感任務(wù)時(shí),讓老板先看下刑法第285條。公司從事違法業(yè)務(wù),不代表個(gè)人行為就沒(méi)事,只是還沒(méi)入有關(guān)部門的法眼。

03.程序員如何避免,面向監(jiān)獄編程?

爬哪些數(shù)據(jù)會(huì)觸犯法律?

第一、著作權(quán)法保護(hù)的所有作品數(shù)據(jù)

比如一些網(wǎng)站發(fā)表的內(nèi)容,如文章、評(píng)論等都是有著作權(quán)的,如果只是單純的通過(guò)瀏覽器查看是不會(huì)觸犯法律的。

但是,對(duì)于有著作權(quán)的作品,如果未經(jīng)著作權(quán)人許可,以盈利為目的,對(duì)其作品用任何手段進(jìn)行復(fù)制是犯法的。

如果是使用了爬蟲(chóng)技術(shù)手段爬取數(shù)據(jù)之后將其保存下來(lái)或者傳播,并且進(jìn)行盈利,這種都是屬于犯罪的。

第二、網(wǎng)站用戶的個(gè)人信息或者隱私信息

網(wǎng)站上的個(gè)人用戶的個(gè)人信息,即使是用戶自己放到一些網(wǎng)站上進(jìn)行公開(kāi)或者部分公開(kāi),如微博、微信等,不代表這些數(shù)據(jù)就可以被其他人隨便獲取,這個(gè)要特別注意。

所以,如果爬取的數(shù)據(jù)涉及到個(gè)人信息或隱私信息,都是違法的!

還有些爬蟲(chóng)企圖繞過(guò)權(quán)限校驗(yàn)等,爬取用戶未公開(kāi)的信息,如個(gè)人私密相冊(cè)照片等,都是屬于侵犯用戶的個(gè)人隱私的,不要覺(jué)得自己技術(shù)玩得溜,這些可都是違法行為。

第三、反不正當(dāng)競(jìng)爭(zhēng)法中明確保護(hù)的數(shù)據(jù)

許多網(wǎng)站中的數(shù)據(jù)系由用戶生成,且該等數(shù)據(jù)和內(nèi)容系原告網(wǎng)站的主要競(jìng)爭(zhēng)力來(lái)源。如“XX點(diǎn)評(píng)”、“X團(tuán)”上面的店鋪評(píng)價(jià)、評(píng)論等信息,“X程網(wǎng)”上面的關(guān)于酒店的評(píng)價(jià)評(píng)論等信息等。

那么,未經(jīng)允許,爬取其他網(wǎng)站的核心數(shù)據(jù),很明顯并沒(méi)有遵守《反不正當(dāng)競(jìng)爭(zhēng)法》中規(guī)定的自愿、平等、公平、誠(chéng)實(shí)信用的原則。

在“XX點(diǎn)評(píng)”訴“X度”不正當(dāng)競(jìng)爭(zhēng)案件、以及“X浪微博”訴“X脈脈”不正當(dāng)競(jìng)爭(zhēng)等案件中,法院都認(rèn)定被告未經(jīng)許可抓取、使用原告網(wǎng)站中的數(shù)據(jù)的行為,違反了誠(chéng)實(shí)信用原則及公認(rèn)的道德,損害了互聯(lián)網(wǎng)的市場(chǎng)競(jìng)爭(zhēng)秩序,損害了原告的競(jìng)爭(zhēng)優(yōu)勢(shì),從而構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。

因此,如果抓取XX點(diǎn)評(píng)、X博、X瓣電影、X乎等UGC模式的網(wǎng)站上用戶發(fā)布的信息,并在自己的產(chǎn)品或者服務(wù)中發(fā)布、使用該等信息,則有較大的風(fēng)險(xiǎn)構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。

怎么爬數(shù)據(jù)算犯法?

如果是爬取公開(kāi)的數(shù)據(jù),通常不會(huì)被認(rèn)為是侵權(quán)。Google、百度等搜索引擎都是這么爬取的。

那么,到底怎么爬數(shù)據(jù)是有可能觸犯法律的呢,主要考慮是否涉及以下兩種行為:

沒(méi)有遵守網(wǎng)站Robots協(xié)議

Robots協(xié)議是技術(shù)界為了解決爬取方和被爬取方之間通過(guò)計(jì)算機(jī)程序完成關(guān)于爬取的意愿溝通而產(chǎn)生的一種機(jī)制。

通過(guò)技術(shù)手段,繞過(guò)防護(hù)措施,抓取數(shù)據(jù)

由于爬蟲(chóng)的批量訪問(wèn)會(huì)給網(wǎng)站帶來(lái)巨大的壓力和負(fù)擔(dān),因此許多網(wǎng)站經(jīng)營(yíng)者會(huì)采取技術(shù)手段,以阻止爬蟲(chóng)批量獲取自己網(wǎng)站信息。

所以,很多爬蟲(chóng)工具為了爬取數(shù)據(jù),會(huì)想辦法通過(guò)各種手段繞過(guò)防護(hù)措施,但是,這種行為也是會(huì)觸犯法律的。

抓回來(lái)的數(shù)據(jù)怎么用會(huì)犯法?

很多公司開(kāi)發(fā)的爬蟲(chóng)遵守了Robots協(xié)議,也沒(méi)有爬取不該爬取的數(shù)據(jù),難道這樣獲取到的數(shù)據(jù)就可以隨便使用了嗎?其實(shí)也不是,如果使用不當(dāng),也會(huì)觸犯法律的。

比如通過(guò)爬蟲(chóng)抓取到的數(shù)據(jù)進(jìn)行盈利、損害他人利益、造假、誹謗等都是可能觸犯法律的。

此外,未經(jīng)被收集者同意,即使是將合法收集的公民個(gè)人信息向他人提供的,也屬于刑法第二百五十三條之一規(guī)定的“提供公民個(gè)人信息”,可能構(gòu)成犯罪。

04.我們?nèi)绾畏乐箓€(gè)人信息被泄露?

在科技飛速發(fā)展的今天,人們開(kāi)始追求各種方便快捷的方式生活,但是,在方便快捷的背后,個(gè)人信息安全也不能忽視。瀏覽器、社交平臺(tái)等等都有可能出現(xiàn)隱私泄露。

個(gè)人隱私泄露有著很嚴(yán)重的安全隱患!如何防止個(gè)人信息泄露?快來(lái)看防范小妙招:

  1. 盡量不使用公共場(chǎng)所的 WiFi。
  2. 盡量訪問(wèn)具備安全協(xié)議的網(wǎng)址。建議盡量登錄網(wǎng)址前綴中帶有“https:”字樣的網(wǎng)站,具備這種安全協(xié)議的網(wǎng)址的安全性較高。
  3. 不同軟件盡量不要使用同一組賬號(hào)密碼。
  4. 妥善處置快遞單等包含個(gè)人信息的單據(jù)。對(duì)于含有姓名、電話、住址等信息的單據(jù)憑證要及時(shí)銷毀,不經(jīng)意扔掉也可能導(dǎo)致個(gè)人信息泄露。
  5. 身份證、戶口本等有個(gè)人信息的證件,一定要保存好。
  6. 手機(jī)、電腦等都需要安裝安全軟件,每天至少進(jìn)行一次對(duì)木馬程序的掃描,尤其在使用重要賬號(hào)密碼前。每周定期進(jìn)行一次病毒查殺,并及時(shí)更新安全軟件。
  7. 不少人熱衷于曬地點(diǎn)、曬自拍照,還有家長(zhǎng)喜歡曬孩子照片等。這種手機(jī)簽到可能被別有用心的人盯上??蓞⒖肌?1歲日本女星慘遭猥褻,只因自拍瞳孔倒影暴露住址?| 一張照片是怎么出賣你的!》
  8. 一方面暴露了個(gè)人隱私,比如姓名、工作單位、家庭住址等,另一方面可能招致犯罪,在網(wǎng)上使用手機(jī)簽到時(shí),需要謹(jǐn)慎。

網(wǎng)頁(yè)題目:大數(shù)據(jù)公司又被查,爬蟲(chóng)程序員在內(nèi)20余人被抓!
網(wǎng)站網(wǎng)址:http://www.bm7419.com/news/99182.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供用戶體驗(yàn)、移動(dòng)網(wǎng)站建設(shè)網(wǎng)站維護(hù)品牌網(wǎng)站設(shè)計(jì)、網(wǎng)站收錄、網(wǎng)站設(shè)計(jì)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

h5響應(yīng)式網(wǎng)站建設(shè)