爬蟲(chóng)中cookies是什么意思

這篇文章將為大家詳細(xì)講解有關(guān)爬蟲(chóng)中cookies是什么意思,小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。

為開(kāi)平等地區(qū)用戶提供了全套網(wǎng)頁(yè)設(shè)計(jì)制作服務(wù),及開(kāi)平網(wǎng)站建設(shè)行業(yè)解決方案。主營(yíng)業(yè)務(wù)為成都做網(wǎng)站、成都網(wǎng)站建設(shè)、開(kāi)平網(wǎng)站設(shè)計(jì),以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠(chéng)的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會(huì)得到認(rèn)可,從而選擇與我們長(zhǎng)期合作。這樣,我們也可以走得更遠(yuǎn)!

cookies簡(jiǎn)介

cookie是什么?

Cookie,有時(shí)也用其復(fù)數(shù)形式 Cookies,指某些網(wǎng)站為了辨別用戶身份、進(jìn)行 session 跟蹤而儲(chǔ)存在用戶本地終端上的數(shù)據(jù)(通常經(jīng)過(guò)加密)。定義于 RFC2109 和 2965 中的都已廢棄,最新取代的規(guī)范是 RFC6265[1]。Cookie其實(shí)就是瀏覽器緩存。

cookie的生命周期

  1. 會(huì)話cookie:沒(méi)有設(shè)置expires(是個(gè)時(shí)間戳)的,瀏覽器(session)關(guān)閉后,就自動(dòng)失效

  2. 持久cookie:設(shè)置了expires的,根據(jù)設(shè)置的失效時(shí)間決定(expires時(shí)間是可以進(jìn)行修改的, 但是很多網(wǎng)站會(huì)做防止修改的設(shè)置)

cookie具有的屬性

  • name:為一個(gè)cookie的名稱。

  • value:為一個(gè)cookie的值。

  • domain:為可以訪問(wèn)此cookie的域名,譬如www.baidu.com:baidu.com就是頂級(jí)域名

域名的劃分:http://aaa.bbb.secode.first.com,每一個(gè)點(diǎn)劃分為一個(gè)域名,域名從后向前一次為頂級(jí)、一級(jí)、二級(jí)等。

  1. 非頂級(jí)域名,如二級(jí)域名或者三級(jí)域名,設(shè)置的cookie的domain只能為頂級(jí)域名或者二級(jí)域名或者三級(jí)域名本身,不能設(shè)置其他二級(jí)域名的cookie,否則cookie無(wú)法生成。

  2. 頂級(jí)域名只能設(shè)置domain為頂級(jí)域名,不能設(shè)置為二級(jí)域名或者三級(jí)域名,否則cookie無(wú)法生成。

  3. 二級(jí)域名能讀取設(shè)置了domain為頂級(jí)域名或者自身的cookie,不能讀取其他二級(jí)域名domain的cookie。所以要想cookie在多個(gè)二級(jí)域名中共享,需要設(shè)置domain為頂級(jí)域名,這樣就可以在所有二級(jí)域名里面或者到這個(gè)cookie的值了。

  4. 頂級(jí)域名只能獲取到domain設(shè)置為頂級(jí)域名的cookie,其他domain設(shè)置為二級(jí)域名的無(wú)法獲取。

總結(jié)一下:域名具有繼承性,只能使用其自身或其父輩的域名,不能使用其子域名或者兄弟域名。例如:
a.b.c.d.com
a.b.x.d.com
c可以使用domain為d.com或者c.d.com的域名cookie,不能使用x.d.com的域名或者b.c.d.com,這里大家做好了解就行了,碰到這種情況知道有這么個(gè)情況就行,一般我們需要關(guān)注的很少。

  • path:為可以訪問(wèn)此cookie的頁(yè)面路徑。 比如www.jianshu.com/u/680e0e38ddc9,path就是/u/680e0e38ddc9,那么只有/u/680e0e38ddc9路徑下的頁(yè)面可以讀取此cookie。

  • expires/Max-Age :為此cookie超時(shí)時(shí)間。若設(shè)置其值為一個(gè)時(shí)間(一個(gè)時(shí)間戳),那么當(dāng)?shù)竭_(dá)此時(shí)間后,此cookie失效。
    不設(shè)置的話默認(rèn)值是Session,意思是cookie會(huì)和session一起失效。
    當(dāng)瀏覽器關(guān)閉(不是瀏覽器標(biāo)簽頁(yè),而是整個(gè)瀏覽器) 后,此cookie失效。

  • Size: 此cookie大小。

  • http: cookie的httponly屬性。若此屬性為true,則只有在http請(qǐng)求頭中會(huì)帶有此cookie的信息,
    而不能通過(guò)document.cookie來(lái)訪問(wèn)此cookie。

  • secure : boolean型,默認(rèn)為false,設(shè)置是否只能通過(guò)https來(lái)傳遞此cookie

我們做爬蟲(chóng)重點(diǎn)關(guān)注name和value。

cookie應(yīng)用

  1. 以任何方式,如瀏覽器、selenium、封包方式等,獲得對(duì)應(yīng)的cookies

  2. 將cookies保存,可以是在內(nèi)存、文件、數(shù)據(jù)庫(kù)等

  3. 在你想要應(yīng)用已有的cookie的 項(xiàng)目 中,已各種方式:文件、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)等,獲取到對(duì)應(yīng)的cookie,然后進(jìn)行設(shè)置,接著就可以訪問(wèn)對(duì)應(yīng)的資源了

實(shí)際應(yīng)用:

  1. 有幾臺(tái)專門的服務(wù)器,進(jìn)行登錄操作,所有賬號(hào)保存在數(shù)據(jù)庫(kù),由這些專門登錄的服務(wù)器進(jìn)行登錄操作,登錄成功后,保存cookies到數(shù)據(jù)庫(kù)

  2. 有專門的應(yīng)用服務(wù)器,從數(shù)據(jù)庫(kù)讀取cookies,進(jìn)行相應(yīng)的業(yè)務(wù)操作,這種服務(wù)器不處理登錄操作

關(guān)于“爬蟲(chóng)中cookies是什么意思”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),請(qǐng)把它分享出去讓更多的人看到。

名稱欄目:爬蟲(chóng)中cookies是什么意思
標(biāo)題網(wǎng)址:http://bm7419.com/article8/igoeop.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供做網(wǎng)站、網(wǎng)站設(shè)計(jì)公司網(wǎng)站改版、全網(wǎng)營(yíng)銷推廣網(wǎng)站設(shè)計(jì)、網(wǎng)站維護(hù)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)公司