什么是Python爬蟲爬取資料時(shí)遇到的cookie-創(chuàng)新互聯(lián)

創(chuàng)新互聯(lián)www.cdcxhl.cn八線動(dòng)態(tài)BGP香港云服務(wù)器提供商,新人活動(dòng)買多久送多久,劃算不套路!

平陽網(wǎng)站建設(shè)公司創(chuàng)新互聯(lián)建站,平陽網(wǎng)站設(shè)計(jì)制作,有大型網(wǎng)站制作公司豐富經(jīng)驗(yàn)。已為平陽數(shù)千家提供企業(yè)網(wǎng)站建設(shè)服務(wù)。企業(yè)網(wǎng)站搭建\成都外貿(mào)網(wǎng)站制作要多少錢,請(qǐng)找那個(gè)售后服務(wù)好的平陽做網(wǎng)站的公司定做!

什么是Python爬蟲爬取資料時(shí)遇到的cookie?很多新手對(duì)此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。

cookie 的由來

大家都知道HTTP協(xié)議是無狀態(tài)的。

無狀態(tài)的意思是每次請(qǐng)求都是獨(dú)立的,它的執(zhí)行情況和結(jié)果與前面的請(qǐng)求和之后的請(qǐng)求都無直接關(guān)系,

它不會(huì)受前面的請(qǐng)求響應(yīng)情況直接影響,也不會(huì)直接影響后面的請(qǐng)求響應(yīng)情況。

一句有意思的話來描述就是人生只如初見,對(duì)服務(wù)器來說,每次的請(qǐng)求都是全新的。

狀態(tài)可以理解為客戶端和服務(wù)器在某次會(huì)話中產(chǎn)生的數(shù)據(jù),那無狀態(tài)的就以為這些數(shù)據(jù)不會(huì)被保留。

會(huì)話中產(chǎn)生的數(shù)據(jù)又是我們需要保存的,也就是說要“保持狀態(tài)”。因此Cookie就是在這樣一個(gè)場(chǎng)景下誕生。

cookie 定義

Cookie具體指的是一段小信息,它是服務(wù)器發(fā)送出來存儲(chǔ)在瀏覽器上的一組組鍵值對(duì),

下次訪問服務(wù)器時(shí)瀏覽器會(huì)自動(dòng)攜帶這些鍵值對(duì),以便服務(wù)器提取有用信息。

1. 由服務(wù)器讓瀏覽器進(jìn)行設(shè)置的

2. 瀏覽器保存在瀏覽器本地

3. 下次訪問時(shí)自動(dòng)攜帶

cookie的工作原理是:由服務(wù)器產(chǎn)生內(nèi)容,瀏覽器收到請(qǐng)求后保存在本地;當(dāng)瀏覽器再次訪問時(shí),

瀏覽器會(huì)自動(dòng)帶上Cookie,這樣服務(wù)器就能通過Cookie的內(nèi)容來判斷這個(gè)是“誰”了。

簡單的來說:cookie就是保存在瀏覽器本地上的一組組鍵值對(duì)。

cookie 簡單應(yīng)用

1. 登錄(只是cookie一種應(yīng)用)

2. 保存瀏覽習(xí)慣 如:分頁瀏覽器,顯示數(shù)據(jù)條數(shù)(只是cookie一種應(yīng)用)

3. 簡單的投票 計(jì)數(shù)(只是cookie一種應(yīng)用)

當(dāng)我們關(guān)閉cookie的時(shí),登錄博客園效果

什么是Python爬蟲爬取資料時(shí)遇到的cookie

什么是Python爬蟲爬取資料時(shí)遇到的cookie

查看cookie

什么是Python爬蟲爬取資料時(shí)遇到的cookie

什么是Python爬蟲爬取資料時(shí)遇到的cookie

什么是Python爬蟲爬取資料時(shí)遇到的cookie

cookie設(shè)置

獲取Cookie

request.COOKIES['key']
request.get_signed_cookie('key', default=RAISE_ERROR, salt='', max_age=None)
get_signed_cookie方法的參數(shù):
- default: 默認(rèn)值
- salt: 加密鹽
- max_age: 后臺(tái)控制過期時(shí)間

設(shè)置Cookie

rep = HttpResponse(...)
rep = render(request, ...)
rep.set_cookie(key,value,...)
rep.set_signed_cookie(key,value,salt='加密鹽',...)

參數(shù):

- key, 鍵
- value='', 值
- max_age=None, 超時(shí)時(shí)間
- expires=None, 超時(shí)時(shí)間(IE requires expires, so set it if hasn't been already.)
- path='/', Cookie生效的路徑,/ 表示根路徑,特殊的:根路徑的cookie可以被任何url的頁面訪問
- domain=None, Cookie生效的域名
- secure=False, https傳輸
- httponly=False 只能http協(xié)議傳輸,無法被JavaScript獲?。ú皇墙^對(duì),底層抓包可以獲取到也可以被覆蓋)

刪除Cookie

什么是Python爬蟲爬取資料時(shí)遇到的cookie

def logout(request):
    rep = redirect("/login/")
    rep.delete_cookie("user")  # 刪除用戶瀏覽器上之前設(shè)置的user的cookie值
    return rep

簡單的創(chuàng)建一個(gè)django項(xiàng)目,使用cookie完成用戶登錄狀態(tài)的效驗(yàn)

1.login.html

<!DOCTYPE html>
<html>
<head>
    <meta charset="UTF-8">
    <meta http-equiv="x-ua-compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1">
    <title>登錄</title>
</head>
<body>
<form action="" method="post">
{{% csrf_token %}}
    <p>
        用戶名: <input type="text" name="username">
    </p>
    <p>
        密碼: <input type="password" name="pwd">
    </p>
    <p>{{ error }}</p>
    <button>提交</button>
</form>
</body>
</html>

2.views.py

from django.views import View                        #導(dǎo)入基于類的視圖模塊
from django.shortcuts import render, redirect, HttpResponse#導(dǎo)入響應(yīng)三劍客
class Login(View):                                   #登錄邏輯視圖函數(shù)
    def get(self, request, *args, **kwargs):         #處理get請(qǐng)求方法
        return render(request, 'login.html')         #如果是get請(qǐng)求(頁面刷新等操作),還是登錄頁面
    def post(self, request, *args, **kwargs):        #處理post請(qǐng)求方法
        username = request.POST.get('username')      #form表單提交的賬戶
        pwd = request.POST.get('pwd')                #form表單提交的密碼
        if username == 'gkf' and pwd == '318':       #賬戶密碼簡單校驗(yàn)
            url = request.GET.get('return_url')      #獲取return_url,后面的路徑信息
            if url:                                  #如果有路徑信息
                ret = redirect(url)                  #重定向要訪問的路徑
            else:
                ret = redirect('/index/')            #如果沒有,默認(rèn)重定向index頁面
            ret.set_cookie('is_login', '1')          #利用cookie標(biāo)識(shí)登錄狀態(tài)
            return ret                               #響應(yīng)請(qǐng)求
        return render(request, 'login.html', {'error': '用戶名或密碼錯(cuò)誤'})#密碼賬戶錯(cuò)誤,重定向login.html并提示
    
def login_required(func):                           #裝飾器函數(shù),用來判斷,訪客登錄狀態(tài)
    def inner(request, *args, **kwargs):
        is_login = request.COOKIES.get('is_login')  #獲取is_login的狀態(tài)值
        url = request.path_info                     #訪問頁面的路徑信息
        if is_login != '1':                         #如果狀態(tài)值不為1表示未登錄
            return redirect('/login/?return_url={}'.format(url))#返會(huì)login頁面,并把之前訪問頁面信息,拼接在路徑后面
        ret = func(request, *args, **kwargs)        #如果狀態(tài)值是1,執(zhí)行視圖函數(shù)
        return ret                                  #響應(yīng)請(qǐng)求
    return inner
@login_required                                     #判斷登錄狀態(tài)裝飾器
def index(request):                                 #處理index路由請(qǐng)求的視圖函數(shù)
    return HttpResponse('首頁')                     #簡單模擬首頁
@login_required                                    #判斷登錄狀態(tài)裝飾器
def home(request):                                 #處理home路由請(qǐng)求的視圖函數(shù)
    return HttpResponse('home')                    # #簡單模擬home頁

密碼賬戶錯(cuò)誤登錄失敗

什么是Python爬蟲爬取資料時(shí)遇到的cookie

訪問home也 登錄成功跳轉(zhuǎn)home頁面

什么是Python爬蟲爬取資料時(shí)遇到的cookie

直接從login頁面直接登錄,默認(rèn)返回index頁面

什么是Python爬蟲爬取資料時(shí)遇到的cookie

看完上述內(nèi)容是否對(duì)您有幫助呢?如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章,請(qǐng)關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道,感謝您對(duì)創(chuàng)新互聯(lián)的支持。

分享標(biāo)題:什么是Python爬蟲爬取資料時(shí)遇到的cookie-創(chuàng)新互聯(lián)
網(wǎng)站網(wǎng)址:http://bm7419.com/article22/dseojc.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供搜索引擎優(yōu)化虛擬主機(jī)、網(wǎng)頁設(shè)計(jì)公司品牌網(wǎng)站建設(shè)、營銷型網(wǎng)站建設(shè)網(wǎng)站營銷

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

成都定制網(wǎng)站網(wǎng)頁設(shè)計(jì)