如何使用UserAgent和代理IP隱藏身份

這篇文章給大家介紹如何使用User Agent和代理IP隱藏身份,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

10年積累的成都網(wǎng)站建設(shè)、做網(wǎng)站經(jīng)驗(yàn),可以快速應(yīng)對客戶對網(wǎng)站的新想法和需求。提供各種問題對應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認(rèn)識你,你也不認(rèn)識我。但先網(wǎng)站設(shè)計(jì)后付款的網(wǎng)站建設(shè)流程,更有萬載免費(fèi)網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。

一、為何要設(shè)置User Agent

    有一些網(wǎng)站不喜歡被爬蟲程序訪問,所以會檢測連接對象,如果是爬蟲程序,也就是非人點(diǎn)擊訪問,它就會不讓你繼續(xù)訪問,所以為了要讓程序可以正常運(yùn)行,需要隱藏自己的爬蟲程序的身份。此時,我們就可以通過設(shè)置User Agent的來達(dá)到隱藏身份的目的,User Agent的中文名為用戶代理,簡稱UA。

    User Agent存放于Headers中,服務(wù)器就是通過查看Headers中的User Agent來判斷是誰在訪問。在Python中,如果不設(shè)置User Agent,程序?qū)⑹褂媚J(rèn)的參數(shù),那么這個User Agent就會有Python的字樣,如果服務(wù)器檢查User Agent,那么沒有設(shè)置User Agent的Python程序?qū)o法正常訪問網(wǎng)站。

    Python允許我們修改這個User Agent來模擬瀏覽器訪問,它的強(qiáng)大毋庸置疑。

二、常見的User Agent

1.Android

Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.166 Safari/535.19

Mozilla/5.0 (Linux; U; Android 4.0.4; en-gb; GT-I9300 Build/IMM76D) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30

Mozilla/5.0 (Linux; U; Android 2.2; en-gb; GT-P1000 Build/FROYO) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1

2.Firefox

Mozilla/5.0 (Windows NT 6.2; WOW64; rv:21.0) Gecko/20100101 Firefox/21.0

Mozilla/5.0 (Android; Mobile; rv:14.0) Gecko/14.0 Firefox/14.0

3.Google Chrome

Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.94 Safari/537.36

Mozilla/5.0 (Linux; Android 4.0.4; Galaxy Nexus Build/IMM76B) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.133 Mobile Safari/535.19

4.iOS

Mozilla/5.0 (iPad; CPU OS 5_0 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A334 Safari/7534.48.3

Mozilla/5.0 (iPod; U; CPU like Mac OS X; en) AppleWebKit/420.1 (KHTML, like Gecko) Version/3.0 Mobile/3A101a Safari/419.3

    上面列舉了Andriod、Firefox、Google Chrome、iOS的一些User Agent,直接copy就能用。

四、IP代理的使用

1.為何使用IP代理

    UA已經(jīng)設(shè)置好了,但是還應(yīng)該考慮一個問題,程序的運(yùn)行速度是很快的,如果我們利用一個爬蟲程序在網(wǎng)站爬取東西,一個固定IP的訪問頻率就會很高,這不符合人為操作的標(biāo)準(zhǔn),因?yàn)槿瞬僮鞑豢赡茉趲譵s內(nèi),進(jìn)行如此頻繁的訪問。所以一些網(wǎng)站會設(shè)置一個IP訪問頻率的閾值,如果一個IP訪問頻率超過這個閾值,說明這個不是人在訪問,而是一個爬蟲程序。

.代理IP選取

    在寫代碼之前,先在代理IP網(wǎng)站選好一個IP地址,這里推介億牛云代理。他們家產(chǎn)品比較齊全,api接口調(diào)用和動態(tài)轉(zhuǎn)發(fā)調(diào)用都支持,而且代理是自營線路,電信專線。我穩(wěn)定性,可用性,速度嗎,延遲都是非常好的。這里就展示下他們的動態(tài)轉(zhuǎn)發(fā)代理進(jìn)行示例,動態(tài)轉(zhuǎn)發(fā)就是他們會提供一個固定的ip地址給你,,直接配置到程序里面就可以使用,不需要自己去調(diào)用ip,也不需要自己管理ip池,使用起來超級方便簡單,對于懶人來說絕對是最好的選擇。

代碼示例,這里是以python為例子

1、Python?

requests

       #! -*- encoding:utf-8 -*-

        import requests

        import random

        # 要訪問的目標(biāo)頁面

        targetUrl = "http://httpbin.org/ip"

        # 要訪問的目標(biāo)HTTPS頁面

        # targetUrl = "https://httpbin.org/ip"

        # 代理服務(wù)器

        proxyHost = "t.16yun.cn"

        proxyPort = "31111"

        # 代理隧道驗(yàn)證信息

        proxyUser = "username"

        proxyPass = "password"

        proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {

            "host" : proxyHost,

            "port" : proxyPort,

            "user" : proxyUser,

            "pass" : proxyPass,

        }

        # 設(shè)置 http和https訪問都是用HTTP代理

        proxies = {

            "http"  : proxyMeta,

            "https" : proxyMeta,

        }

        #  設(shè)置IP切換頭

        tunnel = random.randint(1,10000)

        headers = {"Proxy-Tunnel": str(tunnel)}

        resp = requests.get(targetUrl, proxies=proxies, headers=headers)

        print resp.status_code

        print resp.text

關(guān)于如何使用User Agent和代理IP隱藏身份就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

新聞標(biāo)題:如何使用UserAgent和代理IP隱藏身份
新聞來源:http://bm7419.com/article16/ijpsdg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供小程序開發(fā)、品牌網(wǎng)站建設(shè)、商城網(wǎng)站python、品牌網(wǎng)站制作、外貿(mào)網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都做網(wǎng)站