Python中的正則表達(dá)式是什么及怎么使用

這篇文章主要介紹了Python中的正則表達(dá)式是什么及怎么使用的相關(guān)知識(shí),內(nèi)容詳細(xì)易懂,操作簡(jiǎn)單快捷,具有一定借鑒價(jià)值,相信大家閱讀完這篇Python中的正則表達(dá)式是什么及怎么使用文章都會(huì)有所收獲,下面我們一起來看看吧。

創(chuàng)新互聯(lián)建站-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價(jià)比歙縣網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式歙縣網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋歙縣地區(qū)。費(fèi)用合理售后完善,十載實(shí)體公司更值得信賴。

    正則表達(dá)式是什么?

    正則表達(dá)式,又稱規(guī)則表達(dá)式,(英語:Regular Expression,在代碼中常簡(jiǎn)寫為 regex、regexp 或 RE),它是計(jì)算機(jī)科學(xué)的一個(gè)概念。正則表達(dá)式通常被用來檢索、替換那些符合某個(gè)模式的文本。 許多程序設(shè)計(jì)語言都支持利用正則表達(dá)式進(jìn)行字符串操作。例如在 Perl 中內(nèi)建了一個(gè)功能強(qiáng)大的正則表達(dá)式引擎。正則表達(dá)式這個(gè)概念最初是由 Unix 中的工具軟件普及開的。正則表達(dá)式是對(duì)字符串(包括普通字符(例如,a 到 z 之間的字母)和特殊字符(稱為"元字符"))操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個(gè)"規(guī)則字符串",這個(gè)"規(guī)則字符串"用來表達(dá)對(duì)字符串的一種過濾邏輯。正則表達(dá)式是一種文本模式,模式描述在搜索文本時(shí)要匹配的一個(gè)或多個(gè)字符串。

    1.實(shí)例引入

    說了一大堆廢話,大家可能還是云里霧里的,我們通過實(shí)例來說明一下,我們可以用正則表達(dá)式測(cè)試工具,或者python都可以,首先,我們輸入一段文本。

    hello,my name is Tina,my phone number is 123456 and my web is http://tina.com.

                                   [a-zA-z]+://[^\s]*

    我們就可以獲取網(wǎng)頁鏈接,也就是文本中的url,是不是很神奇?

    這是因?yàn)樗凶约旱钠ヅ湟?guī)則,部分如下。

    模式描述
    .任意字符
    *0個(gè)或者多個(gè)表達(dá)式
    +一個(gè)或者多個(gè)表達(dá)式

    關(guān)于更多的匹配規(guī)則可自行查閱。

    ?,*,+,\d,\w都是等價(jià)字符

    ?等價(jià)于匹配長度{0,1}

    *等價(jià)于匹配長度{0,}

    +等價(jià)于匹配長度{1,}

    \d 等價(jià)于[0-9]

    \D 等價(jià)于[^0-9]

    \w 等價(jià)于[A-Za-z_0-9]

    \W 等價(jià)于[^A-Za-z_0-9]

    2.match()

    這里介紹一個(gè)常用的匹配方法——match(),向他傳入要匹配的字符串以及正則表達(dá)式,就可以檢測(cè)這個(gè)正則表達(dá)式是否匹配字符串。

    匹配目標(biāo)
    res = re.match('hello\s(\d+)sword')
    貪婪匹配
    res = re.match('hello.*(\d+)sword')

    3.findall()

    我們最常用的就是這個(gè),我們看看這個(gè)是如何使用的。

    import re
     
    useData = str(input('請(qǐng)輸入字符串?dāng)?shù)據(jù):'))
     
    '''
    匹配字符串中的數(shù)字,+是匹配前面的子表達(dá)式一次或多次
    '''
    digital = re.findall('\d+',useData)
     
    print(digital)

    我們看看運(yùn)行結(jié)果

    Python中的正則表達(dá)式是什么及怎么使用

    findall()函數(shù)是返回所有匹配到的字符串,返回值的數(shù)據(jù)類型為列表。

    常用符號(hào)

    我們?cè)賮碚f說正則表達(dá)式的常用符號(hào)吧。

    “.”字符為匹配任意單個(gè)字符。

    “\”字符為轉(zhuǎn)義字符。

    “[…]”為字符集。

    “(.*?)” 是python爬蟲最常用的一個(gè)字符,叫貪心算法,可以匹配任意的字符。

    下面我們看一個(gè)示例代碼。

    import re
     
    a=‘xxixxjshdxxlovexxsfhxxpythonxx'
     
    data=re.findall(‘xx(.*?)xx')
     
    print(data)

    我們運(yùn)行一下,看下效果。

    運(yùn)行結(jié)果
    [‘I’ ,‘love’,‘python’]

    特殊字符

    所謂特殊字符,就是一些有特殊含義的字符,比如講 runoo*b 中的 ,簡(jiǎn)單的說就是表示任何字符串的意思。如果要查找字符串中的 * 符號(hào),則需要對(duì) * 進(jìn)行轉(zhuǎn)義,即在其前加一個(gè) \,runo*ob 匹配字符串 runo\*ob。

    許多元字符要求在試圖匹配它們時(shí)特別對(duì)待。若要匹配這些特殊字符,必須首先使字符"轉(zhuǎn)義",即,將反斜杠字符\ 放在它們前面。下表列出了正則表達(dá)式中的特殊字符:

    特別字符描述
    $

    匹配輸入字符串的結(jié)尾位置。如果設(shè)置了 RegExp 對(duì)象的 Multiline 屬性,則 $ 也匹配 ‘\n’ 或 ‘\r’。要匹配 $ 字符本身,請(qǐng)使用 $。

    ()標(biāo)記一個(gè)子表達(dá)式的開始和結(jié)束位置。子表達(dá)式可以獲取供以后使用。要匹配這些字符,請(qǐng)使用 ( 和 )。
    *匹配前面的子表達(dá)式零次或多次。要匹配 * 字符,請(qǐng)使用 *。
    +匹配前面的子表達(dá)式一次或多次。要匹配 + 字符,請(qǐng)使用 +。
    .匹配除換行符 \n 之外的任何單字符。要匹配 . ,請(qǐng)使用 . 。

    概念說了一大堆,大家可能也記不住,我直接說幾個(gè)案例,大家就能明白其他的道理。

    這是某網(wǎng)的HTML,部分片段如下:

    <span class=“price”>§<i>123</i></span>
     
    <span class=“price”>§<i>133</i></span>
     
    <span class=“price”>§<i>156</i></span>
     
    <span class=“price”>§<i>189</i></span>

    大家會(huì)發(fā)現(xiàn)只有中間的一段不一樣,而不一樣的數(shù)據(jù)就是我們想要的,我們?cè)趺从谜齽t表達(dá)式提取出來呢.

    <span class=“price”>§<i>(.*?)</i></span>

    就可以了,我們看看效果吧。

    123
    133
    156
    189

    關(guān)于“Python中的正則表達(dá)式是什么及怎么使用”這篇文章的內(nèi)容就介紹到這里,感謝各位的閱讀!相信大家對(duì)“Python中的正則表達(dá)式是什么及怎么使用”知識(shí)都有一定的了解,大家如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

    本文名稱:Python中的正則表達(dá)式是什么及怎么使用
    標(biāo)題來源:http://bm7419.com/article6/gegiog.html

    成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站收錄、網(wǎng)站排名、手機(jī)網(wǎng)站建設(shè)、標(biāo)簽優(yōu)化移動(dòng)網(wǎng)站建設(shè)、搜索引擎優(yōu)化

    廣告

    聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

    外貿(mào)網(wǎng)站制作