Python3快速入門(七)——Python3正則表達(dá)式-創(chuàng)新互聯(lián)

Python3快速入門(七)——Python3正則表達(dá)式

1、re模塊簡(jiǎn)介

re 模塊提供 Perl 風(fēng)格的正則表達(dá)式模式,使 Python 語(yǔ)言擁有全部的正則表達(dá)式功能。

創(chuàng)新互聯(lián)公司憑借在網(wǎng)站建設(shè)、網(wǎng)站推廣領(lǐng)域領(lǐng)先的技術(shù)能力和多年的行業(yè)經(jīng)驗(yàn),為客戶提供超值的營(yíng)銷型網(wǎng)站建設(shè)服務(wù),我們始終認(rèn)為:好的營(yíng)銷型網(wǎng)站就是好的業(yè)務(wù)員。我們已成功為企業(yè)單位、個(gè)人等客戶提供了網(wǎng)站建設(shè)、網(wǎng)站制作服務(wù),以良好的商業(yè)信譽(yù),完善的服務(wù)及深厚的技術(shù)力量處于同行領(lǐng)先地位。

2、正則表達(dá)式模式

模式字符串使用特殊的語(yǔ)法來(lái)表示一個(gè)正則表達(dá)式:
正則表達(dá)式模式中的字母和數(shù)字匹配同樣的字符串;多數(shù)字母和數(shù)字前加一個(gè)反斜杠時(shí)會(huì)有不同的含義;標(biāo)點(diǎn)符號(hào)通常有特殊的含義,只有被轉(zhuǎn)義時(shí)才匹配自身;反斜杠本身需要使用反斜杠轉(zhuǎn)義。
^匹配字符串的開(kāi)頭
$匹配字符串的末尾
.匹配任意字符,除了換行符,當(dāng)re.DOTALL標(biāo)記被指定時(shí),則可以匹配包括換行符的任意字符。
[...]匹配任意字符,除了換行符,當(dāng)re.DOTALL標(biāo)記被指定時(shí),則可以匹配包括換行符的任意字符。
[^...]匹配任意字符,除了換行符,當(dāng)re.DOTALL標(biāo)記被指定時(shí),則可以匹配包括換行符的任意字符。
re匹配0個(gè)或多個(gè)的表達(dá)式。
re+匹配1個(gè)或多個(gè)的表達(dá)式。
re?匹配0個(gè)或1個(gè)由前面的正則表達(dá)式定義的片段,非貪婪方式
re{ n}匹配n個(gè)前面表達(dá)式。例如,"o{2}"不能匹配"Bob"中的"o",但是能匹配"food"中的兩個(gè)o。
re{ n,}精確匹配n個(gè)前面表達(dá)式。例如,"o{2,}"不能匹配"Bob"中的"o",但能匹配"foooood"中的所有o。"o{1,}"等價(jià)于"o+"。"o{0,}"則等價(jià)于"o
"。
re{ n, m}匹配 n 到 m 次由前面的正則表達(dá)式定義的片段,貪婪方式
a| b匹配a或b
(re)匹配括號(hào)內(nèi)的表達(dá)式,也表示一個(gè)組
(?imx)正則表達(dá)式包含三種可選標(biāo)志:i, m, 或 x 。只影響括號(hào)中的區(qū)域。
(?-imx)正則表達(dá)式關(guān)閉 i, m, 或 x 可選標(biāo)志。只影響括號(hào)中的區(qū)域。
(?imx: re)在括號(hào)中使用i, m, 或 x 可選標(biāo)志
(?-imx: re)在括號(hào)中不使用i, m, 或 x 可選標(biāo)志
(?#...)注釋
(?= re)前向肯定界定符。如果所含正則表達(dá)式,以 ... 表示,在當(dāng)前位置成功匹配時(shí)成功,否則失敗。但一旦所含表達(dá)式已經(jīng)嘗試,匹配引擎根本沒(méi)有提高;模式的剩余部分還要嘗試界定符的右邊。
(?! re)前向否定界定符。與肯定界定符相反;當(dāng)所含表達(dá)式不能在字符串當(dāng)前位置匹配時(shí)成功。
(?> re)匹配的獨(dú)立模式,省去回溯。
\w匹配數(shù)字字母下劃線
\W匹配非數(shù)字字母下劃線
\s匹配任意空白字符,等價(jià)于 [\t\n\r\f]。
\S匹配任意非空字符
\d匹配任意數(shù)字,等價(jià)于 [0-9]。
\D匹配任意非數(shù)字
\A匹配字符串開(kāi)始
\Z匹配字符串結(jié)束,如果是存在換行,只匹配到換行前的結(jié)束字符串。
\z匹配字符串結(jié)束
\G匹配最后匹配完成的位置。
\b匹配一個(gè)單詞邊界,也就是指單詞和空格間的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
\B匹配非單詞邊界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
\n, \t,匹配一個(gè)換行符。匹配一個(gè)制表符
\1...\9匹配第n個(gè)分組的內(nèi)容。
\10匹配第n個(gè)分組的內(nèi)容,如果它經(jīng)匹配。否則指的是八進(jìn)制字符碼的表達(dá)式。

3、正則表達(dá)式實(shí)例

python匹配 "python"
[Pp]ython匹配 "Python" 或 "python"
[aeiou]匹配中括號(hào)內(nèi)的任意一個(gè)字母
[0-9]匹配任何數(shù)字
[a-z]匹配任何小寫字母
[A-Z]匹配任何大寫字母
[a-zA-Z0-9]匹配任何字母及數(shù)字
[^aeiou]匹配除aeiou字母外的所有字符
[^0-9]匹配除數(shù)字外的字符

4、re模塊常用函數(shù)

re.compile(pattern[, flags])
compile 函數(shù)根據(jù)一個(gè)模式字符串和可選的標(biāo)志參數(shù)生成一個(gè)正則表達(dá)式對(duì)象,正在表達(dá)式對(duì)象擁有一系列方法用于正則表達(dá)式匹配和替換。
pattern : 一個(gè)字符串形式的正則表達(dá)式
flags 可選,表示匹配模式,具體參數(shù)為:
re.I 忽略大小寫
re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴于當(dāng)前環(huán)境
re.M 多行模式
re.S 即為' . '并且包括換行符在內(nèi)的任意字符(' . '不包括換行符)
re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴于 Unicode 字符屬性數(shù)據(jù)庫(kù)
re.X 為了增加可讀性,忽略空格和' # '后面的注釋
re.match(pattern, string, flags=0)
嘗試從字符串的起始位置匹配一個(gè)模式,匹配成功返回第一個(gè)匹配的對(duì)象,否則返回None。
pattern匹配的正則表達(dá)式
string要匹配的字符串。
flags標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫,多行匹配等等。
可以使用group(num) 或 groups() 匹配對(duì)象函數(shù)來(lái)獲取匹配表達(dá)式。group() 可以一次輸入多個(gè)組號(hào),在這種情況下它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。
re.search(pattern, string, flags=0)
re.search 掃描整個(gè)字符串并返回第一個(gè)成功的匹配。
匹配成功re.search方法返回一個(gè)匹配的對(duì)象,否則返回None。
可以使用group(num) 或 groups() 匹配對(duì)象函數(shù)來(lái)獲取匹配表達(dá)式。
re.sub(pattern, repl, string, count=0, flags=0)
re.sub用于替換字符串中的匹配項(xiàng)。
pattern : 正則中的模式字符串。
repl : 替換的字符串,也可為一個(gè)函數(shù)。
string : 要被查找替換的原始字符串。
count : 模式匹配后替換的大次數(shù),默認(rèn) 0 表示替換所有的匹配。
flags : 編譯時(shí)用的匹配模式,數(shù)字形式
findall(string[, pos[, endpos]])
在字符串中找到正則表達(dá)式所匹配的所有子串,并返回一個(gè)列表,如果沒(méi)有找到匹配的,則返回空列表。
string?待匹配的字符串。
pos?可選參數(shù),指定字符串的起始位置,默認(rèn)為 0。
endpos?可選參數(shù),指定字符串的結(jié)束位置,默認(rèn)為字符串的長(zhǎng)度。
re.finditer(pattern, string, flags=0)
在字符串中找到正則表達(dá)式所匹配的所有子串,并查找結(jié)果作為一個(gè)迭代器返回。
re.split(pattern, string[, maxsplit=0, flags=0])
split 方法按照能夠匹配的子串將字符串分割后返回列表
pattern匹配的正則表達(dá)式
string要匹配的字符串。
maxsplit分隔次數(shù),maxsplit=1 分隔一次,默認(rèn)為 0,不限制次數(shù)。
flags標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫,多行匹配等等

# -*- coding:utf-8 -*-
import re

# 將匹配的數(shù)字乘于 2
def double(matched):
    value = int(matched.group('value'))
    return str(value * 2)

if __name__ == '__main__':
    phone = "2004-959-559"
    # 返回第一個(gè)匹配的對(duì)象
    groups = re.match("\d+", phone)
    print(groups.group(0))
    # 返回第一個(gè)匹配的對(duì)象
    groups = re.search("\d+", phone)
    print(groups.group(0))
    # 返回匹配的所有對(duì)象的數(shù)組
    groups = re.findall("\d+", phone)
    print(groups)

    num = re.sub(r'\D', "", phone)
    print("Phone:", num)

    s = 'A23G4HFD567'
    print(re.sub('(?P<value>\d+)', double, s))

# output:
# 2004
# 2004
# ['2004', '959', '559']
# Phone: 2004959559
# A46G8HFD1134

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。

網(wǎng)站名稱:Python3快速入門(七)——Python3正則表達(dá)式-創(chuàng)新互聯(lián)
當(dāng)前URL:http://bm7419.com/article48/gooep.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站制作、移動(dòng)網(wǎng)站建設(shè)、云服務(wù)器、用戶體驗(yàn)、定制網(wǎng)站App設(shè)計(jì)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

h5響應(yīng)式網(wǎng)站建設(shè)