python3正則模塊re的使用方法詳解

2020-02-15 21:15:14

字體：大中小

來源：轉載

供稿：網友

一、正則

1.正則表達式定義

正則就是用一些具有特殊含義的符號組合到一起（稱為正則表達式）來描述字符或者字符串的方法。或者說：正則就是用來描述一類事物的規則。（在Python中）它內嵌在Python中，并通過 re 模塊實現。正則表達式模式被編譯成一系列的字節碼，然后由用 C 編寫的匹配引擎執行。

2.目的和特點

給定一個正則表達式和另一個字符串，我們可以達到如下的目的：

給定的字符串是否符合正則表達式的過濾邏輯（稱作“匹配”）：

可以通過正則表達式，從字符串中獲取我們想要的特定部分。

正則表達式的特點是：

靈活性、邏輯性和功能性非常強；

可以迅速地用極簡單的方式達到字符串的復雜控制。

由于正則表達式主要應用對象是文本，因此它在各種文本編輯器場合都有應用，小到著名編輯器EditPlus，大到Microsoft Word、Visual Studio等大型編輯器，都可以使用正則表達式來處理文本內容。

3.常用的正則表達式

4.貪婪模式與非貪婪模式

正則表達式通常用于在文本中查找匹配的字符串。Python里數量詞默認是貪婪的（在少數語言里也可能是默認非貪婪），總是嘗試匹配盡可能多的字符；非貪婪的則相反，總是嘗試匹配盡可能少的字符。例如：正則表達式"ab*“如果用于查找"abbbc”，將找到"abbb"。而如果使用非貪婪的數量詞"ab*?"，將找到"a"。

5.反斜杠

與大多數編程語言相同，正則表達式里使用"“作為轉義字符，這就可能造成反斜杠困擾。假如你需要匹配文本中的字符”"，那么使用編程語言表示的正則表達式里將需要4個反斜杠"http://"：前兩個和后兩個分別用于在編程語言里轉義成反斜杠，轉換成兩個反斜杠后再在正則表達式里轉義成一個反斜杠。Python里的原生字符串很好地解決了這個問題，這個例子中的正則表達式可以使用r"/“表示。同樣，匹配一個數字的”/d"可以寫成r"/d"。有了原生字符串，你再也不用擔心是不是漏寫了反斜杠，寫出來的表達式也更直觀。

二、python3正則模塊re

1.match

match(string[, pos[, endpos]]) | re.match(pattern, string[, flags]):

Match對象是一次匹配的結果，包含了很多關于此次匹配的信息，可以使用Match提供的可讀屬性或方法來獲取這些信息。

屬性：

string: 匹配時使用的文本。
re: 匹配時使用的Pattern對象。
pos: 文本中正則表達式開始搜索的索引。值與Pattern.match()和Pattern.seach()方法的同名參數相同。
endpos: 文本中正則表達式結束搜索的索引。值與Pattern.match()和Pattern.seach()方法的同名參數相同。

上一篇：利用python中集合的唯一性實現去重

下一篇：Python連接Oracle之環境配置、實例代碼及報錯解決方法詳解