Python原始字符串(raw strings)用法實例

2020-02-23 06:04:54

字體：大中小

來源：轉載

供稿：網友

本文實例講述了Python原始字符串(raw strings)用法，分享給大家供大家參考。具體如下：

Python原始字符串的產生正是由于有正則表達式的存在。原因是ASCII 字符和正則表達式特殊字符間所產生的沖突。比如，特殊符號“/b”在ASCII 字符中代表退格鍵，但同時“/b”也是一個正則表達式的特殊符號，代表“匹配一個單詞邊界”。

為了讓RE 編譯器把兩個字符“/b”當成你想要表達的字符串，而不是一個退格鍵，你需要用另一個反斜線對它進行轉義，即可以這樣寫：“//b”。

但這樣做會把問題復雜化，特別是當你的正則表達式字符串里有很多特殊字符時，就更容易令人困惑了。一般來說，原始字符串經常被用于簡化正則表達式的復雜程度。

事實上，很多Python 程序員在定義正則表達式時都只使用原始字符串。

下面的例子用來說明退格鍵“/b” 和正則表達式“/b”(包含或不包含原始字符串)之間的區別：
代碼如下:>>> m = re.match('/bblow', 'blow') # backspace, no match #退格鍵,沒有匹配>>> if m is not None: m.group()
...
>>> m = re.match('//bblow', 'blow') # escaped /, now it works #用/轉義后，現在匹配了
>>> if m is not None: m.group()
...
'blow'
>>> m = re.match(r'/bblow', 'blow') # use raw string instead #改用原始字符串>>> if m is not None: m.group()
...
'blow'
你可能注意到我們在正則表達式里使用“/d”，沒用原始字符串，也沒出現什么問題。那是因為ASCII 里沒有對應的特殊字符，所以正則表達式編譯器能夠知道你指的是一個十進制數字。

原始字符串的這個特性讓一些工作變得非常的方便，比如正則表達式的創建。正則表達式是一些定義了高級搜索匹配方式的字符串，通常是由代表字符、分組、匹配信息、變量名和字符類等的特殊符號組成。正則表達式模塊已經包含了足夠用的符號。但當你必須插入額外的符號來使特殊字符表現的像普通字符的時候，你就陷入了“字符數字”的泥潭！這時原始字符串就會派上用場了。

除了原始字符串符號（引號前面的字母“r”）以外，原始字符串跟普通字符串有著幾乎完全相同的語法。這個'r'可以是小寫也可以是大寫，唯一的要求是必須緊靠在第一個引號前。在3個例子的第1個例子里面，我們需要一個反斜杠加一個“n”來而不是一個換行符。
代碼如下:>>> '/n'
'/n'
>>> print '/n'
>>> r'/n'
'//n'
>>> print r'/n'
/n
接下來的例子里，我們打不開我們的README文件了，為什么？因為'/t'和'/r'被當成不在我們的文件名中的特殊符號，但它們實際上是文件路徑中的4個獨立的字符。

上一篇：python連接oracle數據庫實例

下一篇：基于python編寫的微博應用