相對來說python對字符串的處理是比較高效的,方法也有很多。其中maketrans和translate兩個方法被應用的很多,本文就針對這兩個方法的用法做一總結整理。
首先讓我們先回顧下這兩個方法:
① s.translate(table,str) 對字符串s移除str包含的字符,剩下的字符串按照table里的字符映射關系替換。table可以理解為轉換表,比較'a' -> 'A', 'b'->'B'.
② tabel = string.maketrans('s1', 's2') s1 和 s2 的長度必須一致,maketrans生成一個轉換表,若在s中有s1,則替換為s2,這個轉換表是字符字符一個個對應的,沒必要全部包含。
舉幾個例子:
import strings = 'helloworld, 0001111'table = string.maketrans('','')#沒有映射,保留原字符串s.translate(table) #hello world, 0001111s.translate(table, 'hello000)'#world, 1111table = string.maketrans('abcdefgh','ABCDEFGH')s.translate(table)#HEllo,worlD,0001111s.translate(table,'world')#HEllo,0001111
我們現在可以將makerans,translate包裝起來,形成一個返回閉包的工廠函數(print就是工廠函數),如下所示:
import stringdef translator(frm = '', to='', delete= '', keep = None): if len(to) == 1: to = to * len(frm) trans = string.maketrans(frm, to) if keep is not None: allchars = string.maketrans('','') delete = allchars.translate(allchars, keep.translate(allchars, delete)) def translate(s): return s.translate(trans, delete) return translate
函數的最后用到了閉包,閉包是指有權訪問另一個函數作用域中的變量的函數。創建閉包的常見方式,就是在一個函數內部創建另一個函數:
def make_adder(addend): def adder(augend): return augend + addend return adder
執行 p = make_addr(23)將產生內層函數addr的一個閉包,這個閉包在內部引用了名字addend,而addend又綁定到數值23,執行p(100)則最終返回123。
現在我們已經把各種可能性封閉在一個建議以用的接口后面。
>>>digits_only = translator(keep = string.digits)>>>digits_only('Chris Perkins :224 -7992')'2247992'
移除屬于某字符集合的元素也非常簡單:
>>>no_digits = translator(delete = string.digits)>>>no_digits('Chris Perkins:224-7992')'Chris Perkings : - '
也可以替換:
>>>digits_to_hash = translator(from = string.digits, to = '#')>>>digits_to_hash('Chris Perkins :224-7992')'Chris Perkins: ###-####'
當delete和keep有重疊部分的時候,delete參數優先
>>>trans = translator(delete = 'abcd', kepp ='cdef')>>>trans('abcdefg')'ef'
其實可以更詳細的添加一些異常來處理同時出現delete,keep的情況。
新聞熱點
疑難解答