問題:我們需要在散沙一般的數(shù)據(jù)中提取出字符,分隔符不止一個,而且還有不少空格,比如:
原字符串如下:
'asd ff gg; asd , foo| og '
我們需要刪除上面的,;|分隔符和多余空格,提取出:
['asd', 'ff', 'gg', 'asd', 'foo', 'og']
這種一般用于處理日志或者網(wǎng)頁數(shù)據(jù)提取,一般而言,這種數(shù)據(jù)中需要的數(shù)據(jù)分布規(guī)律性不是太強(qiáng),而且比較散。
處理結(jié)果如下:
import reline = 'asd ff gg; asd , foo| og 'data = re.split(r'[;,|/s]/s*',line)for i in data: if i == '': data.remove(i)print(data)
以上這篇python針對不定分隔符切割提取字符串的方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持武林站長站。
新聞熱點(diǎn)
疑難解答
圖片精選