亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

Python正則獲取、過濾或者替換HTML標簽的方法

2020-01-04 17:47:51

字體：大中小

來源：轉載

供稿：網友

這篇文章主要介紹了Python通過正則表達式獲取、過濾或者替換HTML標簽的方法，感興趣的小伙伴們可以參考一下

本文實例介紹了Python通過正則表達式獲取,去除(過濾)或者替換HTML標簽的幾種方法，具體內容如下

python正則表達式關鍵內容:

python正則表達式轉義符:

. 匹配除換行符以外的任意字符/w 匹配字母或數字或下劃線或漢字/s 匹配任意的空白符/d 匹配數字/b 匹配單詞的開始或結束^ 匹配字符串的開始$ 匹配字符串的結束/W 匹配任意不是字母，數字，下劃線，漢字的字符/S 匹配任意不是空白符的字符/D 匹配任意非數字的字符/B 匹配不是單詞開頭或結束的位置[^x] 匹配除了x以外的任意字符[^aeiou] 匹配除了aeiou這幾個字母以外的任意字符

常用的python正則表達式限定符代碼/語法說明:

*重復零次或更多次+重復一次或更多次?重復零次或一次{n}重復n次{n,}重復n次或更多次{n,m}重復n到m次

關于python正則表達式命名組:

命名組:(?P<name>.....)這篇文章里面還提到了界定( 問號開頭,前向則有個'<'號,非則有個'!' 號 ):前向界定 (?<=…)后向界定 (?=…) 前向非界定 (?<!....)后向非界定 (?!.....)

Python通過正則表達式獲取,去除(過濾)或者替換HTML標簽代碼舉例

1、Python通過正則表達式取html中天氣信息代碼示例:

#!/usr/bin/env python #-*- coding: utf8 -*- import re   html = """   <h2>多云</h2> """   if __name__ == '__main__':   p = re.compile('<[^>]+>')   print p.sub("", html)Python通過正則表達式取html中溫度信息代碼示例:#!/usr/bin/env python #-*- coding: utf8 -*- import re   html = """   <div class="w-number"> <span class="tpte">14℃</span> </div> """   if __name__ == '__main__':   p = re.compile('<[^>]+>')   print p.sub("", html)

2、Python通過正則表達式去除(過濾)HTML標簽示例代碼:

# -*- coding: utf-8-*-import re##過濾HTML中的標簽#將HTML中標簽等信息去掉#@param htmlstr HTML字符串.def filter_tags(htmlstr):  #先過濾CDATA  re_cdata=re.compile('//<!/[CDATA/[[^>]*///]/]>',re.I) #匹配CDATA  re_script=re.compile('</s*script[^>]*>[^<]*</s*//s*script/s*>',re.I)#Script  re_style=re.compile('</s*style[^>]*>[^<]*</s*//s*style/s*>',re.I)#style  re_br=re.compile('<br/s*?/?>')#處理換行  re_h=re.compile('</?/w+[^>]*>')#HTML標簽  re_comment=re.compile('<!--[^>]*-->')#HTML注釋  s=re_cdata.sub('',htmlstr)#去掉CDATA  s=re_script.sub('',s) #去掉SCRIPT  s=re_style.sub('',s)#去掉style  s=re_br.sub('/n',s)#將br轉換為換行  s=re_h.sub('',s) #去掉HTML 標簽  s=re_comment.sub('',s)#去掉HTML注釋  #去掉多余的空行  blank_line=re.compile('/n+')  s=blank_line.sub('/n',s)  s=replaceCharEntity(s)#替換實體  return s##替換常用HTML字符實體.#使用正常的字符替換HTML中特殊的字符實體.#你可以添加新的實體字符到CHAR_ENTITIES中,處理更多HTML字符實體.#@param htmlstr HTML字符串.def replaceCharEntity(htmlstr):  CHAR_ENTITIES={'nbsp':' ','160':' ',        'lt':'<','60':'<',        'gt':'>','62':'>',        'amp':'&','38':'&',        'quot':'"','34':'"',}     re_charEntity=re.compile(r'&#?(?P<name>/w+);')  sz=re_charEntity.search(htmlstr)  while sz:    entity=sz.group()#entity全稱，如>    key=sz.group('name')#去除&;后entity,如>為gt    try:      htmlstr=re_charEntity.sub(CHAR_ENTITIES[key],htmlstr,1)      sz=re_charEntity.search(htmlstr)    except KeyError:      #以空串代替      htmlstr=re_charEntity.sub('',htmlstr,1)      sz=re_charEntity.search(htmlstr)  return htmlstrdef repalce(s,re_exp,repl_string):  return re_exp.sub(repl_string,s)if __name__=='__main__':  s=file('169it.com_index.htm').read()  news=filter_tags(s)  print news

以上就是本文的全部內容，希望對大家的學習有所幫助。

上一篇：Python3實現Web網頁圖片下載

下一篇：Python每天必學之bytes字節

學習交流

解決內存不足妙方

解決內存不足妙方...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

雷軍2020新年全員信：“5G+AIoT”五年投500億

2020-01-03 21:43:53

春運售票超3億張！售票總量再創歷史新高

2020-01-03 20:41:46

Windows10市場份額全球第一微軟是否再無敵手？

2020-01-03 20:31:47

比爾蓋茨一次錯誤，付出2.8萬億的代價

2020-01-02 08:44:34

長江迎來最長禁漁期：十年禁漁，方才有魚

2020-01-02 08:28:02

快手封殺淘寶？回應：系統升級，淘寶商品暫無法審核

2020-01-01 22:50:39

疑難解答

圖片精選

網友關注

亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

亚洲国产福利在线| 精品久久久久久国产| 一区二区福利视频| 国产精品专区第二| 国产国语videosex另类| 黑人巨大精品欧美一区二区一视频| 精品中文字幕视频| 精品伊人久久97| 亚洲美女福利视频网站| 国产精品美女久久久久久免费| 欧美精品在线网站| 亚洲激情自拍图| 亚洲精品在线视频| 日韩在线国产精品| 国产一区二区日韩精品欧美精品| 成人a免费视频| 欧美午夜精品久久久久久久| 91在线观看免费观看| 欧美性资源免费| 欧美精品成人91久久久久久久| 国产亚洲精品久久久久久777| 国产亚洲精品激情久久| 国产精品嫩草视频| 国产精品久久久久久网站| 亚洲欧洲成视频免费观看| 国产福利精品在线| 91精品久久久久久久久久入口| 97精品视频在线观看| 国产成人精品视| 欧美精品情趣视频| 亚洲精品久久久久久下一站| 黄色一区二区在线观看| 国产精品久久久久久亚洲调教| 亚洲成人aaa| 久久成人这里只有精品| xxx欧美精品| 深夜精品寂寞黄网站在线观看| 亚洲一二在线观看| 日韩av中文字幕在线免费观看| 欧洲成人免费aa| 亚洲人成亚洲人成在线观看| 亚洲理论在线a中文字幕| 国产精品一区二区久久久| 国产成人亚洲综合| 国产精品网站入口| 久久久国产视频91| 亚洲性视频网站| 日韩视频―中文字幕| 91久久在线观看| 欧美日韩亚洲精品内裤| 中文字幕日韩免费视频| 欧美精品18videos性欧| 亚洲美女又黄又爽在线观看| 一区二区三区国产在线观看| 国产97在线亚洲| 亚洲一区精品电影| 中文字幕日韩精品有码视频| 精品视频久久久| 欧美成人亚洲成人日韩成人| 日韩激情片免费| 狠狠久久五月精品中文字幕| 日本精品中文字幕| 81精品国产乱码久久久久久| 国产69精品久久久| 欧美极品欧美精品欧美视频| 亚洲第一福利视频| 国产剧情日韩欧美| 国产成人精品免费久久久久| 亚洲成人久久电影| 欧美与黑人午夜性猛交久久久| 欧美激情免费视频| 国产成+人+综合+亚洲欧美丁香花| 高清一区二区三区四区五区| 一区二区三区天堂av| 亚洲精品动漫久久久久| 91久久久久久| 成人美女免费网站视频| 一本一本久久a久久精品牛牛影视| 成人免费自拍视频| 欧美一乱一性一交一视频| 国产经典一区二区| 久久全球大尺度高清视频| 久久精品中文字幕电影| 日本精品一区二区三区在线播放视频| 国产亚洲美女久久| 亚洲精品短视频| 国产精品精品视频| 北条麻妃一区二区三区中文字幕| 国产精品久久久av久久久| 精品亚洲一区二区三区| 91精品视频大全| 欧美激情va永久在线播放| 亚洲国产欧美一区二区丝袜黑人| xxxx欧美18另类的高清| 国产成人综合精品| 亚洲欧美日韩国产成人| 日韩精品在线免费观看视频| 国产亚洲一区二区精品| 中文在线资源观看视频网站免费不卡| 国产在线观看一区二区三区| 中文字幕日韩av电影| 最近2019好看的中文字幕免费| 成人深夜直播免费观看| 欧美精品久久久久久久久| 欧美一性一乱一交一视频| 欧美性高潮床叫视频| 国模私拍视频一区| 中文字幕av一区中文字幕天堂| 日韩欧美亚洲成人| 九九热这里只有精品6| 国产精品日韩在线一区| 国产精品久久久久免费a∨| 亚洲国产天堂久久综合| 2019国产精品自在线拍国产不卡| 欧美最猛性xxxxx(亚洲精品)| 久久av在线播放| 国产精品流白浆视频| 亚洲国产另类国产精品国产免费| 日韩av在线免费观看| 亚洲aⅴ日韩av电影在线观看| 成人伊人精品色xxxx视频| 日韩精品在线私人| 中文国产成人精品久久一| 日韩国产高清视频在线| 97视频在线观看亚洲| 成人激情视频在线观看| 国产精品久久久久秋霞鲁丝| 欧美成人精品三级在线观看| 精品亚洲夜色av98在线观看| 夜夜嗨av一区二区三区四区| 国产97色在线| 国产999视频| 亚洲精品v天堂中文字幕| 国模私拍一区二区三区| 国产精品一区二区久久国产| 欧美老肥婆性猛交视频| 欧美野外猛男的大粗鳮| 国产精品7m视频| 91亚洲精品久久久久久久久久久久| 久久人人97超碰精品888| 2021国产精品视频| 亚洲精品美女在线观看| 色综合天天综合网国产成人网| 一本一道久久a久久精品逆3p| 亚洲剧情一区二区| 欧美日韩国产精品专区| 久久久久久久亚洲精品| 精品国产依人香蕉在线精品| 黑人巨大精品欧美一区二区三区| 九九精品视频在线| 久久人人爽人人爽人人片av高请| 国产精品欧美在线| 亚洲xxx视频| 亚洲综合精品一区二区| 日韩免费av片在线观看| 亚洲天堂av女优| 91久久精品日日躁夜夜躁国产| 韩国三级日本三级少妇99| 69av成年福利视频| 亚洲欧美成人精品| 久久天天躁狠狠躁夜夜爽蜜月| 国产成人综合亚洲| 亚洲一区二区三区乱码aⅴ| 亚洲精品久久久久久久久久久久|