亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 開發 > Java > 正文

Java實現從Html文本中提取純文本的方法

2024-07-14 08:40:57
字體:
來源:轉載
供稿:網友

1、應用場景:從一份html文件中或從String(是html內容)中提取純文本,去掉網頁標簽;

2、代碼一:replaceAll搞定

//從html中提取純文本 public static String StripHT(String strHtml) { String txtcontent = strHtml.replaceAll("</?[^>]+>", ""); //剔出<html>的標簽 txtcontent = txtcontent.replaceAll("<a>//s*|/t|/r|/n</a>", "");//去除字符串中的空格,回車,換行符,制表符 return txtcontent; } 

3、代碼二:正則表達式搞定

//從html中提取純文本	public static String Html2Text(String inputString) {		String htmlStr = inputString; // 含html標簽的字符串		String textStr = "";		java.util.regex.Pattern p_script;		java.util.regex.Matcher m_script;		java.util.regex.Pattern p_style;		java.util.regex.Matcher m_style;		java.util.regex.Pattern p_html;		java.util.regex.Matcher m_html;		try {			String regEx_script = "<[//s]*?script[^>]*?>[//s//S]*?<[//s]*?///[//s]*?script[//s]*?>"; // 定義script的正則表達式{或<script[^>]*?>[//s//S]*?<///script>	  String regEx_style = "<[//s]*?style[^>]*?>[//s//S]*?<[//s]*?///[//s]*?style[//s]*?>"; // 定義style的正則表達式{或<style[^>]*?>[//s//S]*?<///style>	  String regEx_html = "<[^>]+>"; // 定義HTML標簽的正則表達式	  p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);	  m_script = p_script.matcher(htmlStr);	  htmlStr = m_script.replaceAll(""); // 過濾script標簽	  p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);	  m_style = p_style.matcher(htmlStr);	  htmlStr = m_style.replaceAll(""); // 過濾style標簽	  p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);	  m_html = p_html.matcher(htmlStr);	  htmlStr = m_html.replaceAll(""); // 過濾html標簽	  textStr = htmlStr;	 } catch (Exception e) {System.err.println("Html2Text: " + e.getMessage()); }		//剔除空格行		textStr=textStr.replaceAll("[ ]+", " ");		textStr=textStr.replaceAll("(?m)^//s*$(//n|//r//n)", "");		return textStr;// 返回文本字符串	}

4、代碼三:HTMLEditorKit.ParserCallback搞定,Java自帶的類

package com.util;import java.io.*;import javax.swing.text.html.*;import javax.swing.text.html.parser.*;public class Html2Text extends HTMLEditorKit.ParserCallback {	 StringBuffer s;	 public Html2Text() {}	 public void parse(Reader in) throws IOException {	 s = new StringBuffer();	 ParserDelegator delegator = new ParserDelegator();	 // the third parameter is TRUE to ignore charset directive	 delegator.parse(in, this, Boolean.TRUE);	 }	 public void handleText(char[] text, int pos) {	 s.append(text);	 }	 public String getText() {	 return s.toString();	 }	 public static void main (String[] args) {	 try {	  // the HTML to convert		 //Reader in=new StringReader("string");		  FileReader in = new FileReader("java-new.html");	  Html2Text parser = new Html2Text();	  parser.parse(in);	  in.close();	  System.out.println(parser.getText());	 }	 catch (Exception e) {	  e.printStackTrace();	 }	 }}

以上這篇Java實現從Html文本中提取純文本的方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持VeVb武林網。


注:相關教程知識閱讀請移步到JAVA教程頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
欧美激情第1页| 热久久免费国产视频| 欧美精品做受xxx性少妇| 日韩精品中文字幕在线播放| 欧美成人在线网站| 一本色道久久88综合亚洲精品ⅰ| 日韩欧美国产激情| 一区二区三区精品99久久| 国语自产精品视频在免费| 欧美激情影音先锋| 国产精品中文字幕久久久| 亚洲精品电影在线观看| 亚洲国产欧美久久| 欧美中文字幕视频在线观看| 国产性色av一区二区| 亚洲影院高清在线| 日韩欧美中文免费| 影音先锋欧美在线资源| 欧美激情久久久久久| 亚洲最大的av网站| 国产在线久久久| 亚洲精品视频久久| 欧美在线免费看| 久久国产精品久久久久久| 亚洲国产精品久久久久秋霞不卡| 91产国在线观看动作片喷水| 欧美重口另类videos人妖| 久久久噜久噜久久综合| 亚洲精品久久久久久久久久久| 欧美大成色www永久网站婷| 91香蕉国产在线观看| 国产一区二区黑人欧美xxxx| 热久久这里只有| 亚洲精品久久久久| 欧美日韩国产精品一区二区不卡中文| 亚洲电影免费在线观看| 欧美伊久线香蕉线新在线| 日韩在线观看网站| 亚洲欧美日韩成人| 欧美电影在线观看网站| 97国产精品人人爽人人做| 欧美日韩综合视频| 国产乱肥老妇国产一区二| 日韩精品中文在线观看| 97超视频免费观看| 国产精品成人免费视频| 日韩中文字幕网址| www.国产一区| 国产大片精品免费永久看nba| 国产成人亚洲精品| 亚洲天堂网站在线观看视频| 日本中文字幕成人| 欧美激情性做爰免费视频| 日韩精品视频在线| 亚洲欧美国产一区二区三区| 国内精品视频久久| 亚洲国产精品嫩草影院久久| 91夜夜揉人人捏人人添红杏| 国产成人97精品免费看片| 久久久精品在线观看| 午夜精品www| 精品久久久久久久大神国产| 欧美成人免费小视频| 亚洲欧美日韩成人| 国产欧美在线视频| 久久久久国色av免费观看性色| 日韩在线视频网站| 97婷婷涩涩精品一区| 国产一区二区三区欧美| www国产亚洲精品久久网站| 成人a免费视频| www.亚洲天堂| 日韩福利视频在线观看| 日韩中文有码在线视频| 国语自产精品视频在线看| 亚洲精品久久久久久久久久久久| 97香蕉超级碰碰久久免费软件| 亚洲精品国产精品国自产观看浪潮| 91国在线精品国内播放| 国产成人精品网站| 欧美日韩中国免费专区在线看| 在线激情影院一区| 九九九久久久久久| 欧美日韩国产中文字幕| 久久九九热免费视频| 久久久精品2019中文字幕神马| 91久久精品国产91久久性色| 性欧美视频videos6一9| 狠狠躁夜夜躁人人爽天天天天97| 亚洲欧美成人一区二区在线电影| 亚洲一区二区三区乱码aⅴ蜜桃女| 欧美日韩国产一区中文午夜| 日韩av有码在线| 欧美性色视频在线| 精品国产一区二区三区久久| 久久精品欧美视频| 日韩视频在线一区| 成人伊人精品色xxxx视频| 色悠久久久久综合先锋影音下载| 色视频www在线播放国产成人| 精品久久久免费| 亚洲人av在线影院| 亚洲精品99久久久久中文字幕| 国产免费亚洲高清| 欧美肥老妇视频| 日韩中文字幕网| 国产精品劲爆视频| 欧美最猛性xxxxx(亚洲精品)| 亚洲深夜福利视频| 九九热精品视频| 欧美成人一二三| 国产脚交av在线一区二区| 中文字幕精品一区二区精品| 亚洲片在线资源| 欧美大人香蕉在线| 欧美色欧美亚洲高清在线视频| 欧美高清理论片| 91精品综合久久久久久五月天| 亚洲a在线观看| 国产精品久久久久久久7电影| 色狠狠久久aa北条麻妃| 国产成人亚洲综合青青| 国产偷国产偷亚洲清高网站| 亚洲女人被黑人巨大进入al| 最好看的2019年中文视频| 91精品久久久久久久久中文字幕| 中文日韩在线观看| 国产精品电影在线观看| 亚洲欧美精品伊人久久| 最近2019好看的中文字幕免费| 亚洲欧美日韩成人| 国产91在线播放精品91| 91沈先生在线观看| 少妇久久久久久| 91精品美女在线| 国产精品久久久久久影视| 亚洲第一页中文字幕| 日韩免费观看在线观看| 日韩女优人人人人射在线视频| 国产精品日韩专区| 国产欧美日韩综合精品| 日韩国产欧美区| 91精品国产综合久久男男| 久久亚洲精品一区二区| 国产精品欧美日韩久久| 欧美激情a在线| 欧美国产日韩一区二区三区| 6080yy精品一区二区三区| 国产在线精品自拍| 亚洲伊人成综合成人网| 欧美国产日本在线| 中文字幕一区电影| 亚洲美女av黄| 国产成人极品视频| 欧美日韩国产成人| 狠狠色狠狠色综合日日五| 久久人人爽人人| 国产精品一区二区三区久久| 日本久久久久久久久久久| 国产精品久久av| 久久影视电视剧凤归四时歌| 日产精品99久久久久久| 欧美日韩久久久久| 日韩欧亚中文在线|