亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Java > 正文

java讀取word-excel-ppt文件代碼

2019-11-26 16:19:42
字體:
來源:轉載
供稿:網友
WORD:
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.poi.hwpf.extractor.WordExtractor;
import java.io.File;
import java.io.InputStream;
import java.io.FileInputStream;
import com.search.code.Index;
public Document getDocument(Index index, String url, String title, InputStream is) throws DocCenterException {
String bodyText = null;
try {
WordExtractor ex = new WordExtractor(is);//is是WORD文件的InputStream
bodyText = ex.getText();
if(!bodyText.equals("")){
index.AddIndex(url, title, bodyText);
}
}catch (DocCenterException e) {
throw new DocCenterException("無法從該Mocriosoft Word文檔中提取內容", e);
}catch(Exception e){
e.printStackTrace();
}
}
return null;
}
Excel:
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFRow;
import org.apache.poi.hssf.usermodel.HSSFCell;
import java.io.File;
import java.io.InputStream;
import java.io.FileInputStream;
import com.search.code.Index;
public Document getDocument(Index index, String url, String title, InputStream is) throws DocCenterException {
StringBuffer content = new StringBuffer();
try{
HSSFWorkbook workbook = new HSSFWorkbook(is);//創建對Excel工作簿文件的引用
for (int numSheets = 0; numSheets < workbook.getNumberOfSheets(); numSheets++) {
if (null != workbook.getSheetAt(numSheets)) {
HSSFSheet aSheet = workbook.getSheetAt(numSheets);//獲得一個sheet
for (int rowNumOfSheet = 0; rowNumOfSheet <= aSheet.getLastRowNum(); rowNumOfSheet++) {
if (null != aSheet.getRow(rowNumOfSheet)) {
HSSFRow aRow = aSheet.getRow(rowNumOfSheet); //獲得一個行
for (short cellNumOfRow = 0; cellNumOfRow <= aRow.getLastCellNum(); cellNumOfRow++) {
if (null != aRow.getCell(cellNumOfRow)) {
HSSFCell aCell = aRow.getCell(cellNumOfRow);//獲得列值
content.append(aCell.getStringCellValue());
}
}
}
}
}
}
if(!content.equals("")){
index.AddIndex(url, title, content.toString());
}
}catch (DocCenterException e) {
throw new DocCenterException("無法從該Mocriosoft Word文檔中提取內容", e);
}catch(Exception e) {
System.out.println("已運行xlRead() : " + e );
}
return null;
}
PowerPoint:
import java.io.InputStream;
import org.apache.lucene.document.Document;
import org.apache.poi.hslf.HSLFSlideShow;
import org.apache.poi.hslf.model.TextRun;
import org.apache.poi.hslf.model.Slide;
import org.apache.poi.hslf.usermodel.SlideShow;
public Document getDocument(Index index, String url, String title, InputStream is)
throws DocCenterException {
StringBuffer content = new StringBuffer("");
try{
SlideShow ss = new SlideShow(new HSLFSlideShow(is));//is 為文件的InputStream,建立SlideShow
Slide[] slides = ss.getSlides();//獲得每一張幻燈片
for(int i=0;i<slides.length;i++){
TextRun[] t = slides[i].getTextRuns();//為了取得幻燈片的文字內容,建立TextRun
for(int j=0;j<t.length;j++){
content.append(t[j].getText());//這里會將文字內容加到content中去
}
content.append(slides[i].getTitle());
}
index.AddIndex(url, title, content.toString());
}catch(Exception ex){
System.out.println(ex.toString());
}
return null;
}
PDF:
import java.io.InputStream;
import java.io.IOException;
import org.apache.lucene.document.Document;
import org.pdfbox.cos.COSDocument;
import org.pdfbox.pdfparser.PDFParser;
import org.pdfbox.pdmodel.PDDocument;
import org.pdfbox.pdmodel.PDDocumentInformation;
import org.pdfbox.util.PDFTextStripper;
import com.search.code.Index;
public Document getDocument(Index index, String url, String title, InputStream is)throws DocCenterException {
COSDocument cosDoc = null;
try {
cosDoc = parseDocument(is);
} catch (IOException e) {
closeCOSDocument(cosDoc);
throw new DocCenterException("無法處理該PDF文檔", e);
}
if (cosDoc.isEncrypted()) {
if (cosDoc != null)
closeCOSDocument(cosDoc);
throw new DocCenterException("該PDF文檔是加密文檔,無法處理");
}
String docText = null;
try {
PDFTextStripper stripper = new PDFTextStripper();
docText = stripper.getText(new PDDocument(cosDoc));
} catch (IOException e) {
closeCOSDocument(cosDoc);
throw new DocCenterException("無法處理該PDF文檔", e);
}
PDDocument pdDoc = null;
try {
pdDoc = new PDDocument(cosDoc);
PDDocumentInformation docInfo = pdDoc.getDocumentInformation();
if(docInfo.getTitle()!=null && !docInfo.getTitle().equals("")){
title = docInfo.getTitle();
}
} catch (Exception e) {
closeCOSDocument(cosDoc);
closePDDocument(pdDoc);
System.err.println("無法取得該PDF文檔的元數據" + e.getMessage());
} finally {
closeCOSDocument(cosDoc);
closePDDocument(pdDoc);
}
return null;
}
private static COSDocument parseDocument(InputStream is) throws IOException {
PDFParser parser = new PDFParser(is);
parser.parse();
return parser.getDocument();
}
private void closeCOSDocument(COSDocument cosDoc) {
if (cosDoc != null) {
try {
cosDoc.close();
} catch (IOException e) {
}
}
}
private void closePDDocument(PDDocument pdDoc) {
if (pdDoc != null) {
try {
pdDoc.close();
} catch (IOException e) {
}
}
}
代碼復制可能出錯,不過代碼經過測試,絕對能用,POI為3.0-rc4,PDFBOX為0.7.3

POI: http://jakarta.apache.org/poi/index.html
PDFBOX: http://www.pdfbox.org/

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
中文字幕久热精品在线视频| 欧美激情乱人伦一区| 亚洲伊人久久大香线蕉av| 亚洲天堂av在线免费观看| 91手机视频在线观看| 欧美激情中文网| 成人欧美在线观看| 欧美日本中文字幕| 国产在线不卡精品| 亚洲色图综合久久| 欧美激情视频在线免费观看 欧美视频免费一| 国产精品视频一区二区三区四| 久久久伊人日本| 亚洲精品中文字幕女同| 97香蕉超级碰碰久久免费的优势| 26uuu久久噜噜噜噜| 在线观看日韩视频| 97不卡在线视频| www.久久撸.com| 91精品国产综合久久香蕉最新版| 国产色综合天天综合网| 国产精品偷伦免费视频观看的| 欧美大奶子在线| 久久精品久久久久| 最近的2019中文字幕免费一页| 欧美国产日韩免费| 欧美精品在线播放| 中文字幕亚洲欧美日韩2019| 91精品国产91久久久| 日韩视频免费中文字幕| 久久五月天综合| 亚洲人成网站999久久久综合| 日韩在线中文字幕| 在线视频欧美性高潮| 欧美激情日韩图片| 在线观看亚洲视频| 国产精品jvid在线观看蜜臀| 欧美日韩国产一中文字不卡| 欧美特级www| 日韩第一页在线| 国模精品一区二区三区色天香| 国产精品丝袜视频| 欧美国产精品va在线观看| 日韩欧美国产中文字幕| 欧美丝袜一区二区三区| 日韩av手机在线观看| 国产精品第一视频| 日韩av电影中文字幕| 日韩精品中文字幕有码专区| 久久久免费精品视频| 高清欧美性猛交xxxx黑人猛交| 色偷偷偷综合中文字幕;dd| 成人激情视频网| 久久久久久久成人| 亚洲最新在线视频| 亚洲一区二区三区四区在线播放| 国产精品久久综合av爱欲tv| 日本亚洲精品在线观看| 久久久久久久网站| 国产成人亚洲精品| 国产精品电影在线观看| 一区二区三区久久精品| 色诱女教师一区二区三区| 国产精品视频色| 狠狠综合久久av一区二区小说| 欧洲中文字幕国产精品| 亚洲国产私拍精品国模在线观看| 国产脚交av在线一区二区| 国产亚洲精品一区二区| 欧美老少配视频| 狠狠爱在线视频一区| 在线观看视频99| 亚洲人午夜精品免费| 欧美极品少妇xxxxx| 欧美精品在线看| 亚洲剧情一区二区| 日日骚av一区| 精品国产欧美一区二区三区成人| 中文字幕国内精品| 97免费视频在线| 国内精品一区二区三区| 欧美一级视频一区二区| 亚洲欧美成人网| 欧美精品18videos性欧| 国产精品美女视频网站| 国产精品视频一| 久久人人爽亚洲精品天堂| 欧美资源在线观看| 中文字幕亚洲欧美日韩2019| 欧美乱人伦中文字幕在线| 欧美理论电影在线观看| 亚洲成人亚洲激情| 久久久天堂国产精品女人| 亚州欧美日韩中文视频| 九九热99久久久国产盗摄| 久久精品一偷一偷国产| 国语自产精品视频在线看抢先版图片| 2025国产精品视频| 欧美国产第二页| 91在线网站视频| 亚洲xxxx做受欧美| 国产精品国产三级国产专播精品人| 欧美一级电影久久| 日韩av色综合| 97人人做人人爱| 国产精品99蜜臀久久不卡二区| 亚洲免费av网址| 欧美亚洲激情视频| 久久夜精品香蕉| 国产精品美女午夜av| 日韩**中文字幕毛片| 欧美色播在线播放| 日韩精品在线观| 一区二区欧美日韩视频| 亚洲国产天堂久久综合| 亚洲天堂久久av| 欧美性视频网站| 日韩美女在线播放| 日本久久久久亚洲中字幕| 欧美肥老太性生活视频| 国产精品视频内| 国产视频福利一区| 久久国产精品久久久久久久久久| 日韩在线视频网站| 日本成人精品在线| 欧美日韩亚洲成人| 日韩欧美亚洲国产一区| 一个人看的www欧美| 国产精品看片资源| 日韩精品在线观看一区二区| 日韩经典一区二区三区| 久久久成人的性感天堂| 欧美精品第一页在线播放| 久久激情五月丁香伊人| 午夜精品久久17c| 日韩欧美中文字幕在线观看| 隔壁老王国产在线精品| 一区二区三区天堂av| 日韩美女写真福利在线观看| 一本大道久久加勒比香蕉| 国产亚洲综合久久| 国产视频精品va久久久久久| 亚洲色图校园春色| 日韩精品中文字幕在线| 欧美激情在线狂野欧美精品| 欧美综合国产精品久久丁香| 亚洲精品色婷婷福利天堂| 国模极品一区二区三区| 日韩在线观看网址| 免费97视频在线精品国自产拍| 国产成人福利网站| 日韩av在线一区| 亚洲高清一区二| 日韩免费中文字幕| 国产中文日韩欧美| 久久精品一区中文字幕| 91久久久久久国产精品| 亚洲综合中文字幕在线观看| 国产精品视频免费在线观看| 6080yy精品一区二区三区| 欧美一级高清免费| 国产精品久久久久免费a∨大胸| 性欧美xxxx视频在线观看| 97国产真实伦对白精彩视频8|