亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

Python實現批量將word轉html并將html內容發布至網站的方法

2020-01-04 18:04:47
字體:
來源:轉載
供稿:網友

這篇文章主要介紹了Python實現批量將word轉html并將html內容發布至網站的方法,涉及Python調用第三方接口進行文件轉換及操作數據庫等相關技巧,具有一定參考借鑒價值,需要的朋友可以參考下

本文實例講述了Python實現批量將word轉html并將html內容發布至網站的方法。分享給大家供大家參考。具體實現方法如下:

 

 
  1. #coding=utf-8 
  2. __author__ = 'zhm' 
  3. from win32com import client as wc 
  4. import os 
  5. import time 
  6. import random 
  7. import MySQLdb 
  8. import re 
  9. def wordsToHtml(dir): 
  10. #批量把文件夾的word文檔轉換成html文件 
  11. #金山WPS調用,搶先版的用KWPS,正式版WPS 
  12. word = wc.Dispatch('KWPS.Application'
  13. for path, subdirs, files in os.walk(dir): 
  14. for wordFile in files: 
  15. wordFullName = os.path.join(path, wordFile) 
  16. #print "word:" + wordFullName 
  17. doc = word.Documents.Open(wordFullName) 
  18. wordFile2 = unicode(wordFile, "gbk"
  19. dotIndex = wordFile2.rfind("."
  20. if(dotIndex == -1): 
  21. print '********************ERROR: 未取得后綴名!' 
  22. fileSuffix = wordFile2[(dotIndex + 1) : ] 
  23. if(fileSuffix == "doc" or fileSuffix == "docx"): 
  24. fileName = wordFile2[ : dotIndex] 
  25. htmlName = fileName + ".html" 
  26. htmlFullName = os.path.join(unicode(path, "gbk"), htmlName) 
  27. # htmlFullName = unicode(path, "gbk") + "//" + htmlName 
  28. print u'生成了html文件:' + htmlFullName 
  29. doc.SaveAs(htmlFullName, 8) 
  30. doc.Close() 
  31. word.Quit() 
  32. print "" 
  33. print "Finished!" 
  34. def html_add_to_db(dir): 
  35. #將轉換成功的html文件批量插入數據庫中。 
  36. conn = MySQLdb.connect( 
  37. host='localhost'
  38. port=3306, 
  39. user='root'
  40. passwd='root'
  41. db='test'
  42. charset='utf8' 
  43. cur = conn.cursor() 
  44. for path, subdirs, files in os.walk(dir): 
  45. for htmlFile in files: 
  46. htmlFullName = os.path.join(path, htmlFile) 
  47. title = os.path.splitext(htmlFile)[0] 
  48. targetDir = 'D:/files/htmls/' 
  49. #D:/files為web服務器配置的靜態目錄 
  50. sconds = time.time() 
  51. msconds = sconds * 1000 
  52. targetFile = os.path.join(targetDir, str(int(msconds))+str(random.randint(100, 10000)) +'.html'
  53. htmlFile2 = unicode(htmlFile, "gbk"
  54. dotIndex = htmlFile2.rfind("."
  55. if(dotIndex == -1): 
  56. print '********************ERROR: 未取得后綴名!' 
  57. fileSuffix = htmlFile2[(dotIndex + 1) : ] 
  58. if(fileSuffix == "htm" or fileSuffix == "html"): 
  59. if not os.path.exists(targetDir): 
  60. os.makedirs(targetDir) 
  61. htmlFullName = os.path.join(unicode(path, "gbk"), htmlFullName) 
  62. htFile = open(htmlFullName,'rb'
  63. #獲取網頁內容 
  64. htmStrCotent = htFile.read() 
  65. #找出里面的圖片 
  66. img=re.compile(r"""<img/s.*?/s?src/s*=/s*['|"]?([^/s'"]+).*?>""",re.I) 
  67. m = img.findall(htmStrCotent) 
  68. for tagContent in m: 
  69. imgSrc = unicode(tagContent, "gbk"
  70. imgSrcFullName = os.path.join(path, imgSrc) 
  71. #上傳圖片 
  72. imgTarget = 'D:/files/images/whzx/' 
  73. img_sconds = time.time() 
  74. img_msconds = sconds * 1000 
  75. targetImgFile = os.path.join(imgTarget, str(int(img_msconds))+str(random.randint(100, 10000)) +'.png'
  76. if not os.path.exists(imgTarget): 
  77. os.makedirs(imgTarget) 
  78. if not os.path.exists(targetImgFile) or(os.path.exists(targetImgFile) and (os.path.getsize(targetImgFile) != os.path.getsize(imgSrcFullName))): 
  79. tmpImgFile = open(imgSrcFullName,'rb'
  80. tmpWriteImgFile = open(targetImgFile, "wb"
  81. tmpWriteImgFile.write(tmpImgFile.read()) 
  82. tmpImgFile.close() 
  83. tmpWriteImgFile.close() 
  84. htmStrCotent=htmStrCotent.replace(tagContent,targetImgFile.split(":")[1]) 
  85. if not os.path.exists(targetFile) or(os.path.exists(targetFile) and (os.path.getsize(targetFile) != os.path.getsize(htmlFullName))): 
  86. #用iframe包裝轉換好的html文件。 
  87. iframeHtml=''
  88. <script type="text/javascript" language="javascript"
  89. function iFrameHeight() { 
  90. var ifm= document.getElementById("iframepage"); 
  91. var subWeb = document.frames ? document.frames["iframepage"].document:ifm.contentDocument; 
  92. if(ifm != null && subWeb != null) { 
  93. ifm.height = subWeb.body.scrollHeight; 
  94. </script> 
  95. <iframe src='''+targetFile.split(':')[1]+''' 
  96. marginheight="0" marginwidth="0" frameborder="0" scrolling="no" width="765" height=100% id="iframepage" name="iframepage" onLoad="iFrameHeight()" ></iframe> 
  97. ''
  98. tmpTargetFile = open(targetFile, "wb"
  99. tmpTargetFile.write(htmStrCotent) 
  100. tmpTargetFile.close() 
  101. htFile.close() 
  102. try
  103. # 執行 
  104. sql = "insert into common_article(title,content) values(%s,%s)" 
  105. param = (unicode(title, "gbk"),iframeHtml) 
  106. cur.execute(sql,param) 
  107. except: 
  108. print "Error: unable to insert data" 
  109. cur.close() 
  110. conn.commit() 
  111. # 關閉數據庫連接 
  112. conn.close() 
  113. if __name__ == '__main__'
  114. wordsToHtml('d:/word'
  115. html_add_to_db('d:/word'

希望本文所述對大家的Python程序設計有所幫助。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
亚洲国产精品视频在线观看| 国产午夜精品视频免费不卡69堂| 欧美中文在线视频| 中文字幕日韩av| 性色av一区二区三区免费| 国产一区二区三区精品久久久| 国产成人综合久久| 亚洲大尺度美女在线| 日韩精品在线私人| 精品国产区一区二区三区在线观看| 欧美成人午夜激情| 亚洲精品国精品久久99热| 日韩av在线免费看| 国产做受高潮69| 国产精品久久婷婷六月丁香| 国产亚洲欧美aaaa| 欧美性生交大片免费| 亚洲第一偷拍网| 夜夜嗨av一区二区三区四区| 夜夜嗨av色一区二区不卡| 国内精久久久久久久久久人| 欧美精品videosex牲欧美| 国内精品久久久久久影视8| 亚洲一区www| 国产一区二区日韩| 国产亚洲精品美女久久久| 国产精品一区二区三| 国产午夜精品全部视频播放| 精品综合久久久久久97| 国产精品都在这里| 国模极品一区二区三区| 欧美日韩国产999| 成人av资源在线播放| 中文字幕日本精品| 欧美精品videos| 亚洲国产精品久久久久秋霞不卡| 岛国av午夜精品| 欧美性猛交99久久久久99按摩| 久久精品免费电影| 精品成人在线视频| 亚洲精品一区久久久久久| 日韩成人久久久| 国产欧美韩国高清| 精品国产91久久久久久老师| 国产精品久久久| 国产精品久久久久久久久久久久久久| 欧美视频一二三| 欧美中在线观看| 国产精品久久久久久久久借妻| 欧美国产在线视频| 性日韩欧美在线视频| 亚洲性xxxx| 日本亚洲欧美成人| 欧美激情久久久久| 亚洲欧美国产另类| 夜夜嗨av色综合久久久综合网| 日韩动漫免费观看电视剧高清| 国产中文日韩欧美| 国产精品一区二区性色av| 97人人爽人人喊人人模波多| 亚洲大尺度美女在线| 国产精品自产拍在线观看中文| 91久久精品国产91久久性色| 国产丝袜一区二区三区| 亚洲乱亚洲乱妇无码| 欧美又大粗又爽又黄大片视频| 日韩精品在线私人| 亚洲欧美国产va在线影院| 91久久久久久国产精品| 国产一区二区在线免费| 国产精品久久久久久久久| 欧美成人在线免费| 国产精品第七影院| 不卡av日日日| 久久精品国产一区二区电影| 亚洲综合自拍一区| 亚洲第一区在线| 亚洲高清免费观看高清完整版| 欧美中文字幕在线播放| 亚洲精品久久视频| 午夜精品美女自拍福到在线| 久久久亚洲影院你懂的| 国产精品日韩专区| 国产成人激情小视频| 国产精品va在线播放我和闺蜜| 欧美最猛性xxxxx亚洲精品| 国产91色在线播放| 国产91网红主播在线观看| 操日韩av在线电影| 成人亚洲综合色就1024| 国产精品精品国产| 亚洲aa中文字幕| 色噜噜久久综合伊人一本| 久久香蕉频线观| 日韩av电影在线免费播放| 亚洲视频网站在线观看| 91精品国产高清自在线| 免费av在线一区| 国产精品com| 欧美在线视频观看免费网站| 亚洲国产成人久久| 久久久久久国产精品久久| 国产精品久久久久久网站| 日韩经典中文字幕在线观看| 亚洲自拍偷拍在线| 91精品国产九九九久久久亚洲| 6080yy精品一区二区三区| 国产精品国产三级国产aⅴ9色| 亚洲欧美成人网| 亚洲影院色在线观看免费| 亚洲人成网站777色婷婷| 中文字幕精品在线| 国产精品男人的天堂| 97视频在线观看播放| 一道本无吗dⅴd在线播放一区| 久久久久久尹人网香蕉| 欧美激情亚洲激情| 国产偷亚洲偷欧美偷精品| 91av在线免费观看| 亚洲国产美女精品久久久久∴| 理论片在线不卡免费观看| 伊人青青综合网站| 亚洲视频在线观看网站| 狠狠爱在线视频一区| 亚洲精品女av网站| 亚洲综合社区网| 欧美—级a级欧美特级ar全黄| 国产精品久久久久久久久久99| 欧美亚洲在线播放| 亚洲成人激情在线观看| 懂色av中文一区二区三区天美| 成人欧美一区二区三区黑人| 国产日韩视频在线观看| 中文字幕在线视频日韩| 欧美美女18p| 精品欧美激情精品一区| 热re99久久精品国产66热| 精品视频—区二区三区免费| 久久久久久久久久久国产| 538国产精品一区二区在线| 日韩暖暖在线视频| 国产在线拍偷自揄拍精品| 日韩av123| 狠狠色狠狠色综合日日小说| 日本精品va在线观看| 国产中文日韩欧美| 色与欲影视天天看综合网| 91久久精品国产91性色| 亚洲片国产一区一级在线观看| 在线一区二区日韩| 视频在线观看一区二区| 97国产真实伦对白精彩视频8| 亚洲福利小视频| 一区二区三区 在线观看视| 欧美性xxxxx| 午夜精品福利视频| 91夜夜未满十八勿入爽爽影院| 国产精品日韩av| 久久这里只有精品99| 欧美日韩激情视频| 亚洲视频在线观看视频| 欧美电影《睫毛膏》| 国产精品专区h在线观看| 97在线视频免费看|