自學(xué)Python3第5天,今天突發(fā)奇想,想用Python識(shí)別圖片里的文字。沒(méi)想到Python實(shí)現(xiàn)圖片文字識(shí)別這么簡(jiǎn)單,只需要一行代碼就能搞定
from PIL import Imageimport pytesseract#上面都是導(dǎo)包,只需要下面這一行就能實(shí)現(xiàn)圖片文字識(shí)別text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')print(text)我們以識(shí)別詩(shī)詞為例
下面是我們要識(shí)別的圖片

先看下效果圖
我們運(yùn)行代碼后識(shí)別的結(jié)果,有幾個(gè)字沒(méi)有正確識(shí)別,但是大多數(shù)字都能識(shí)別出來(lái)。
風(fēng)急天高猿嘯哀 渚蕓胄芳少白鳥(niǎo)飛鳳無(wú)邊落木蕭蕭下, 不盡長(zhǎng)量工盲袞宕袞來(lái)萬(wàn)里悲秋常1乍窨, 百年多病獨(dú)登氤艱難苦恨擎霜量 漂倒新停澍酉帆
一行代碼就能識(shí)別圖片,我們背后要做些準(zhǔn)備工作的
下面就來(lái)講講這幾個(gè)庫(kù)的安裝,因?yàn)橹挥羞@幾個(gè)庫(kù)安裝好以后Python才能實(shí)現(xiàn)一行代碼實(shí)現(xiàn)圖片文字識(shí)別
一,pytesseract和PIL的安裝
安裝這兩個(gè)包可以借助pip
- 1,命令行安裝
pip install PIL pip install pytesseract
- 2,如果你用的pycharm編輯器,就可以直接借助pycharm實(shí)現(xiàn)快速安裝。
在pycharm的Settings設(shè)置頁(yè)按照下面步驟操作
這樣就能成功安裝pytesseract,安裝PIL只需要在上面第三步里搜索PIL并點(diǎn)擊安裝即可

這時(shí)我們安轉(zhuǎn)好了庫(kù),運(yùn)行下面代碼
from PIL import Imageimport pytesseracttext=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')print(text)會(huì)報(bào)下面錯(cuò)誤,錯(cuò)誤原因是:沒(méi)有安裝識(shí)別引擎tesseract-ocr

二,安裝識(shí)別引擎tesseract-ocr
1.下載下面的安裝包,然后直接點(diǎn)擊安裝即可
tesseract-ocr安裝包和中文語(yǔ)言包
解壓安裝tesseract-ocr后做如下操作,就可以支持中文識(shí)別了。因?yàn)閠esseract-ocr默認(rèn)不支持中文識(shí)別。
新聞熱點(diǎn)
疑難解答
圖片精選