Python中怎么從圖像中讀取文本

本篇文章為大家展示了Python中怎么從圖像中讀取文本,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過(guò)這篇文章的詳細(xì)介紹希望你能有所收獲。

成都創(chuàng)新互聯(lián)專注于企業(yè)營(yíng)銷型網(wǎng)站建設(shè)、網(wǎng)站重做改版、定南網(wǎng)站定制設(shè)計(jì)、自適應(yīng)品牌網(wǎng)站建設(shè)、H5開(kāi)發(fā)商城系統(tǒng)網(wǎng)站開(kāi)發(fā)、集團(tuán)公司官網(wǎng)建設(shè)、成都外貿(mào)網(wǎng)站建設(shè)公司、高端網(wǎng)站制作、響應(yīng)式網(wǎng)頁(yè)設(shè)計(jì)等建站業(yè)務(wù),價(jià)格優(yōu)惠性價(jià)比高,為定南等各大城市提供網(wǎng)站開(kāi)發(fā)制作服務(wù)。

OpenCV

現(xiàn)在,這個(gè)庫(kù)將只用于加載圖像,實(shí)際上你不需要事先對(duì)它有太多了解(盡管它可能有幫助,你將看到為什么)。

根據(jù)官方文件:

OpenCV(開(kāi)源計(jì)算機(jī)視覺(jué)庫(kù))是一個(gè)開(kāi)源的計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)軟件庫(kù)。OpenCV的目的是為計(jì)算機(jī)視覺(jué)應(yīng)用提供一個(gè)通用的基礎(chǔ)結(jié)構(gòu),并加速機(jī)器感知在商業(yè)產(chǎn)品中的使用。OpenCV是bsd許可的產(chǎn)品,OpenCV使企業(yè)可以輕松地使用和修改代碼

簡(jiǎn)而言之,你可以使用OpenCV來(lái)做任何類型的圖像轉(zhuǎn)換,這是一個(gè)相當(dāng)簡(jiǎn)單的庫(kù)。

如果你還沒(méi)有安裝它,那么它將只是終端中的一行:

pip install opencv-python

差不多就是這樣。在此之前,一切都很簡(jiǎn)單,但這種情況即將改變。

PyTesseract

這個(gè)庫(kù)到底是什么東西?根據(jù)維基百科:

Tesseract是用于各種操作系統(tǒng)的光學(xué)字符識(shí)別引擎。它是免費(fèi)軟件,根據(jù)Apache許可2.0版發(fā)布,自2006年以來(lái)由Google贊助開(kāi)發(fā)。

我敢肯定,現(xiàn)在有更多復(fù)雜的庫(kù)可用,但是我發(fā)現(xiàn)這個(gè)庫(kù)運(yùn)行良好。根據(jù)我自己的經(jīng)驗(yàn),該庫(kù)應(yīng)該能夠從任何圖像中讀取文本,但前提是該字體不會(huì)使你連連看都看不懂。

如果無(wú)法從你的圖像中讀取文字,花更多的時(shí)間使用OpenCV,應(yīng)用各種過(guò)濾器使文本高亮。

現(xiàn)在安裝在底部有些麻煩。如果你使用的是Linux,則全部歸結(jié)為幾個(gè)sudo-apt get命令:

sudo apt-get updatesudo apt-get install tesseract-ocrsudo apt-get install libtesseract-dev

我用的是Windows系統(tǒng),所以這個(gè)過(guò)程有點(diǎn)乏味。

首先,打開(kāi)這個(gè)URL:https://github.com/UB-Mannheim/tesseract/wiki下載32位或64位的安裝程序:

Python中怎么從圖像中讀取文本

安裝本身很簡(jiǎn)單,只需單擊幾次Next。是的,你還需要做一個(gè)pip安裝:

pip install pytesseract

接下來(lái)要需要告訴Python  Tesseract安裝在何處。在Linux機(jī)器上,我不需要這樣做,但在Windows上是必需的。默認(rèn)情況下,它安裝Program Files。

如果你做的一切正確,執(zhí)行這些代碼應(yīng)該不會(huì)產(chǎn)生任何錯(cuò)誤:

Python中怎么從圖像中讀取文本

獲取文本

讓我們從一個(gè)簡(jiǎn)單的開(kāi)始。我找到了一些免版稅的圖片,里面有一些文字,第一個(gè)是這樣的:

Python中怎么從圖像中讀取文本

它應(yīng)該是簡(jiǎn)單的一個(gè),有可能Tesseract會(huì)讀那些藍(lán)色的“對(duì)象”作為括號(hào)。讓我們看看會(huì)發(fā)生什么:

Python中怎么從圖像中讀取文本

我的猜測(cè)是正確的。不過(guò),這不是一個(gè)問(wèn)題,你可以使用一些Python技巧輕松地解決這些問(wèn)題。

下一個(gè)可能更棘手:

Python中怎么從圖像中讀取文本

我希望它不會(huì)檢測(cè)到硬幣上的“B”:

Python中怎么從圖像中讀取文本

上述內(nèi)容就是Python中怎么從圖像中讀取文本,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

名稱欄目:Python中怎么從圖像中讀取文本
文章路徑:http://bm7419.com/article32/jdshsc.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站設(shè)計(jì)域名注冊(cè)、微信公眾號(hào)、自適應(yīng)網(wǎng)站、面包屑導(dǎo)航、企業(yè)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

網(wǎng)站優(yōu)化排名