Ocr技術(shù)識別率的影響因素有很多,所以提高Ocr技術(shù)識別率的方法也有很多。福昕全能王可以利用提高掃描圖片的質(zhì)量、顏色來提高
Ocr技術(shù)識別率,同時也可以提升福昕全能王的掃描設(shè)備來提高Ocr技術(shù)識別率。
Ocr技術(shù)識別率有多高
通用文字識別率:印刷體整體識別準(zhǔn)確率達(dá)95%以上,手寫體達(dá)90%以上。
卡證文字識別率:識別以身份證識別為例,身份證號碼識別準(zhǔn)確率達(dá)99.9%以上,姓名識別準(zhǔn)確率達(dá)99%以上。
票據(jù)單據(jù)識別率:以增值稅發(fā)票為例,發(fā)票代碼、價稅合計(jì)、合計(jì)金額、購買方識別號、開票日期等識別準(zhǔn)確率達(dá)到99%以上。
汽車相關(guān)識別率:行駛證和駕駛證的總體識別準(zhǔn)確率達(dá)96%以上,車牌識別、車輛 VIN 碼的準(zhǔn)確率達(dá)98%以上,算法精度均處于業(yè)內(nèi)領(lǐng)先水平。
行業(yè)文檔識別率:基于業(yè)內(nèi)領(lǐng)先的深度學(xué)習(xí)算法、表格文字的識別準(zhǔn)確率在92%以上,算式識別的準(zhǔn)確率在94%以上。
提高Ocr技術(shù)識別率的方法
1、選擇印刷質(zhì)量較好的文字文稿
文字文稿印刷質(zhì)量的好壞,直接影響著掃描后得到的文稿圖像的質(zhì)量,也必將影響到OCR的識別率。通常選擇正版的書籍、雜志等,再通過正確的掃描方法,就可得到質(zhì)量較高的
掃描文稿圖像,并得到較高的OCR識別率。掃描印刷質(zhì)量粗糙的文字文稿(如紙質(zhì)較差的報(bào)紙、盜版書籍等),很難得到滿意的OCR識別率。
2、正確設(shè)置和操作掃描儀
正確操作和設(shè)置掃描儀對掃描文稿的圖像質(zhì)量、OCR識別率有著至關(guān)重要的影響。在掃描過程中,除了文稿要擺放端正、平整(防止走光)外,還應(yīng)對掃描的彩色模式、分辨率等參數(shù)進(jìn)行正確的設(shè)置。
?、偕誓J剑荷誓J酵ǔ槿N:彩色、灰度和黑白二值。在運(yùn)用OCR識別軟件進(jìn)行掃描時,一般將色彩模式設(shè)置為黑白二值,即通過掃描得到的圖像只有黑白兩種顏色。
?、诜直媛实脑O(shè)置:分辨率不能設(shè)置的過小,通常為300dpi,分辨率過小就不能保證OCR的識別效果.但分辨率數(shù)值也不要設(shè)得過高,數(shù)值過高會影響掃描速度,而且得到的掃描文稿圖像過大,使計(jì)算機(jī)的運(yùn)行速度降低。
3、利用圖像處理軟件提高掃描文稿的圖像質(zhì)量
對紙質(zhì)較差、印刷質(zhì)量不佳的文字文稿,可以在掃描后,再用圖形圖像處理軟件進(jìn)行處理,先改善掃描文稿的圖像質(zhì)量,然后再進(jìn)行OCR識別。
Ocr技術(shù)識別率影響因素
1.圖片的質(zhì)量,一般建議150dpi以上。
2.顏色,一般對彩色識別很差,黑白的圖片較高,因此建議ocr的為黑白tif格式。
3.最重要的就是字體,如果是手寫識別率很低。國內(nèi)OCR識別簡體差錯率為萬分之三,如果要求更高的精度需要投入更大的人工干預(yù)。繁體識別由于繁體字庫的不統(tǒng)一性(民國時期的字庫和現(xiàn)在繁體字庫不統(tǒng)一),導(dǎo)致識別困難,在人工干預(yù)下,精度能達(dá)到90%以上。
Ocr技術(shù)識別率直接影響Ocr技術(shù)識別的結(jié)果,所以我們要提高Ocr技術(shù)識別率,提高Ocr技術(shù)識別率的方法有很多,大家可以去了解一下。