原創(chuàng)|對比評測|編輯:郝浩|2013-08-23 12:07:35.000|閱讀 1916 次
概述:本文對多款常用OCR軟件的進(jìn)行了多角度的對比,希望為用戶在選擇和使用OCR軟件時(shí)候提供一些實(shí)用性參考。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
只要有掃描儀和光學(xué)字符識別(OCR)軟件,將掃描文檔轉(zhuǎn)換成Word文檔是相當(dāng)容易的。掃描儀將紙質(zhì)文檔轉(zhuǎn)換成掃描圖像,而光學(xué)字符識別(OCR)軟件則將所掃描的圖像轉(zhuǎn)換成PDF和Word等可編輯和可搜索的文檔格式。在文檔的轉(zhuǎn)換過程中,OCR軟件技術(shù)主要用來分析和比較帶有數(shù)據(jù)庫中所存字體的文檔。雖然,OCR軟件的識別準(zhǔn)確率不可能達(dá)到100%,但是一些OCR軟件包含拼寫檢查功能,可查出無法辨認(rèn)的字。本文對多款常用OCR軟件的性能進(jìn)行了多角度的對比,希望為用戶在選擇和使用OCR軟件時(shí)候提供一些實(shí)用性參考。
名稱 | 支持平臺 | 編程語言 | 字體語言 | 輸出格式 | 備注 |
Tesseract |
Windows/MacOSX /Linux |
C++, C | 40+ | 文本,hOCR,其他 | 開源,支持中文 |
ExperVisionTypeReader |
Windows/MacOSX |
C/C++ | 21 | hOCR | 多次獲獎(jiǎng);不支持中文 |
ABBYY FineReader |
Windows/MacOSX /Linux |
C/C++ | 198 | DOC, DOCX, XLS, XLSX, PPTX, RTF, PDF, HTML, CSV, TXT, ODT, DjVu, EPUB, FB2 | 世界排名第一;識別精度達(dá)99%; |
LEADTOOLS |
Windows/MacOSX /Linux |
C/C++, .NET, Objective-C, Java, JavaScript | 56 | PDF, PDF/A, DOC, DOCX, XLS, XPS, RTF, HTML, ANSI Text, Unicode Text, CSV | 支持拉丁語, 亞洲語言,阿拉伯語,MICR字符集;支持整頁或者部分區(qū)域的OCR識別; |
CuneiForm/OpenOCR |
Windows/MacOSX /Linux |
C/C++ | 28 | ? | 企業(yè)級系統(tǒng),可以保存文本格式,并識別結(jié)構(gòu)的復(fù)雜表格 |
Image to OCR Converter | Windows | C/C++, VB , .NET | 40 | PDF, Word, HTML, Text | 讀取的圖像格式和PDF文件,并可以從照相機(jī)掃描圖像 |
Dynamsoft OCR SDK | Windows | C/C++ | 40+ | PDF, TXT | - |
Puma.NET | Windows | C# | 28 | ? | - |
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn