日韩精品手机在线,极品美女网站,爱豆传媒视频在线观看

掃描識別工具Dynamic Web TWAIN使用教程：OCR（下）

翻譯|使用教程|編輯：黃竹雯|2019-03-26 10:03:47.000|閱讀 296 次

概述：在文檔數字化的過程中，經常需要從所獲取的圖像中提取所需的信息。光學字符識別（OCR）是可以實現此需求的技術。在本文中，我們將探討如何使用Dynamic Web TWAIN及其OCR加載項在瀏覽器中快速掃描和識別文本。

# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>

相關鏈接：

在Web應用程序中快速實現文本識別

【Dynamic Web TWAIN最新版免費下載>>>】

上一篇文章與大家分享了在Web應用程序中快速實現文本識別的環境和步驟，本文將給大家介紹如何通過代碼來實現這一功能。

如何實現

在文本編輯器中打開 OCRADocument.html

對Core JavaScript文件的引用

<script type="text/javascript" src="../dist/dynamsoft.webtwain.initiate.js"></script>
<script type="text/javascript" src="../dist/dynamsoft.webtwain.config.js"></script>
<script type="text/javascript" src="../dist/addon/dynamsoft.webtwain.addon.ocr.js"></script>
<script type="text/javascript" src="../dist/addon/dynamsoft.webtwain.addon.pdf.js"></script>

這里引用的文件是

用于核心SDK Dynamic Web TWAIN的JS庫

node_modules\dwt\dis\dynamsoft.webtwain.initiate.js
node_modules\dwt\dis\dynamsoft.webtwain.config.js

Dynamsoft OCR Basic的JS庫

node_modules\dwt\dist\addon\dynamsoft.webtwain.addon.ocr.js
node_modules\dwt\dist\addon\dynamsoft.webtwain.addon.pdf.js

如果你以前在本地安裝了Dynamic Web TWAIN，則還可以在以下目錄中找到相同的文件（dynamsoft.webtwain.addon.pdf.js除外）。

C:\Program Files (x86)\Dynamsoft\Dynamic Web TWAIN SDK {version number} {Trial}\Resource

Dynamsoft OCR Basic runtime安裝代碼

function downloadOCRBasic(bDownloadDLL) {
    var strOCRPath = Dynamsoft.WebTwainEnv.ResourcesPath + "/OCRResources/OCR.zip",
        strOCRLangPath = Dynamsoft.WebTwainEnv.ResourcesPath + '/OCRResources/OCRBasicLanguages/English.zip';

    if (bDownloadDLL) {
        DWObject.Addon.OCR.Download(
            strOCRPath,
            function () {/*console.log('OCR dll is installed');*/
                downloadOCRBasic(false);
            },
            function (errorCode, errorString) {
                console.log(errorString);
            }
        );
    } else {
        DWObject.Addon.OCR.DownloadLangData(
            strOCRLangPath,
            function () {
            }, function (errorCode, errorString) {
                console.log(errorString);
            });
    }
}

如上面的代碼所示，Dynamsoft OCR Basic安裝需要兩個步驟。第一步是使用 DWObject.Addon.OCR.Download 接口安裝核心DLL（來自“/OCRResources/OCR.zip”的DynamicOCR.dll）。第二步是使用DWObject.Addon.OCR.DownloadLangData 接口安裝OCR語言包或識別字典（'/ OCRResources / OCRBasicLanguages / English.zip'）。此處僅安裝英語詞典，因此該程序只能識別英語。如果你需要識別其他語言（總共27種主要語言），你可以下載完整的示例或參考此在線示例。

支持的語言：Arabic, Bengali, Chinese_Simplified, Chinese_Traditional, English, French, German, Hindi, Indonesian, Italian, Japanese, Javanese, Korean, Malay, Marathi, Panjabi, Persian, Portuguese, Russian, Spanish, Swahili, Tamil, Telugu, Thai, Turkish, Vietnamese, Urdu.

使用插件

function DoOCR() {
    if (DWObject) {
        if (DWObject.HowManyImagesInBuffer == 0) {
            alert("Please scan or load an image first.");
            return;
        }
        DWObject.Addon.OCR.SetLanguage('eng');
        DWObject.Addon.OCR.SetOutputFormat(EnumDWT_OCROutputFormat.OCROF_TEXT);
        DWObject.Addon.OCR.Recognize(
            DWObject.CurrentImageIndexInBuffer,
            function (sImageIndex, result) {
                if (result == null)
                    return null;
                var _textResult = (Dynamsoft.Lib.base64.decode(result.Get())).split(/\r?\n/g), _resultToShow = [];
                for (var i = 0; i < _textResult.length; i++) {
                    if (i == 0 && _textResult[i].trim() == "")
                        continue;
                    _resultToShow.push(_textResult[i] + '<br />');
                }
                _resultToShow.splice(0, 0, '<p style="padding:5px; margin:0;">');
                _resultToShow.push('</p>');
                document.getElementById('divNoteMessage').innerHTML = _resultToShow.join('');
            },
            function (errorcode, errorstring, result) {
                alert(errorstring);
            }
        );

核心代碼是

DWObject.Addon.OCR.SetLanguage('eng'); //Set the language to be recognized
DWObject.Addon.OCR.SetOutputFormat(EnumDWT_OCROutputFormat.OCROF_TEXT); //Set the output format
DWObject.Addon.OCR.Recognize(... //Start Reconizing

查看支持的輸出格式。

相關方法是 SetLanguage( ), SetOutputFormat( ),Recognize( ), RecognizeFile( ), RecognizeRect( ), RecognizeSelectedImages( )。

關于Dynamic Web TWAIN使用OCR插件的教程就到此結束啦，希望對你有所幫助~