翻譯|使用教程|編輯:李顯亮|2020-07-31 09:53:42.303|閱讀 644 次
概述:光學字符識別(OCR)技術已經使我們能夠識別和掃描的文檔和圖像內讀取的文本。在本文中,將展示如何對圖像(PNG,JPG,BMP和GIF)執行OCR,以及如何使用Aspose.OCR for Java將圖像轉換為文本。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
光學字符識別(OCR)技術已經使我們能夠識別和掃描的文檔和圖像內讀取的文本。OCR可以將只讀文本轉換為可編輯形式。可以進一步處理轉換后的文本以進行諸如文本分析之類的操作。
在本文中,將展示如何對圖像(PNG,JPG,BMP和GIF)執行OCR,以及如何使用Aspose.OCR for Java將圖像轉換為文本。
目前,Java版Aspose.OCR升級到v20.5版,感興趣的朋友可點擊下方按鈕下載最新版。
最常見的是,OCR的圖像是掃描的文檔,發票,收據,賬單等的頁面,其中文本由多行組成。在這種情況下,您需要從圖像中檢索整個文本。以下是使用Java版Aspose.OCR在具有多行文本的圖像上執行OCR的步驟。
下面的代碼示例演示如何使用Java對圖像執行OCR并將圖像轉換為文本。
// The path to the documents directory. String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class); // The image path String imagePath = dataDir + "p3.png"; //Create api instance AsposeOCR api = new AsposeOCR(); // Recognize page by full path to file try { String result = api.RecognizePage(imagePath); System.out.println("Result: " + result); } catch (IOException e) { e.printStackTrace(); }
有時可能會出現圖像包含一行文字的情況。在這種情況下,可以相應地配置API。以下是轉換具有單行文本的圖像的步驟。
下面的代碼示例演示如何使用Java在具有一行文本的圖像上執行OCR。
// The path to the documents directory. String dataDir = Utils.getSharedDataDir(RecognizeLine.class); // The image path String imagePath = dataDir + "0001460985.Jpeg"; //Create api instance AsposeOCR api = new AsposeOCR(); try { String result = api.RecognizeLine(imagePath); System.out.println("File: " + imagePath); System.out.println("Result line: " + result); } catch (IOException e) { e.printStackTrace(); }
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn