原創|使用教程|編輯:郝浩|2013-08-09 11:12:22.000|閱讀 764 次
概述:為了很好地解決TIFF文件在Google Drive上丟失的問題,開發人員可以使用LEADTOOLS OCR SDK提取文本,然后將文本添加到每個項目的IndexableTextData。本文主要介紹如何使用LEADTOOLS OCR SDK增強Google Drive的搜索功能。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
Google Drive是一項非常不錯的云儲存服務,通過這項服務,用戶可以儲存,組織和共享文檔、照片和視頻文件等,但是TIFF和其他光柵圖像文件格式卻很容易丟失。為了很好地解決文件丟失的問題,開發人員可以使用OCR識別控件LEADTOOLS OCR SDK提取文本,然后將文本添加到每個項目的IndexableTextData。接下來,便可以類似方式在基于文本的文檔,如DOC或者PDF文件中搜索光柵圖像文件。
例如,我們上傳了四個普通TIFF文件到Google Drive,每個文件分別命名為OCR1,OCR2,OCR3和OCR4,因此,僅具有基于文件名的搜索功能完全沒有任何幫助。
在我們看來,這些圖像就是文本,但是對于Google Drive而言,它卻將這些圖像看作光柵數據,并且在我們試圖搜索掃描文檔的內部時,無返回。
難道谷歌就沒有辦法搜索你的文檔?幸運的是,Google Drive會一直掛起,并且在執行文本搜索時,使用每個文檔中可自定義的“IndexableTextData” 元數據。在接下來的例子中,我們一起來看看如何在不修改原始圖像的情況下,使用Google Drive查找基于文本內容的TIFF文檔。
連接到Google Drive
啟動Google Drive API來檢索ClientID和ClientSecret。因為,當使用 Google Drive API上傳和修改TIFF文檔時,需要使用到這些屬性。接下來,下載 Google Client Library到引用中。
在本示例中,我們將打開WebBrowser控件中的User Authorization Uri,使用戶可以輸入自己的用戶名和密碼。用戶登錄以后,我們可以從WebBrowser控件的標題中獲取授權碼,然后我們就可以搜索所有賬戶中的TIFF文件。
使用LEADTOOLS OCR
最后,使用LEADTOOLS OCR 引擎來獲取TIFF文件的文本信息。創建IOcrEngine和IOcrDocument后, RecognizeText函數將返回一串從頁面中提取的文本字符串,然后更新Google Drive中的IndexableTextData元數據。
接下來,在Google Drive中搜索TIFF文檔,結果顯示如下:
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉載自:慧都控件網