GroupDocs.Parser for .NET是一個文本提取器API,可從.NET應用程序中提取文檔,電子表格,演示文稿,電子郵件和檔案中的原始或格式化文本和元數據。
* 關于本產品的分類與介紹僅供參考,精準產品資料以官網介紹為準,如需購買請先行測試。
適用于Windows Forms,ASP.NET,WPF,WCF和其他基于.NET Framework的應用程序的原生.NET API
用于桌面,Web和其他基于Java SE或EE的應用程序的原生Java API
GroupDocs.Parser for .NET是一個文本提取器API,用于使用C#,ASP.NET和其他.NET技術開發的業務應用程序。它支持從支持格式的文件中提取原始,格式化和結構化文本以及元數據。通過GroupDocs.Parser for .NET,你的應用程序還可以對流行格式(如電子表格,演示文稿,PDF,ZIP存檔等)執行受密碼保護的文檔解析。
以下是GroupDocs.Parser for .NET的概述:
GroupDocs.Parser for .NET支持以下文件格式:
GroupDocs.Parser for .NET支持以下操作系統,框架和包管理器:
統計計算單個或多個文件中的Word出現次數
檢測受密碼保護的XML文檔的媒體類型并從中提取文本
從簡單PDF文件或PDF包文檔中取出文本
從Excel電子表格中收集單元格,行和列中的原始文本或格式化文本
從EPUB,CHM,Markdown和FB2文件中拉出單句或全文
從分析文檔中獲取文本區域并從支持的文檔格式中提取元數據
從電子郵件容器中獲取數據(Exchange Web服務器,POP3,IMAP)
使用純文本格式化程序(簡單和ASCII)或使用Markdown Formatter獲取文本
從文件或流中提取文本內容而無需安裝文檔閱讀器
以編程方式從電子郵件和附件中獲取格式化文本
從PDF表單中提取數據并從PDF或Word文檔中獲取格式化表
從Word文檔中提取原始或HTML格式的文本
摘錄EPUB和CHM文件中的目錄
從支持的格式獲取所有或選定的圖像并旋轉提取的圖像
在文檔中搜索簡單文本,單詞和正則表達式
Markdown Formatter支持字體,超鏈接,標題,列表和表格的格式
使用快速或標準文本提取模式從文檔中獲取格式化文本
從OneNote文檔的單頁或多頁中抽出文本
從PowerPoint演示文稿中獲取格式化文本或從特定幻燈片中刪除文本
HTML格式化程序支持段落,超鏈接,字體,標題,列表和表格的格式
拉出文本及其內容結構完整和摘錄文檔中突出顯示的文本
從Zip Archives和OST容器中的文件中取出文本并從數據庫容器中提取文本
在文檔中搜索和提取突出顯示的表達式
使用邊,角度和交點執行自定義格式以格式化純文本
使用GroupDocs.Parser for .NET API從文檔中提取文本很簡單,只需幾行代碼即可實現。
更新時間:2019-01-15 16:11:08.000 | 錄入時間:2019-01-15 16:08:46.000 | 責任編輯:胡濤