在C#、Java或Batch中解析和提取內容、資源和元數據,使你的數據提取自動化
標簽:PDF開發商: PDF Tools AG
當前版本: v6.19.0.2
產品類型:控件
產品功能:文件格式轉換
平臺語言:Java|C#|.NET Core|C/C++|COM|Shell
開源水平:不提供源碼
本產品的分類與介紹僅供參考,具體以商家網站介紹為準,如有疑問請來電 023-68661681 咨詢。
3-Heights? PDF Extract是一個高效和通用的PDF內容和元數據解析器和提取器。它構成了許多解決方案的技術基礎:從基本的PDF到文本轉換到商業智能、大數據和報告領域的復雜解決方案。它允許將二進制數據(PDF)精確而徹底地轉換為結構化信息,例如Unicode、圖像和元數據。該產品通過命令行提供逐頁提取,或使用其API提供更復雜的操作,例如,使用C#、Visual Basic、Java或C/C++。
* 關于本產品的分類與介紹僅供參考,精準產品資料以官網介紹為準,如需購買請先行測試。
信息可以在基于對象類型的基礎上提取。該控件支持以下對象及其各自的屬性:
查詢文檔屬性,包括:作者、標題、主題、關鍵詞、應用、PDF制作、創建日期、修改日期
文檔加密
文檔線性化
PDF版本,例如1.4和1.7版本
從文件或內存中讀取文檔
查詢頁面數量
書簽屬性
查詢頁面標簽
資源屬性
目的地
嵌入式文件的列表和提取內容
列出并設置可選的內容組(層)
頁面大小和其它尺寸,例如可見大小和其它關于印刷的尺寸
查看旋轉頁面
頁面內容
跳轉到下一個對象并查詢它的屬性
查詢當前圖狀態
通過字符,文字或頁面提取文本作為Unicode
支持不包括空格字符的文本
坐標(X,Y)
邊界框
點陣字體大小
點長度
字符長度
旋轉
基礎名
大寫字母和小寫字母的高度
字體子集的可用字符名稱
編碼
旗幟
邊界框字體程序數據流
類型(例如TrueType,Type1)
斜體字體的傾斜角度
基準線和跟蹤線的推薦距離
基礎顏色空間
著色劑
像素點
索引顏色空間的最高索引值
色彩空間(著色劑,索引,單色)
查看表
名稱
像素的高度和寬度
分辨率
每個通道的位數
顏色空間(雙色調,單色,顏色)
轉換到RGB
可選的圖像
提取圖像(從文件或內存中)并設置方向
設置提取和存儲圖像的壓縮(Flate, CCITT G3, G3-2D, G4, JPEG, LZW, none)
遮罩層,透明的遮罩
可選的圖像以及它是否應該作為打印標準
混合模式
字符和文字間的距離
電流變換矩陣
虛線圖的元素和側重點
填充顏色空間和線條顏色
填充顏色和線條顏色為RGB或CMYK值
填充顏色和線條顏色的疊印設置
填充顏色和線條顏色的透明度常量
字體和字體大小
水平縮放
文本樣式(行距)
線的樣式和線寬
渲染意圖的名稱
平滑度公差
文本剔除
文本遷移
轉換值
取向
旋轉
在X軸和Y軸方向縮放
在X軸和Y軸方向定位
在X軸和Y軸方向偏移
注釋
注釋類型
顏色
內容
日期
目的地
標記注釋
名稱
位置
主題
文本標簽
路徑
數量
目的地
標題
位置
類型
頁號
更新時間:2021-12-23 11:50:14.000 | 錄入時間:2007-04-03 14:21:00.000 | 責任編輯:胡濤