翻譯|使用教程|編輯:李顯亮|2020-07-17 10:11:55.907|閱讀 1569 次
概述:Microsoft Word文件格式DOC / DOCX很著名,因為文字處理器支持多種功能來組織和解釋信息。在本文中,我們將學習使用Java將Word文件(DOC / DOCX)轉換為HTML。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
Microsoft Word文件格式DOC / DOCX很著名,因為文字處理器支持多種功能來組織和解釋信息。同樣,HTML文件格式有助于在Web應用程序中顯示信息。
在本文中,我們將學習使用Java將Word文件(DOC / DOCX)轉換為HTML。以下是我們將在此處探討的一些用例: 如果想要測試這項新功能,可點擊這里下載最新版試用。
可以按照以下步驟將Word轉換為HTML:
下面的代碼示例顯示了如何使用Java將DOCX轉換為HTML:
// Load the document from disk. Document doc = new Document(dataDir + "TestFile.docx"); // Save the document into HTML. doc.save(dataDir + "Document_out.html", SaveFormat.HTML);
輸入DOCX文件預覽
輸出HTML文件預覽
HTML5是HTML的最新版本。我們注意到在Aspose.Words API中對支持HTML5的重復請求。因此,支持DOCX到HTML的轉換,可以通過以下步驟轉換文件:
下面的代碼段顯示了如何在Java中將DOCX轉換為HTML5:
// Load the document from disk. Document doc = new Document(dataDir + "TestFile.docx"); HtmlSaveOptions opts = new HtmlSaveOptions(SaveFormat.HTML); opts.setHtmlVersion(HtmlVersion.HTML_5); opts.setExportImagesAsBase64(true); opts.setExportPageMargins(true); doc.save(dataDir + "TestFile.html", opts);
DOC或DOCX文件有時受密碼保護或使用密碼加密。也可以將此類文件轉換為HTML。但是,在加載Word文件時需要密碼。可以按照以下步驟將DOCX轉換為HTML:
同樣,以下代碼示例顯示了如何使用Java將受密碼保護的DOCX文件轉換為HTML:
LoadOptions options = new LoadOptions(); options.setPassword("aspose"); // Load the document from disk. Document doc = new Document(dataDir + "TestFile.docx" , options); //Save the document in HTML format. doc.save(dataDir + "DocxToHTML.html",SaveFormat.HTML);
MHTML文件是包含嵌入式內容和媒體的單個文件。您可以按照以下步驟將Word文件(DOC / DOCX)轉換為MHTML:
下面的代碼段基于此步驟。因此,它顯示了如何使用Java將DOCX轉換為MHML:
// Load word document from disk. Document doc = new Document(dataDir + "TestFile.docx"); // Save the document into MHTML. doc.save(dataDir + "Document.mhtml", SaveFormat.MHTML);
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn