翻譯|使用教程|編輯:胡濤|2022-03-30 13:52:12.040|閱讀 304 次
概述:本篇文章主要介紹了如何使用Aspose.Note控件從 OneNote 文檔中提取文本或圖像,歡迎查閱!
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
我們可以在 OneNote 文檔中以文字、圖畫、截屏、音頻評論等形式收集和整理筆記。我們有時可能需要在 Java 應用程序中以編程方式從 OneNote 文檔中提取文本或圖像。這種提取允許我們單獨重用提取的文本或圖像。在本文中,我們將學習 如何使用 Java 從 OneNote 文檔中提取文本或圖像。
為了從OneNote文檔中提取文本和圖像 ,我們將使用 Aspose.Note API。它允許在不使用 MS OneNote 的情況下以編程方式創建、閱讀和轉換 OneNote 文檔。請下載API 的 JAR 或在基于 Maven 的 Java 應用程序中添加以下pom.xml配置。
<repository> <id>AsposeJavaAPI</id> <name>Aspose Java API</name> <url>//repository.aspose.com/repo/</url> </repository> <dependency> <groupId>com.aspose</groupId> <artifactId>aspose-note</artifactId> <version>22.1</version> <classifier>jdk17</classifier> </dependency>
我們可以按照下面給出的步驟輕松地從 OneNote 文檔中提取所有文本:
以下代碼示例展示了如何使用 Java 從 OneNote 文件中提取所有文本。
// This code example demonstrates how to Extract all the text from OneNode document. // Load the document into Aspose.Note. Document oneFile = new Document("D:\\Files\\Note\\Sample1.one"); // Retrieve text List<RichText> textNodes = (List<RichText>) oneFile.getChildNodes(RichText.class); for (RichText richText : textNodes) { if(!richText.getText().isBlank()) System.out.println(richText.getText().toString()); }
我們可以按照以下步驟從 OneNote 文檔的特定頁面中提取文本:
以下代碼示例展示了如何使用 Java 從 OneNote 文件的特定頁面中提取文本。
// This code example demonstrates how to Extract text from a specific page of a OneNode document. // Load the document into Aspose.Note Document doc = new Document("D:\\Files\\Note\\Sample1.one"); // Get list of page nodes List<Page> pages = doc.getChildNodes(Page.class); // Get page by index Page page = pages.get(0); // Get text of the page List<RichText> textNodes = (List<RichText>) page.getChildNodes(RichText.class); // Show text for (RichText richText : textNodes) { if(!richText.getText().isBlank()) System.out.println(richText.getText().toString()); }
我們可以逐頁遍歷所有頁面并提取每個頁面的文本,如下面的代碼示例所示:
// This code example demonstrates how to Extract text from pages of a OneNode document. // Load the document into Aspose.Note. Document doc = new Document("D:\\Files\\Note\\Sample1.one"); // Get list of page nodes List<Page> pages = doc.getChildNodes(Page.class); for (Page p : pages) { System.out.println("---- Page Started Here ----"); List<RichText> textNodes = (List<RichText>) p.getChildNodes(RichText.class); for (RichText richText : textNodes) { if(!richText.getText().isBlank()) System.out.println(richText.getText().toString()); } System.out.println("---- Page Ended Here ----"); System.out.println(); }
我們還可以按照以下步驟從 OneNote 文檔中提取圖像:
以下代碼示例展示了如何使用 Java 從 OneNote 文件中提取圖像。
// This code example demonstrates how to Extract images from OneNode document. // Load the document into Aspose.Note Document doc = new Document("D:\\Files\\Note\\Sample1.one"); // Get all images List<Image> list = doc.getChildNodes(Image.class); System.out.printf("Total Images: %s\n\n", list.size()); // Traverse the list for (int i = 0; i < list.size(); i++) { Image image = list.get(i); // Show image properties System.out.println("Width: " + image.getWidth()); System.out.println("Height: " + image.getHeight()); System.out.println("OriginalWidth: " + image.getOriginalWidth()); System.out.println("OriginalHeight: " + image.getOriginalHeight()); System.out.println("FileName: " + image.getFileName()); System.out.println("LastModifiedTime: " + image.getLastModifiedTime()); String outputFile = "ExtractImages_out" + i + "_" + image.getFileName(); // Save the image byte[] buffer = image.getBytes(); Files.write(Paths.get("D:\\Files\\Note\\Images\\" + outputFile), buffer); System.out.printf("File saved: %s\n", outputFile); }
在本文中,我們學習 了如何從整個 OneNote 文檔或文檔的特定頁面 中提取文本。我們還 了解了如何以編程方式從 OneNote 文檔中提取圖像。此外,您可以使用文檔了解更多關于 Aspose.Note for Java API 的信息。如有任何問題也可以聯系我們。
歡迎下載|體驗更多Aspose產品
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn