翻譯|使用教程|編輯:胡濤|2022-07-18 10:21:34.867|閱讀 210 次
概述:本指南將提供一種在 C# 和 VB.NET 中提取 Word 文本的便捷解決方案,歡迎查閱!
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
Word 文本可以從文檔中提取并保存在其他文件(例如 TXT 文件)中以供其他用途。本指南將提供一種在 C# 和 VB.NET 中提取 Word 文本的便捷解決方案。
一般來說,一個Word文檔必須包含很多內容,比如文本、圖片、表格等,其中一些內容可以提取出來用于其他文檔或文件中。以下指南重點介紹如何通過 Spire.Doc for .NET 從 Word 文檔中提取文本并保存在 C# 和 VB.NET 中的 TXT 文件中。以下屏幕截圖顯示了從 Word 中提取的部分文本。
文本全部保存在 .NET 提供的 Section 類 Spire.Doc 的 Paragraph 中。因此,您必須先獲取文檔的部分和段落,然后再獲取要提取的文本。以下步驟介紹了有關如何提取文本的詳細信息。
首先,使用參數字符串fileName調用Document類的LoadFromFile方法來加載文檔。其次,初始化一個 StringBuilder 類實例來保存接下來要提取的文本。第三,使用 foreach 語句獲取文檔中每個部分的每個段落,并調用StringBuilder 類的AppendLine(Paragraph.Text)方法將所有提取的字符串(所有段落中的文本)的副本附加到 StringBuilder 實例中。最后,使用參數字符串路徑、字符串內容調用 File.WriteAllText 方法來創建一個新文件以保存提取的文本。請使用代碼。
using Spire.Doc; using Spire.Doc.Documents; using System.Text; using System.IO; namespace ExtractTextfromWord { class ExtractText { static void Main(string[] args) { //Load Document Document document = new Document(); document.LoadFromFile(@"E:\Work\Documents\WordDocuments\Spire.Doc for .NET.docx"); //Initialzie StringBuilder Instance StringBuilder sb = new StringBuilder(); //Extract Text from Word and Save to StringBuilder Instance foreach (Section section in document.Sections) { foreach (Paragraph paragraph in section.Paragraphs) { sb.AppendLine(paragraph.Text); } } //Create a New TXT File to Save Extracted Text File.WriteAllText("Extract.txt", sb.ToString()); System.Diagnostics.Process.Start("ExtractText.txt"); } } }
[VB]
Imports Spire.Doc Imports Spire.Doc.Documents Imports System.Text Imports System.IO Namespace ExtractTextfromWord Friend Class ExtractText Shared Sub Main(ByVal args() As String) 'Load Document Dim document As New Document() document.LoadFromFile("E:\Work\Documents\WordDocuments\Spire.Doc for .NET.docx") 'Initialzie StringBuilder Instance Dim sb As New StringBuilder() 'Extract Text from Word and Save to StringBuilder Instance For Each section As Section In document.Sections For Each paragraph As Paragraph In section.Paragraphs sb.AppendLine(paragraph.Text) Next paragraph Next section 'Create a New TXT File to Save Extracted Text File.WriteAllText("Extract.txt", sb.ToString()) System.Diagnostics.Process.Start("ExtractText.txt") End Sub End Class End Namespace
Spire.Doc 是無需自動化即可操作 MS Word 文檔的專業獨立組件,使開發人員能夠在其 .NET、WPF 和 Silverlight 應用程序上生成、讀取、寫入、修改 Word 文檔。
歡迎下載|體驗更多E-iceblue產品
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn