翻譯|使用教程|編輯:胡濤|2022-08-30 10:42:23.883|閱讀 236 次
概述:本文將向您展示如何使用 doc.GetText() 的方法直接從包含文本、圖像和表格的 word 文檔中提取文本。更方便開發者從代碼中提取word文檔中的文本。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
Spire.Doc for .NET是一款專門對 Word 文檔進行操作的 .NET 類庫。在于幫助開發人員無需安裝 Microsoft Word情況下,輕松快捷高效地創建、編輯、轉換和打印 Microsoft Word 文檔。擁有近10年專業開發經驗Spire系列辦公文檔開發工具,專注于創建、編輯、轉換和打印Word/PDF/Excel等格式文件處理,小巧便捷。
有時我們在處理信息量很大的word文檔時,只需要從word文檔中獲取文本以供其他使用。在 Spire.Doc 的幫助下,我們已經演示了如何通過遍歷 word 文檔中的每個段落然后相應地附加文本來從 word 文檔中提取文本。本文將向您展示如何使用 doc.GetText() 的方法直接從包含文本、圖像和表格的 word 文檔中提取文本。更方便開發者從代碼中提取word文檔中的文本。
第 1 步:創建一個 word 實例并從文件中加載源 word 文檔。
Document doc = new Document(); doc.LoadFromFile("Sample.docx");
第 2 步:調用 doc.GetText() 方法從 word 文檔中獲取所有文本。
string s = doc.GetText();
第 3 步:創建一個新的 TEXT 文件以保存提取的文本。
File.WriteAllText("Extract.txt", s.ToString());
從word文檔中獲取所有文本后的有效截圖:
完整代碼:
using Spire.Doc; using System.IO; namespace GetText { class WordText { public void GetText() { Document doc = new Document(); doc.LoadFromFile("Sample.docx"); string s = doc.GetText(); File.WriteAllText("Extract.txt", s.ToString()); } } }
以上便是如何在C#中獲取word文檔中的文本,如果您有其他問題也可以繼續瀏覽本系列文章,獲取相關教程,你還可以給我留言或者加入我們的官方技術交流群。
歡迎下載|體驗更多E-iceblue產品
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn