翻譯|行業資訊|編輯:胡濤|2024-06-03 10:35:42.263|閱讀 102 次
概述:這篇博文展示了Aspose.HTML for .NET提供的另一個突出功能。這個功能豐富的 .NET 庫使您能夠以C#編程方式從網頁中提取文本。此外,此文本提取 API公開了多個用于從HTML頁面中提取文本的類和方法。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
HTML表格在網頁上以網格格式顯示數據。表格以行和列的形式組織表格數據,其中每個單元格可以包含文本、圖像、鏈接或其他 HTML 元素。在這篇博文中,我們將學習如何用 Java 創建 HTML 表。
Aspose.Html 是一種高級的HTML操作API,可讓您直接在.NET應用程序中執行廣泛的HTML操作任務,Aspose.Html for .NET允許創建,加載,編輯或轉換(X)HTML文檔,而無需額外的軟件或工具。API還為固定布局格式(如PDF和XPS)以及許多光柵圖像格式提供了高保真渲染引擎。
Aspose API支持流行文件格式處理,并允許將各類文檔導出或轉換為固定布局文件格式和最常用的圖像/多媒體格式。
這篇博文展示了Aspose.HTML for .NET提供的另一個突出功能。這個功能豐富的 .NET 庫使您能夠以C#編程方式從網頁中提取文本。此外,此文本提取 API公開了多個用于從HTML頁面中提取文本的類和方法。
因此,您可以輕松地為您的軟件開發網站文本提取器,這將為您的業務帶來競爭優勢。因此,請仔細閱讀本文,不要錯過任何部分。此外,請確保您已在本地計算機上安裝了 .NET 以實現該功能。
Aspose.HTML for .NET 提供了一種從網頁中提取文本的無縫解決方案。作為 C# 程序員,您可以選擇此文本提取 API來開發網頁文本提取器以提高工作效率。此外,在多種情況下您都需要網站文本提取 API,因此Aspose.HTML for .NET可能是首選。不過,您可以通過下載DLL 文件或在NuGet包管理器 中運行以下命令來 安裝它 :
PM> Install-Package Aspose.Html
查看完整的安裝說明。
使用Aspose.HTML for .NET庫既不復雜也不困難。因此,此文本提取 API是由我們頂尖的工程師精心設計的。那么,讓我們開始編寫代碼片段吧。
您可以按照以下步驟操作:
以下代碼片段展示了如何以 C# 編程方式從網頁中提取文本:
namespace Aspose.Html { class HTML { // Extract Text from Webpage in C# - Text Extraction API static void Main(string[] args) { // Define the directory address String dir = "/sample-files/"; // Initialize a constructor of HTMLDocument class to load a webpage. using (var document = new HTMLDocument("http://blog.aspose.com/html/generate-pdf-from-markdown-in-java-markdown-to-pdf/")) { // Collect all h2 headings by calling the GetElementsByTagName method. var headings = document.GetElementsByTagName("h2"); String data = "********h2 headings********" + System.Environment.NewLine; // loop through all the retrieved h2 headings. for (var i = 0; i < headings.Length; i++) { data += headings[i].TextContent+System.Environment.NewLine; } // Get the bold text using the GetElementsByTagName method. var boldTags = document.GetElementsByTagName("strong"); data += "********Bold Text********" + System.Environment.NewLine; // Loop through all the bold text retrieved from a webpage. for (var i = 0; i < boldTags.Length; i++) { data += boldTags[i].TextContent + System.Environment.NewLine; } // Call the WriteAllText method to save the text in a txt file. File.WriteAllText(Path.Combine(dir, "data.txt"), data); } } } }
上述代碼示例的輸出如下圖所示:
此在線網頁文本提取器是一款可以非編程方式執行數據提取任務的工具。它是一款基于 Web 的應用程序,在手機的 Web 瀏覽器中也能很好地運行。最重要的是,它是免費的,并且可以非常快速地從 HTML 頁面中提取文本。將來,此在線文本提取器將配備更多功能。
這篇博文到此結束。我們希望您已經學會了如何使用C# 以編程方式從網頁中提取文本。此外,您還了解了從 HTML 頁面中提取文本的實際實現。事實上,在快速應用程序開發方面,程序員總是傾向于使用可靠且強大的 API,幸運的是,Aspose.HTML for .NET幾乎可以為您完成這項工作。因此,您可以通過訪問文檔和 API參考了解有關此文本提取 API 的更多信息。
歡迎下載|體驗更多Aspose產品
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn