翻譯|行業資訊|編輯:吉煒煒|2025-09-02 09:46:28.217|閱讀 31 次
概述:處理 CSV 文件是數據分析師和開發人員的日常工作。使用 Aspose.Cells,您可以在 Pandas 中導入 CSV,同時確保更好的控制、可靠性以及與 Excel 格式的兼容性。在本篇教程中,您將逐步學習如何將 CSV 轉換為 Pandas、處理 Excel 文件以及將其導出到 Pandas DataFrame。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
處理 CSV 文件是數據分析師和開發人員的日常工作。如果您需要將 CSV 轉換為 Pandas DataFrame,Pandas 提供了直接read_csv()函數,但有時您需要更強大的功能。這時,Aspose.Cells for Python 就派上用場了。使用 Aspose.Cells,您可以在 Pandas 中導入 CSV,同時確保更好的控制、可靠性以及與 Excel 格式的兼容性。在本篇教程中,您將逐步學習如何將 CSV 轉換為 Pandas、處理 Excel 文件以及將其導出到 Pandas DataFrame。
加入Aspose技術交流QQ群(1041253375),與更多小伙伴一起探討提升開發技能。
Aspose.Cells for Python via .NET是一個功能強大的電子表格處理庫。它允許您以編程方式創建、讀取、編輯和轉換 Excel 和 CSV 文件,而無需 Microsoft Excel。在處理 CSV 到 Pandas 的轉換時,Aspose.Cells 可以充當原始 CSV 文件和結構化 Pandas DataFrame 之間的可靠橋梁。
在運行示例之前,請確保已安裝以下內容:
pip install aspose-cells-python
pip install pandas
這兩個庫將允許您使用 Aspose.Cells 加載和處理 CSV/Excel 文件,然后將它們轉換為 Pandas DataFrames 進行分析。
通過 .NET 為 Python 使用 Aspose.Cells → 用于讀取和處理 CSV/Excel 文件。
Pandas →用于構建和分析 DataFrames。
在本節中,您將逐步了解使用 Aspose.Cells for Python 將 CSV 文件轉換為 Pandas DataFrame 的完整過程。每個步驟都分解為多個小任務,方便您輕松掌握。首先,您將把 CSV 文件加載到工作簿中。提取其內容并構建 Pandas DataFrame。
讓我們首先將 CSV 文件加載到 Aspose.Cells 工作簿中。
import aspose.cells as ac # Load CSV file into Workbook csv_wb = ac.Workbook("data.csv") # Access the first worksheet (CSV loads as sheet) csv_ws = csv_wb.worksheets[0]
文件加載完成后,逐行提取其內容。這將為數據轉換為 DataFrame 做好準備。
cells = csv_ws.cells # Extract CSV data into Python list data = [] for row_idx in range(cells.min_data_row, cells.max_data_row + 1): row_data = [] for col_idx in range(cells.min_data_column, cells.max_data_column + 1): row_data.append(cells.get(row_idx, col_idx).value) data.append(row_data)
現在,將提取的列表轉換為 Pandas DataFrame。此步驟展示如何將 CSV 轉換為帶有適當標頭的 Pandas DataFrame。
import pandas as pd # Convert to Pandas DataFrame headers = data[0] # First row as header rows = data[1:] # Remaining rows as data df = pd.DataFrame(rows, columns=headers) print(df.head())
現在,您已成功使用 Aspose.Cells 將 CSV 轉換為 DataFrame Pandas。
通過這些步驟,您已經了解了如何使用 Aspose.Cells 將 CSV 文件轉換為 Pandas DataFrame。接下來,讓我們探索如何處理 Excel 文件:首先將其保存為 CSV,然后將其加載到 Pandas 中。
有時您的數據是 Excel 格式(.xlsx 或 .xls),并且您想通過 CSV 將 Excel 轉換為 Pandas DataFrame。Aspose.Cells 可以實現無縫銜接。
按照以下步驟通過 CSV 文件將 Excel 轉換為 Pandas DataFrames:
以下代碼示例展示了如何在 Python 中將 Excel 轉換為 pandas DataFrame:
import aspose.cells as ac import pandas as pd # Load an Excel file excel_wb = ac.Workbook("PandasTest.xlsx") # Save Excel as CSV excel_wb.save("converted.csv", ac.SaveFormat.CSV) # Reload CSV with Aspose.Cells csv_wb = ac.Workbook("converted.csv") csv_ws = csv_wb.worksheets[0] # Extract data from CSV cells = csv_ws.cells data = [] for row_idx in range(cells.min_data_row, cells.max_data_row + 1): row_data = [] for col_idx in range(cells.min_data_column, cells.max_data_column + 1): row_data.append(cells.get(row_idx, col_idx).value) data.append(row_data) # Convert to Pandas DataFrame headers = data[0] rows = data[1:] df = pd.DataFrame(rows, columns=headers) # Show results print(df.head())輸出:
Product A Product B Period 0 50 160 Q1 1 100 32 Q2 2 170 50 Q3 3 300 40 Q4
對于非常大的數據集,Aspose.Cells 比普通的 Pandas 更能處理內存。您甚至可以啟用內存優化。步驟與之前相同。唯一的變化是加載 CSV 文件LoadOptions并設置MEMORY_PREFERENCE為高效處理大文件。
以下代碼示例展示了如何在 Python 中將大型 CSV 文件轉換為 pandas DataFrame:
import aspose.cells as ac import pandas as pd # Load the large CSV file with Aspose.Cells options = ac.LoadOptions() options.memory_setting = ac.MemorySetting.MEMORY_PREFERENCE csv_wb = ac.Workbook("large_file.csv", options) csv_ws = workbook.worksheets[0] # Extract data from CSV cells = csv_ws.cells data = [] for row_idx in range(cells.min_data_row, cells.max_data_row + 1): row_data = [] for col_idx in range(cells.min_data_column, cells.max_data_column + 1): row_data.append(cells.get(row_idx, col_idx).value) data.append(row_data) # Convert to Pandas DataFrame headers = data[0] rows = data[1:] df = pd.DataFrame(rows, columns=headers) # Show results print(df.head())
在本指南中,您學習了如何將 CSV 文件直接加載到 Aspose.Cells 中并將其轉換為 Pandas DataFrames,以及如何在導入 Excel 文件之前將其保存為 CSV。Aspose.Cells 與 Pandas 結合使用,可為您提供更強大的控制力、性能和靈活性,使您的數據處理任務更加可靠且可擴展。
————————————————————————————————————————
關于慧都科技:
慧都科技是專注軟件工程、智能制造、石油工程三大行業的數字化解決方案服務商。在軟件工程領域,我們提供開發控件、研發管理、代碼開發、部署運維等軟件開發全鏈路所需的產品,提供正版授權采購、技術選型、個性化維保等服務,幫助客戶實現技術合規、降本增效與風險可控。慧都科技Aspose在中國的官方授權代理商,提供Aspose系列產品免費試用,咨詢,正版銷售等于一體的專業化服務。Aspose是文檔處理領域的優秀產品,幫助企業高效構建文檔處理的應用程序。
下載|體驗更多Aspose產品,請咨詢,或撥打產品熱線:023-68661681
加入Aspose技術交流QQ群(1041253375),與更多小伙伴一起探討提升開發技能。
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉載自:慧都網