翻譯|行業資訊|編輯:凌霄漢|2022-04-12 16:39:58.060|閱讀 294 次
概述:數據可視化在各個行業都有越來越廣泛的應用, LightningChart作為一個這方面的圖表報表控件,有著不可或缺的作用。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
幾天前我在進行谷歌搜索,特別是,我想知道需要在應用程序中可視化大量數據點的開發人員有哪些選擇。令我驚訝的是,我真的找不到那么多解決方案,事實上,我得到的大部分結果都是多年前的結果。
但是有一個結果引起了我的注意,那是一篇關于用戶詢問如何繪制數十億個數據點的 Reddit 帖子?雖然其他用戶回答說“嘗試使用 Power BI 或 Excel”,但其他用戶建議在 Python 環境中使用 Pandas DataFrame 等變通方法來存儲和操作數據。但是發布問題的用戶不想存儲和操作數據,用戶想要可視化數據!
那么,如何可視化數十億個數據點,為什么要這樣做?
繼續分析 Reddit 用戶的問題,一些用戶表示,試圖將數十億個數據點可視化超出了大多數人的工作范圍。
事實上,該帖子的作者后來解釋說,作為一名與物理學家合作設計大功率電源的開發人員,他們需要了解有源元件在高頻下的影響。
例如,醫學可視化是需要特定技術特征和圖表類型來處理大量數據的要求苛刻的行業之一。
醫學可視化是可以在從管理或醫療保健數據監控到研究、分子分析或醫療設備開發的幾乎每個過程中使用數據可視化的行業之一。
Power BI 等解決方案可用于可視化醫療管理數據的數千個數據點,而在可視化復雜數據以進行高端分析時,圖表組件是必不可少的。
另一個真實案例是賽車運動,數十億數據點從高性能(F1、Nascar 等)車輛實時傳輸到數據記錄系統,這些系統即時處理數據并支持賽車工程師做出決策.
需要可視化數十億數據點的行業列表可以繼續……振動分析、工業自動化、衛星、3D 移動測繪等等……但是從 Reddit 帖子中強調的第二個學習是實施變通辦法。
Reddit 用戶分享說,具有高采樣率的快速變化的屬性可能需要數小時才能渲染,而臨時解決方案(例如縮小數據集)會導致信息丟失,這種情況也經常發生在下采樣方法中。
第三個學習讓我們評估用戶試圖實施的圖表解決方案。例如,用戶實現了 M atplotlib,使用 WebGL 和 d3.js 實現了 Plotly,用用戶自己的話來說:“所有解決方案似乎都難以擴展到這個 [十億數據點] 大小”。
現在,這些都是數據可視化的好解決方案,但它們不是面向高性能的,這需要我們定義什么是高性能數據可視化?或者高性能圖表的特點是什么?
讓我們從高性能的定義開始,它指的是“比其他東西更好、更快或更高效”的東西,在數據可視化或圖表(也稱為圖表控件或組件)的上下文中,高性能數據可視化指的是那些比其他解決方案更好、更快、更高效的圖表控件。
我們確定了高性能圖表庫的 6 個特征、它們的影響以及它們在現實世界中的使用方式。
高性能可實現: | 為什么? | 實際用例: |
以高數據速率流式傳輸實時圖表。 | 可視化實時發生,支持平滑滾動的圖表和多達數千個數據饋送同時進行。 |
使用它的行業:振動研究、機器狀態監測、儀器儀表、工業自動化、醫療應用(ECG、EEG)、地震監測、金融科技等。 |
刷新率非常高。 ? |
圖表可以更新 100 次/秒,而不是 1 次/分鐘。它不會抽搐,提供更愉快的可視化和交互。 | 應用程序需要以盡可能低的延遲顯示動態 2D 或 3D 圖表。 |
最小的滯后。 | 允許立即可視化數據,而不會在數據流中出現延遲。以最小的延遲支持有效和實時的決策。 |
使用它的行業:賽車遙測系統、航空、貿易、醫藥等。? |
完整的準確度數據。 | 所有數據都可以完全精確地可視化,而無需使用可能導致丟失有價值信息的下采樣等變通方法減小數據集的大小。 | 在醫學可視化中,心電圖 (ECG) 數據通常以 1000 個數據點/秒的速度傳輸。通過下采樣減少可視化值會丟失重要信息。 |
減少資源消耗(能源、工作、時間)。 | 智能算法降低了對計算能力的要求和能源的消耗。高性能可視化不需要超級計算機。 大型復雜數據集的即時可視化顯著節省了工作時間。 |
使用傳統圖表可視化數據集可能需要數小時,而 CPU 100% 被最大能耗占用。 顯著節省能源和工作時間。 |
更好的用戶體驗。 | 更吸引人的圖表外觀和感覺以及交互式使用。 | 所有應用程序都受益。 |
這是對數據可視化中被確定為高性能的廣泛但必要的回顧,因為并非所有數據可視化工具都是面向高性能的,而是面向更基本的用途。
現在,讓我們談談向下采樣,它與僅提供高性能相反,是可視化百萬/十億數據點的最常見解決方法之一。在所謂的“高性能”圖表工具的范圍內,下采樣問題很普遍,因為通常是為了渲染大型數據集而實現的,但是,什么是向下采樣?
下采樣是一種僅處理部分數據的技術,例如,僅對每 100 個數據點進行可視化,并丟棄其余 99% 的數據,從而導致大量信息丟失。
首先,這是一個示例,當所有數據都已正常呈現時,數據集的外觀:
相反,當數據集被下采樣并且大量信息丟失時,數據集的外觀如下:
因此,考慮當數據集包含 1,000,000 個點并且應用了 100 的下采樣因子時,將僅處理 10,000 個數據點。信息丟失將是巨大的實時應用程序,這些應用程序依賴于實時數據流,因為醫學可視化或賽車遙測系統中的實時監控將顯示不完整信息的圖表和分析。
基本用例可能支持下采樣的使用,但我們談論的是醫療可視化、賽車運動、電信、金融科技等需要處理所有傳入數據的行業的高性能數據可視化。在這種情況下,現實世界的應用程序要求更高,簡單的解決方案,例如開源庫或簡單的數據可視化工具,無法完成工作。
分析Reddit 用戶的真實案例場景,我們可以發現該用戶正在努力尋找一種可以可視化數十億數據點的解決方案,而無需應用下采樣技術,也不會放棄縮放和縮放等高性能功能。平移。 如何解決問題?
如果您對該圖表控件感興趣,歡迎加入圖表控件QQ交流群:740060302
如果你想了解LightningChart.NET正版價格,歡迎查看產品介紹或
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn