原創|行業資訊|編輯:陳俊吉|2017-01-09 09:42:11.000|閱讀 243 次
概述:在耀眼的職業光環下,數據分析師自身的成長是非常艱難的。數據分析師們不僅得懂管理、懂業務、懂分析,還得懂工具。面對越來越龐大的數據,數據分析師們不能依靠計算器進行分析,必須依靠強大的數據分析工具完成數據分析工作。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
一個數據分析項目,通常數據處理時間占70%以上,使用先進的工具有利于提升效率。那么,哪款數據分析工具深受數據分析師們的青睞呢?
當然是 IBM 數據分析大家族里的 Data Sets。
Data Sets是提供的一種新的數據門戶,用于創建一個定制的、用戶經常使用的items的集合。Data Sets從packages或data modules中創建。當Data Sets更新后,下次在儀表板或storytelling中使用的也將是最新的Data Sets版本。
通過從一個package或者一個data module中選擇一個或多個列的方式定義Data Sets,并且可以使用過濾來減少記錄數量。相當于對數據做了一個行和列的過濾,取得數據的子集。數據被提取出來存放在系統中。由于數據被緩存了,Data Sets可以提高查詢效率,減少數據庫的工作負載。也可以用Data Sets為數據保留一個特定時間的版本。
一起來看一下在儀表板中使用Data Sets的基本方法
首先,打開儀表板,選擇FM package。
在下面的界面中定義Data Sets的行和列。
接下來,我們將介紹進階的使用方法。
匯總明細值,抑制重復
當從package或者data module中創建Data Sets時,可以選擇是否匯總明細值,抑制重復。當勾選了這個選項時,測量值會以顯式包含在這個Data Sets中的最小粒度做一個匯總。例如,您的數據倉庫中可能有一張數百萬條記錄的銷售表,里面記錄了各個銷售商的銷售數量,但是您只想對每個區域的銷售數量進行分析。假設您的數據集中只包含了“區域”和“銷售數量”這兩列,并且您勾選了“匯總明細值,抑制重復”,那么這個Data Sets中將只包含和您的“區域”數量相當的記錄數。
請注意觀察比較下面的兩張圖,勾選了匯總的圖中“Quantity”列的數值比沒有勾選匯總的圖中的“Quantity”列的數值大得多,這是因為前者做了一個Group by的匯總計算。
使用這個選項的好處是,它可以將數據集壓縮到更少的行,這可以帶來更好的性能。但是,當您需要在分析中關注信息細節的時候就不要使用這個選項。
刷新Data Sets
通過Cognos Analytics門戶,您可以隨時改變數據集的列和過濾器。您也可以隨時更新它的數據,或者定義一張時間表自動刷新數據,例如每周、每天、每小時或每X分鐘。
從Data Sets中創建Data Sets
通常我們是從data module中創建 Data Sets的,但其實也可以從Data Sets中創建Data Sets。每個Data Sets都允許您進一步的連接、匯總和預計算數據。使用這種方法您可以在匯總數據的基礎上進一步匯總。您可以將數億條記錄通過匯總削減成更適合專題探索的信息。
Data Sets的控制
DataSets和包括底層數據庫在內的所有系統都是分隔的,因此數據庫管理員不必擔心對Data Sets的查詢會消耗數據庫系統的運算資源。通過使用過濾器非常容易控制Data Sets 的大小。Cognos管理員可以限定單個Data Sets的大小和系統上任何一個用戶可以占用的總量。Cognos管理員也可以控制誰可以創建Data Sets。如果儀表板使用的Data Sets比較小,那么響應速度就非常快。
在Cognos 環境之間移動Data Sets
可以把Data Sets從一個Cognos Analytics環境轉移到另一個環境。如果您需要把開發環境中經過測試的Data Sets發布到生產環境中,首先要在開發環境中創建一個包含了有Data Sets的那些文件夾的“Deployment”。如果希望包含提取的數據,需要勾選“Include reportoutput versions”,否則只有Data Sets 的元數據信息。之后再將這個“Deployment”導入到生產環境中。
Data Sets替換Data Modules的快照模式
Cognos Analytics的先前版本在Data Modules中提供了一個快照模式選項,這種方式會提取所有數據。在11.0.4 中此快照模式不再可用,它已經被Data Sets 替代。在先前版本中設置為快照模式的Data Modules將升級到11.0.4及更高版本中的“live”/“regular” data modules。與現在已棄用的快照模式相比,數據集具有以下優點:
看完以上的對于Data Sets的深度介紹,作為數據分析師的你,有沒有躍躍一試的感覺?不想每天加班做數據分析的你,快來使用Data Sets來提高你的工作效率。
詳情請咨詢!
客服熱線:023-66090381
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn