原創|大數據新聞|編輯:鄭恭琳|2020-12-23 14:07:42.100|閱讀 119 次
概述:主數據是系統間共享數據,它是系統間信息交換的基準。主數據管理目標是使各系統在獲取基準數據時,能夠保證數據是最新的、一致的、準確的,能夠實時進行各系統間數據驗證。 根據主數據管理實施的復雜程度,大體可以把主數據管理可以分為六個層次,從低到高反映了主數據管理的不同成熟度。并非層級越高的主數據管理方式就是最好的,應當根據數據本身的質量與現有體系情況,選擇合適的治理層級。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
主數據是系統間共享數據,它是系統間信息交換的基準。主數據管理目標是使各系統在獲取基準數據時,能夠保證數據是最新的、一致的、準確的,能夠實時進行各系統間數據驗證。
根據主數據管理實施的復雜程度,大體可以把主數據管理可以分為六個層次,從低到高反映了主數據管理的不同成熟度。并非層級越高的主數據管理方式就是最好的,應當根據數據本身的質量與現有體系情況,選擇合適的治理層級。
Level 0意味著企業的各個應用之間沒有任何的數據共享,整個企業沒有數據定義元素存在。比如,一個公司銷售很多產品,對這些產品的生產和銷售由多個獨立的系統來處理,各個系統獨立處理產品數據并擁有自己獨立的產品列表,各個系統之間不共享產品數據。在Level 0, 每個獨立的應用負責管理和維護自己的關鍵數據(比如產品列表、客戶信息等),各個系統間不共享這些信息,這些數據是不連通的。但是,如果業務數據質量極高,也無需主數據管理。Level 0適合業務數據質量極高,且企業有較為完善的數據管理機制,能做到數據源的統一。
列表管理是處理數據統一的一種方式。在公司內部,會通過手工的方式維護一個邏輯或物理的列表。當各個異構的系統和用戶需要某些數據的時候,就可以索取該列表了。對于這個列表的維護,包括數據添加、刪除、更新以及沖突處理,都是由各個部門的工作人員通過一系列的討論和會議進行處理的。業務規則(Business Rules)是用來反映價值的一致性,當業務規則發生改變或者出現類似的情況時,這樣高度手工管理的流程容易發生錯誤。由于列表管理是通過手工管理的,其列表維護的質量取決于誰參加了變更管理流程,一旦某人缺席,將會影響列表的維護。Level 1適合業務數據質量較高,只有很少數的數據不統一,并且目前已有較完善的文件管理機制的情況。這種情況下僅需提供簡單的列表即可處理,但是,大部分情況下建議采取Level 2或更高層次的主數據管理。
Level 2與Level 1相比的不同之處在于,Level 2將主數據存入數據庫的事實表中,引入了對主數據的自動管理。通過建立統一的數據標準,將主數據集中存儲,提供詳細數據的訪問和共享,為各個系統間共享使用數據提供了可靠的支持。同時,由于主數據存儲在數據庫中,所以可以使用數據庫CRUD的方式進行操作,能夠更科學的管理數據。在未實現數據集成的大多數情況都推薦Level 2。但是如果有數據湖或數據倉庫,Level 3或更高層次將會更加合適。
與Level 2相比,Level 3打破了各個獨立應用的組織邊界,抽取各個系統的數據集成管理。在這個數據集成的情況下,將主數據管理放入其中統一管理。
企業主數據面臨一致性的挑戰。數據在不同的地方存在,數據所代表的含義也是不同的,數據的規則各個系統之間也是不一樣的。在Level 3,公司對主題域內容采用集中管理方式。這意味著應用系統,作為消費者或使用主數據,擁有一個共識就是數據是主題數據內容的映像,打破了各個獨立應用的組織邊界。集中處理意味著為主數據管理構建了一個通用的、基于目標構建的平臺。然而,大多數公司發現主數據管理正在挑戰他們現有的IT架構:他們擁有太多的獨立平臺處理主數據。Level 3的集中化數據訪問、控制跨不同應用和系統使用數據。這極大的降低了應用數據訪問的復雜性,大大簡化了面向數據規則的管理,比一個分散環境具有更多的功能和特點。在實現數據集成,且各部門沒有差異化的數據需求或定時更新數據轉化規則時推薦此種方案,但是如果數據需求較高需要用到Level 4或更高層次的主數據管理。
在Level 4的架構中,數據湖中的主數據和數據源之間使用ETL工具實現每日批量更新。當主數據記錄詳細資料被修改后,所有應用的相關數據元素都將被更新。在企業的應用數據庫中,數據的編碼規則一般都是靜態的。然而,在一些極端情況下,數據編碼規則會時常發生變動,例如頻繁的新增記錄,修改記錄。在這種情況下,所有系統都是同一個版本:當變更發生時,數據湖中主數據將定時更新,形成改變的直接操作視圖。從Level 3到Level 4意味著主數據傳播和供應不需要源系統專門的開發或支持,還意味著所有的應用清楚的知道他們并不擁有或控制主數據,他們僅僅使用數據來支持他們自己的功能和流程。由于增加了一項ETL作業,Level 4的開發需要消耗額外的時間。然而,Level 4并不是最高層次的抽象架構,如果需要實現各部門差異化的數據需求時,就需要引入Level 5的流程管理。
Level 5可以保證主數據反映一個公司業務規則和流程,并證實其正確性。由于部分公司數據編碼相對比較復雜,影響業務數據訪問和操作的規則以及策略相對也比較復雜。假定任何一個單一系統可以包含并管理與主參考數據相關的各種類型的規則是不切實際的,工作流和流程整合的支持是必不可少的。總體來說,Level 5通過引入主數據的流程管理,控制數據湖和各源系統中數據的編碼/解碼,以此同時保證數據湖的統一性和源系統數據需求的多樣性。使用Level 5意為著數據源的高度不統一,部門各成一套體系,且數據需求及其復雜。實施一個Level 5級別的主數據管理將相當耗時,且會消耗大量時間和源系統對接。
Level 0未實施主數據管理,Level 1采取一個列表管理主數據,Level 2使用數據庫管理主數據,Level 3在數據湖中集成主數據管理,Level 4在數據湖和ETL過程中抽象出主數據管理,Level 5在整個數據流程實現主數據的編碼/解碼。
慧都大數據分析平臺,將學習、推理、思考、預測、規劃等能力賦予企業數據,讓數據驅動決策,創造最高業務價值。
歡迎撥打慧都熱線023-68661681或咨詢,我們將幫您轉接大數據專業團隊,并發送相關資料給您!
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn