轉(zhuǎn)帖|大數(shù)據(jù)新聞|編輯:況魚杰|2020-11-24 09:58:21.910|閱讀 284 次
概述:經(jīng)過(guò)多年來(lái)企業(yè)信息化建設(shè),大部分都擁有了自己的財(cái)務(wù),OA,CRM 等軟件。這些系統(tǒng)都有自己的獨(dú)立數(shù)據(jù)庫(kù),記錄著企業(yè)運(yùn)行情況某個(gè)方面的數(shù)據(jù)。但是單獨(dú)看這些系統(tǒng)的報(bào)表,并不一定能對(duì)企業(yè)運(yùn)行情況有全面客觀的了解。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
經(jīng)過(guò)多年來(lái)企業(yè)信息化建設(shè),大部分都擁有了自己的財(cái)務(wù),OA,CRM 等軟件。這些系統(tǒng)都有自己的獨(dú)立數(shù)據(jù)庫(kù),記錄著企業(yè)運(yùn)行情況某個(gè)方面的數(shù)據(jù)。但是單獨(dú)看這些系統(tǒng)的報(bào)表,并不一定能對(duì)企業(yè)運(yùn)行情況有全面客觀的了解。
對(duì)一個(gè)企業(yè),不能僅根據(jù)出勤率就判斷一個(gè)人的績(jī)效高低,因?yàn)槟悴恢浪墓ぷ鞒晒闆r。僅根據(jù)財(cái)務(wù)報(bào)表輸入支出也體現(xiàn)不了各部門的收益情況,這個(gè)部門有多少工作人員,完成了哪些任務(wù)你也不知道。正式由于這種需求,產(chǎn)生了OLAP(Online analytical processing )應(yīng)用,在建立了匯集各系統(tǒng)數(shù)據(jù)的數(shù)據(jù)倉(cāng)庫(kù)后,OLAP應(yīng)用可以快速解析多維的查詢分析,針對(duì)查詢出的數(shù)據(jù),用戶也可以方便的進(jìn)行鉆取,如查詢出了年度數(shù)據(jù),可以很方便的查看月度數(shù)據(jù);查詢好地區(qū)的數(shù)據(jù),可以再看相應(yīng)城市的數(shù)據(jù),還可以顯示相應(yīng)的趨勢(shì)圖,柱狀圖,餅圖等,從而給決策者的判斷提供有效的數(shù)據(jù)支持。
建立OLAP應(yīng)用之前,要想辦法把各個(gè)獨(dú)立系統(tǒng)的數(shù)據(jù)抽取出來(lái),經(jīng)過(guò)一定的轉(zhuǎn)換和過(guò)濾,存放到一個(gè)集中的地方,成為數(shù)據(jù)倉(cāng)庫(kù)。這個(gè)抽取,轉(zhuǎn)換,加載的過(guò)程叫ETL(Extract, Transform,Load).相應(yīng)的開發(fā)工具Oracle有DataStage,微軟有SQL Server Integration Services,Pentaho有Kettle。這些ETL工具一般都支持圖形化流程建模,文本文件映射導(dǎo)入,XML,XSLT,可執(zhí)行SQL,javascript等。
OLAP應(yīng)用要根據(jù)客戶需求,對(duì)數(shù)據(jù)倉(cāng)庫(kù)中這些物理存在的表要進(jìn)行邏輯建模,以某些重要的事實(shí)數(shù)據(jù)(如銷售數(shù)據(jù))為核心,建立與其他物理表(維度表)之間的業(yè)務(wù)關(guān)系。如銷售數(shù)據(jù)跟部門表,客戶表之間的關(guān)系。事實(shí)和維度之間的組合,就建立了將來(lái)做多維查詢的基礎(chǔ)。建模過(guò)程形成的結(jié)果在各中平臺(tái)上的叫法不一樣,如BO的叫Universe,Oracle中叫Cube,SqlServer2005的叫統(tǒng)一維度模型UDM,開源Pentaho中也叫Cube。相應(yīng)的開發(fā)工具BO有Business Objects Crystal Decisions,Oracle有 Analytic WorkspaceManager ,SqlServer2005有BusinessIntelligence Development Studio,Pentaho有Schema Workbench。相對(duì)其他商業(yè)產(chǎn)品,Schema Workbench比較簡(jiǎn)單,也沒(méi)有和軟件開發(fā)平臺(tái)如Eclipse集成在一起。
有了表達(dá)邏輯關(guān)系的模型Cube,數(shù)據(jù)倉(cāng)庫(kù)中也導(dǎo)入了業(yè)務(wù)數(shù)據(jù),我們還要告訴執(zhí)行引擎如何取得我們真正所要的數(shù)據(jù)。這個(gè)查詢語(yǔ)言就是MDX(Multidimensional Expression),它是微軟在1997年首次提出,并為多家廠商采用。
MDX查詢返回的是多維數(shù)據(jù),普通的二維表很難表現(xiàn)超過(guò)2個(gè)維度的數(shù)據(jù),如果要進(jìn)行數(shù)據(jù)的鉆取等操作更是難上加難。各廠家的技術(shù)平臺(tái)都有想應(yīng)的實(shí)現(xiàn)技術(shù)。比較底層的界面表現(xiàn)技術(shù)Oracle 有Business Intelligence Beans,開源的有JPivot,這些需要開發(fā)相應(yīng)的展示頁(yè)面和維護(hù)界面,但可以和已有的系統(tǒng)緊密結(jié)合。另外為了方便用戶使用和維護(hù),也有做成可運(yùn)行程序的系統(tǒng)平臺(tái)。如Oracle有Oracle Business IntelligenceFoundation,開源的有SpagoBI,Pentaho BI Platform等。這些系統(tǒng)都有完整的DashBoard,多維查詢,報(bào)表等功能,使用維護(hù)都比較方便,缺點(diǎn)就是比較龐大笨重。
以上是建立OLAP應(yīng)用的幾個(gè)重要環(huán)節(jié)和相關(guān)技術(shù),最后總結(jié)一下就是:用戶需求——數(shù)據(jù)建模——數(shù)據(jù)倉(cāng)庫(kù)。
用戶需求決定了如何設(shè)計(jì)模型和數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)模型又是描述數(shù)據(jù)倉(cāng)庫(kù)的邏輯關(guān)系,而數(shù)據(jù)模型和數(shù)據(jù)倉(cāng)庫(kù)的某些技術(shù)限制也可能影響用戶需求的實(shí)現(xiàn)。這三者之間是相互依存和影響著的。而MDX查詢,又是這三者之間的粘合劑,它表達(dá)了用戶的需求,經(jīng)過(guò)OLAP引擎的解析,根據(jù)數(shù)據(jù)模型的描述,從數(shù)據(jù)倉(cāng)庫(kù)找到所需要的數(shù)據(jù)。
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn
文章轉(zhuǎn)載自: