原創(chuàng)|行業(yè)資訊|編輯:陳俊吉|2016-09-19 10:08:22.000|閱讀 1071 次
概述:隨著數(shù)據(jù)量日益劇增,企業(yè)決策比以往更需要具備強(qiáng)大的信息管理和掌控能力來協(xié)助解決關(guān)鍵問題。若要提升企業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì),必須隨時(shí)掌握企業(yè)內(nèi)的信息,并透過這些“可信賴”信息獲得新的企業(yè)價(jià)值。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
1.信息質(zhì)量與你的業(yè)務(wù)息息相關(guān)
隨著數(shù)據(jù)量日益劇增,企業(yè)決策比以往更需要具備強(qiáng)大的和掌控能力來協(xié)助解決關(guān)鍵問題。若要提升企業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì),必須隨時(shí)掌握企業(yè)內(nèi)的信息,并透過這些“可信賴”信息獲得新的企業(yè)價(jià)值。在現(xiàn)實(shí)世界中,很多用戶使用數(shù)據(jù)時(shí)都難以取到可信賴信息,給業(yè)務(wù)運(yùn)營(yíng)和決策帶來高風(fēng)險(xiǎn)。常常讓客戶頭痛的數(shù)據(jù)質(zhì)量的問題呈現(xiàn)多樣化、復(fù)雜化和時(shí)效化等多種因素交織、組合在一起,使得工作推進(jìn)和項(xiàng)目實(shí)施變得相當(dāng)艱難,問題主要涉及到以下方面:
根據(jù)業(yè)界權(quán)威機(jī)構(gòu)(TDWI,Gartner)的調(diào)查核實(shí),用戶存在的數(shù)據(jù)質(zhì)量問題的狀況按種類分布如下:
由于信息質(zhì)量問題而造成的損失,使用戶因此付出相當(dāng)之大的代價(jià):
怎樣才能解決信息質(zhì)量問題呢? IBM根據(jù)在全球各行各業(yè)客戶的相關(guān)項(xiàng)目實(shí)施經(jīng)驗(yàn),提出了要擺脫傳統(tǒng)的分析方法,主張組織或機(jī)構(gòu)必須停止僅通過IT手段來解決數(shù)據(jù)質(zhì)量問題。當(dāng)今,業(yè)界中很多富有經(jīng)驗(yàn)的 CIO就如何有效地解決信息質(zhì)量問題,找到了高效的方法,其底線如下:
2.IBM解決方案
評(píng)估信息資產(chǎn),首要任務(wù)是分析現(xiàn)有企業(yè)數(shù)據(jù)來源,以理解可用信息的結(jié)構(gòu)、內(nèi)容和質(zhì)量。用戶查看描述數(shù)據(jù)的現(xiàn)有文檔可能已經(jīng)過時(shí),且需要驗(yàn)證以確保數(shù)據(jù)的準(zhǔn)確性、一致性和完整性。為此,IBM提供基于 InfoSphere Information Analyzer(以下簡(jiǎn)稱 IA)分析軟件工具的信息質(zhì)量解決方案,幫助用戶了解在給定時(shí)間點(diǎn)的數(shù)據(jù)內(nèi)容、結(jié)構(gòu)和總體質(zhì)量,該解決方案提供了用于分析數(shù)據(jù)源和規(guī)則的分析方法的深入見解。
IA 對(duì)多個(gè)企業(yè)儲(chǔ)存庫中的源數(shù)據(jù)進(jìn)行概要和分析,它包括一個(gè)業(yè)務(wù)驅(qū)動(dòng)數(shù)據(jù)規(guī)則定義方法,可以進(jìn)行集成數(shù)據(jù)規(guī)則分析,來評(píng)估和監(jiān)控信息資產(chǎn)。IA 可以在一個(gè)包含 IBM 和非 IBM 信息源的異構(gòu) IT 環(huán)境中工作。它還可以在異構(gòu)信息源中及跨異構(gòu)信息源創(chuàng)建珍貴元數(shù)據(jù),作為數(shù)據(jù)概要流程的一部分,識(shí)別新數(shù)據(jù)目標(biāo),以及支持深度分析。評(píng)估可以跨整個(gè)企業(yè)信息生態(tài)系統(tǒng):各種數(shù)據(jù)庫、文件和企業(yè)應(yīng)用。沒有 IA,這個(gè)流程將需要手動(dòng)完成,耗時(shí),且容易出錯(cuò)。
通過IBM解決方案,實(shí)現(xiàn)了信息按分析功能進(jìn)行組織,向您提供深入的知識(shí)和最佳實(shí)踐,用于:
數(shù)據(jù)分析,包括:
數(shù)據(jù)質(zhì)量分析和監(jiān)視,包括:
IA數(shù)據(jù)發(fā)現(xiàn)和分析工具,是基于Web的架構(gòu)方式,對(duì)數(shù)據(jù)倉庫的源系統(tǒng)數(shù)據(jù)分析和數(shù)據(jù)倉庫的表屬性級(jí)分析,表級(jí)分析和關(guān)聯(lián)分析,并可使用規(guī)則來定義和分析數(shù)據(jù)的分布和相關(guān)性。IA工具的架構(gòu)如下:
IA 提供的主要功能說明如下:
- 分析和記錄下列屬性;
- 各個(gè)值或基數(shù)的數(shù)量;
- 空值、“null”值、和非“null”或非空值的數(shù)量;
- 最小、最大、和平均數(shù)值;
- 基本數(shù)據(jù)類型,包括不同的日期—時(shí)間格式;
- 最小、最大、和平均長(zhǎng)度;
- 數(shù)值的精度和范圍。
主鍵分析針對(duì)一個(gè)或多個(gè)表識(shí)別所有候選鍵,幫助您測(cè)試一個(gè)列或 列組合,以確定是否存在成為主鍵的候選。
外鍵分析檢查表之間的內(nèi)容和關(guān)系,有助于識(shí)別外鍵、檢查其完整 性、并檢查主鍵和外鍵之間的參照完整性。
交叉值域分析檢查表之間的內(nèi)容和關(guān)系,以確定列之間值的交疊,以及表內(nèi)或表間數(shù)據(jù)的任何冗余(參照上圖)
通過基線分析,將來自先前列分析的數(shù)據(jù)(基線)和新的、當(dāng)前的列分析進(jìn)行比較,尋找變化。
創(chuàng)建邏輯規(guī)則進(jìn)行數(shù)據(jù)驗(yàn)證,驗(yàn)證規(guī)則分析可以延伸數(shù)據(jù)源或跨數(shù)據(jù)源的評(píng)估,以定義數(shù)據(jù)之間的關(guān)系。允許以多種方式表達(dá)驗(yàn)證規(guī)則。它還可以檢查了解數(shù)據(jù)是否符合某些限制:
包含:一個(gè)字段是否包含一個(gè)字符串,或符合某個(gè)包含某些字符串的表達(dá)式。
相等:一個(gè)字段是否與某些值相等。
存在:一個(gè)源是否擁有任何數(shù)據(jù)。
模式:源數(shù)據(jù)中的值是否與一個(gè)模式字符串匹配。
出現(xiàn):一個(gè)源表中某些值出現(xiàn)的次數(shù)。
范圍:源數(shù)據(jù)的范圍。范圍可以包含最小值、最大值,或二者皆有。
參照列:源數(shù)據(jù)對(duì)參照列的參照完整性。
參照清單:數(shù)據(jù)是否符合一個(gè)允許值的參照清單。
類型:源數(shù)據(jù)是否能夠從字符轉(zhuǎn)換為數(shù)字或日期。
唯一性:源數(shù)據(jù)是否含有重復(fù)值。某些字段(如賬號(hào))必須為唯一。
這些規(guī)則可以與邏輯操作符結(jié)合,從一個(gè)或多個(gè)表中(其中,多個(gè)列擁有多種特征)找到行。您還可以將這些規(guī)則與邏輯操作符結(jié)合,進(jìn)行復(fù)雜條件評(píng)估,并指出雖然自身并沒有出現(xiàn)問題,但是不符合更廣泛的限制或業(yè)務(wù)條件的數(shù)據(jù),隨時(shí)間發(fā)展以提供有關(guān)數(shù)據(jù)質(zhì)量趨勢(shì)的追蹤分析。
提供全面分析報(bào)告,通過使用圖形顯示和打印報(bào)表理解源數(shù)據(jù)質(zhì)量狀況。
3.業(yè)務(wù)用例
4.給用戶帶來變化
分析數(shù)據(jù)的自動(dòng)化流程管理,無需要手工進(jìn)行處理。相對(duì)手工分析而言,減少 50+%分析數(shù)據(jù)的工作量,提高生產(chǎn)效率,加快數(shù)據(jù)整合速度;
5.成功實(shí)施參考案例
項(xiàng)目背景:
20xx年,某零售巨頭多年來第一次發(fā)生虧損。該企業(yè)通過一系列的研究與自我反思,認(rèn)為其主要是由以下幾方面原因引起的。
項(xiàng)目挑戰(zhàn):
解決方案:
Information Analyzer是IBM推出的一款數(shù)據(jù)質(zhì)量分析工具。它能幫助客戶方便快捷地全面理解企業(yè)數(shù)據(jù)。它提供了數(shù)據(jù)質(zhì)量評(píng)估,數(shù)據(jù)質(zhì)量監(jiān)控以及可定制的數(shù)據(jù)規(guī)則設(shè)計(jì)和分析功能。這些強(qiáng)大的能力能讓客戶輕易的掌控整個(gè)企業(yè)的雜亂數(shù)據(jù),并極大地加速企業(yè)的信息整合工程。因此本產(chǎn)品可以很好地滿足該企業(yè)的需求并加速實(shí)現(xiàn)其轉(zhuǎn)型目標(biāo)。
在IBM為該企業(yè)制定的全套解決方案中,Information Analyzer主要應(yīng)用于以下3個(gè)關(guān)鍵階段:
全面分析理解該企業(yè)各個(gè)數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)質(zhì)量,找出異常數(shù)據(jù),為隨后的數(shù)據(jù)清洗、轉(zhuǎn)換、整合提供有力的支持。
通過對(duì)清洗過的歷史數(shù)據(jù)進(jìn)行高效的比對(duì),找出數(shù)據(jù)變化趨勢(shì),分析客戶行為,從而及時(shí)調(diào)整相應(yīng)的推銷策略。
自動(dòng)按需審計(jì)各個(gè)接口的數(shù)據(jù)質(zhì)量,從而保證最低的臟數(shù)據(jù)率和最高的數(shù)據(jù)兼容性。
部署架構(gòu):
方案收益:
通過列分析、主/外鍵分析、域交叉分析等手段自動(dòng)分析您的數(shù)據(jù),快速完成整體分析并生成數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容和質(zhì)量報(bào)告。
詳情請(qǐng)咨詢!
客服熱線:023-66090381
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn