轉帖|行業資訊|編輯:陳俊吉|2016-06-03 09:57:31.000|閱讀 2281 次
概述:企業數據往往分布在不同的業務子系統中,彼此獨立,形成多個信息孤島,如果要進行數據集成,那么企業所面臨的一個關鍵問題就是如何高效的獲取數據,同時又不用花費太多的精力和成本?
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
企業數據往往分布在不同的業務子系統中,彼此獨立,形成多個信息孤島,如果要進行數據集成,那么企業所面臨的一個關鍵問題就是如何高效的獲取數據,同時又不用花費太多的精力和成本?
可惜理想很豐滿,現實很骨感,我們的數據源可能來自于不同的數據庫,例如DB2,Oracle,SQLServer,Teradata,Sybase,MySQL, Netezza; 也有可能位于不同的操作系統平臺,例如AIX,Linux,Windows,Mainframe。那么,三個大大的疑問將不可避免地擺在我們面前:
怎么辦?項目還能好好的進行下去嗎?BI系統,數據倉庫,數據集市的建設都還指望著前期數據集成工作能早日完成呢,負責集成的攻城獅們表示壓力山大。。。
問題總會有解決的辦法,利用DataStage便可輕松實現對各種異構數據庫的訪問和讀寫,從而讓我們能節省出更多的時間和精力去創造更大的價值。
是IBM統一數據集成平臺InfoSphere Information Server的重要組件,是業界主流的 ETL工具(Extract, Transform, Load)。
DataStage采用簡單易用的圖形化設計方式,內置豐富的功能模塊和接口,從而支持對海量數據進行抽取、清洗、轉換和加載。同時它廣泛支持各種異構平臺的數據源和各種類型的數據格式(結構化、半結構化和非結構化數據),具有滿足最苛刻的數據集成需求所需的功能性、靈活性和可伸縮性。
提供多種功能強大,類型豐富的數據庫連接器,滿足企業數據集成所需:
不僅能提供對異構平臺數據庫的專用支持,而且還能對同一數據庫實現多樣化支持。例如對DB2數據庫的連接,我們建議首選功能更豐富、性能更強大的DB2 Connector,但也可以用JDBC Connector和ODBC Connector來實現。
以下是通過這三種方式連接DB2數據庫并讀取數據的具體配置過程:
DB2 Connector配置
1.首先,需要在DataStage服務器上安裝DB2數據庫的客戶端。
2.然后將DB2環境變量文件db2profile的路徑添加到DataStage服務器的dsenv文件 中。
# Add for DB2
. /home/db2inst1/sqllib/db2profile
熟悉DataStage的朋友應該知道dsenv是DataStage的環境變量文件,每次重啟DataStage都會讀取該文件以獲得運行時的環境變量,我們將db2profile添加至該文件的目的就是讓DataStage通過DB2自身的客戶端環境來訪問目標DB2數據庫。
Tips:dsenv文件位于$DataStage_Install_Directory/Server/DSEngine目錄
3.然后重啟DataStage以使環境變量生效
uv -admin -start
uv-admin –stop
4.接下來,打開DataStage Designer(DataStage客戶端,用于設計開發ETL作業), 配置DB2Connector的屬性,輸入將要連接的DB2數據庫名,用戶名,密碼以及表名。
5.完成配置后,運行作業,即可讀取DB2表數據,如下圖所示:
6.DB2 Connector提供豐富的DB2優化選項和原生API功能,例如可設置根據DB2 源表的某個字段進行Partitioned Read模式,從而獲得極大的讀取性能提升。而在JDBC Connector和ODBC Connector中,就沒有這些功能選項可供調優,這也是為什么DB2 Connector是連接DB2數據庫的首選原因。
JDBC Connector配置
1.首先將DB2自帶的JDBC驅動包復制到服務器目錄中,請注意文件訪問權限。
db2jcc.jar
db2jcc_license_cu.jar
2.在DataStage服務器中的新建一個名為isjdbc.config的配置文件,添加JDBC驅動程序包和JAVA類名稱如下所示:
Tips:isjdbc.config文件位于$DataStage_Install_Directory/Server/DSEngine目錄中。
3.用JDBC Connector連接DB2數據庫,不需要修改DataStage的環境變量文件dsenv,也不需要重啟DataStage。
4.接下來,打開DataStage Designer客戶端,在JDBC Connector中配置將要連接DB2數據庫的URL,用戶名,密碼以及表名。
URL格式為jdbc:db2://DB2服務器IP地址:端口/DB2數據庫名
5.完成配置后,運行作業,即可讀取DB2表數據,如下圖所示:
ODBC Connector配置
1.首先,修改服務器的ODBC配置文件:
$DataStage_Install_Directory/Server/DSEngine/.odbc.ini
添加連接DB2數據庫的ODBC配置信息如下:
2.配置完DB2的ODBC數據源信息后,將DB2_DSN添加到$DataStage_Install_Directo ry/Server/Projects/Project_Name/uvodbc.config文件中。
3.用ODBC Connector連接DB2數據庫,不需要修改DataStage的環境變量文件dsenv,也不需要重啟DataStage。
4.接下來,打開DataStage Designer客戶端,在ODBC Connector中配置DB2數據庫 的ODBC數據源(DB2_DSN),用戶名,密碼以及表名。
5.完成配置后,運行作業,即可讀取DB2表數據,如下圖所示:
以上便是DataStage連接DB2數據庫的三種配置方法介紹,怎么樣,是不是感覺很簡單很容易?沒錯,配置簡單,容易上手,界面友好,功能強大,專業的ETL工具就是這么任性!
不論是專用連接器,還是JDBC連接器或ODBC連接器,都能實現對企業級數據庫的訪問;雖然條條道路通羅馬,但采用的方式不同,效果也就會不一樣。例如,專用連接器實現了對特定數據庫(DB2,Oracle,Teradata等)的接口優化和原生API支持,可提供更快更好的處理性能,能駕馭大部分企業級的數據集成場景;而JDBC連接器和ODBC連接器則是通用的數據庫連接器,配置簡單,容易上手,雖然性能稍弱,但兼容性很出色,不僅支持主流的數據庫,還能提供對開源數據庫如NoSQL以及國內新興數據庫的廣泛支持???之,企業數據集成需求紛繁復雜,五花八門,DataStage可提供最全面的支持和最可靠的保障,如有機會,大家可以在實際應用中思考和體會。
想要了解更多有關的功能和數據集成場景嗎,請訪問下面鏈接:
via:華南IBM大數據支持團隊
詳情請咨詢“”!
客服熱線:023-66090381
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn