Apache Pig是一個基于Hadoop的大規模數據分析平臺。
標簽:開發商: Apache
當前版本: 0.15.0
產品類型:控件
產品功能:數據庫工具
平臺語言:
開源水平:不提供源碼
本產品的分類與介紹僅供參考,具體以商家網站介紹為準,如有疑問請來電 023-68661681 咨詢。
* 關于本產品的分類與介紹僅供參考,精準產品資料以官網介紹為準,如需購買請先行測試。
目前, Pig的基礎架構層由一個為Map-Reduce程序產生序列的編譯器構成,它被用于已存在項目的大規模并行實現(如Hadoop的子項目)。 Pig的語言層由一個被稱為Pig Latin的文本性語言構成,它包含了以下幾個關鍵特性:
易于編程-它能夠輕松實現簡單的并行執行,高度并行數據分析任務。對于包含多個相關數據轉換的復雜任務可以通過數據流序列進行明確編碼,使其易于編寫,理解和維護。
最佳化問題- 這是一種讓系統自動對任務的執行進行優化的方式,它能夠讓用戶關注語義而非效率。
可擴展性 - 用戶可以根據特殊目的來創建他們自己的函數。
Hadoop 0.23.X, 1.X 或者2.X(通過設置HADOOP_HOME指向Hadoop的安裝目錄位置可以讓 Pig運行在不同版本的Hadoop上,如果沒有設置HADOOP_HOME,默認為運行在Hadoop 1.0.4上)
Java 1.7(設置JAVA_HOME為Java程序安裝的根目錄)
Python 2.7(當使用Streaming Python UDFs時)
Ant 1.8 (當用于build時)
更新時間:2016-01-25 15:02:18.000 | 錄入時間:2016-01-25 14:58:31.000 | 責任編輯:陳俊吉