Hadoop是一個允許跨集群的分布式處理大型數(shù)據(jù)集的開源軟件
標簽:開源Hadoop開發(fā)商: Apache
當前版本: v2.6.1
產(chǎn)品類型:軟件
產(chǎn)品功能:工業(yè)數(shù)據(jù)采集軟件
平臺語言:
開源水平:提供源碼
本產(chǎn)品的分類與介紹僅供參考,具體以商家網(wǎng)站介紹為準,如有疑問請來電 023-68661681 咨詢。
* 關(guān)于本產(chǎn)品的分類與介紹僅供參考,精準產(chǎn)品資料以官網(wǎng)介紹為準,如需購買請先行測試。
HDFS——對外部客戶機而言,HDFS就像一個傳統(tǒng)的分級文件系統(tǒng)。可以創(chuàng)建、刪除、移動或重命名文件,等等。但是HDFS的架構(gòu)是基于一組特定的節(jié)點構(gòu)建的,這是由它自身的特點決定的。這些節(jié)點包括 NameNode,它在HDFS內(nèi)部提供元數(shù)據(jù)服務(wù);DataNode,它為HDFS提供存儲塊。
NameNode——NameNode是一個通常在HDFS實例中的單獨機器上運行的軟件。它負責管理文件系統(tǒng)名稱空間和控制外部客戶機的訪問。NameNode決定是否將文件映射到DataNode上的復(fù)制塊上。對于最常見的3個復(fù)制塊,第一個復(fù)制塊存儲在同一機架的不同節(jié)點上,最后一個復(fù)制塊存儲在不同機架的某個節(jié)點上。
DataNode——ataNode 也是一個通常在HDFS實例中的單獨機器上運行的軟件。Hadoop 集群包含一個NameNode 和大量 DataNode。DataNode通常以機架的形式組織,機架通過一個交換機將所有系統(tǒng)連接起來。Hadoop 的一個假設(shè)是:機架內(nèi)部節(jié)點之間的傳輸速度快于機架間節(jié)點的傳輸速度。
Linux 集群——Hadoop框架可在單一的Linux平臺上使用。
Hadoop Common——常見的實用程序,支持其他Hadoop模塊。
Hadoop Distributed File System (HDFS™)——一個分布式文件系統(tǒng),它提供了高通量訪問應(yīng)用程序數(shù)據(jù)。
Hadoop YARN——一個集群作業(yè)調(diào)度和資源管理的框架。
Hadoop MapReduce——YARN-based系統(tǒng)并行處理大型數(shù)據(jù)集。
更新時間:2016-01-22 14:27:59.000 | 錄入時間:2014-06-04 10:55:28.000 | 責任編輯:陳俊吉