產品主頁:Hadoop
附件體積:159.00KB
上傳時間:2014-08-26 11:11:22.000
資源簡介:針對目前Web數據規模的快速增長,傳統的基于單機的數據挖掘模式不能勝任當前Web海量數據存儲與處理。隨著“云計算”技術的興起,將傳統的數據挖掘方法與“云計算“平臺融合以提高數據挖掘的效率成為一種研究方向。本文將傳統的遺傳算法與Hadoop的MapReduce進行融合,針對Hadoop的分布式文件存儲系統HDFS中的海量Web數據進行挖掘。為進一步驗證該平臺的高效性,在該平臺上利用融合后的算法挖掘Web 日志中用戶的偏愛訪問路徑。實驗結果表明,在Hadoop中運用分布式算法處理大量的Web 數據,可以明顯提高Web數據挖掘的效率。
免費高速下載