Hadoop是目前重要的一種開源的大數(shù)據(jù)處理平臺,讀懂Hadoop的源代碼,深入理解其各種機理,對于掌握大數(shù)據(jù)處理的技術有著顯而易見的重要性。 本書從大數(shù)據(jù)處理的原理開始,講到Hadoop的由來,進而講述對于代碼的研究方法,然后以Hadoop作為樣本,較為詳盡地逐一分析大數(shù)據(jù)處理平臺各核心組成部分的代碼,并從宏觀上講述這些部分的聯(lián)系和作用。 本書沿用作者獨特而廣受歡迎的情景分析方法和風格,深入淺出直白易懂,可以作為大數(shù)據(jù)系統(tǒng)高級課程的教材,也可用作計算機軟件專業(yè)和其他相關專業(yè)大學本科高年級學生和研究生深入學習大數(shù)據(jù)系統(tǒng)的參考書。同時,還可以作為各行業(yè)從事軟件開發(fā)和數(shù)據(jù)挖掘的工程師、研究人員以及其他對大數(shù)據(jù)處理技術感興趣者的自學教材。