王偉軍、劉蕤、周光有編*的《大數據分析》結合大數據分析實操和商務應用場景,以大數據分析流程為主線,按照“原理、方法、工具和應用”組織內容體系,主要內容包括:大數據生態(tài)系統(tǒng)和大數據分析的環(huán)境搭建、大數據收集、大數據計算、大數據挖掘、大數據可視化,通過在用戶搜索行為分析和個性化推薦系統(tǒng)兩個現實場景中的實驗,闡述并展示了大數據分析的環(huán)境配置和大數據分析的應用實例。
本書以附錄形式呈現大數據分析實驗環(huán)境搭建、Hadoop組件參數配置,以及大數據分析相關學習資源。此外,我們還制作了配套PPT課件、案例、習題、試卷及答案等電子資源,以及實驗所用完整數據,方便讀者動手實踐書中所講解的實例。
本書適合于電子商務、信息管理與信息系統(tǒng)及相關專業(yè)的大學生和研究生學習,以及對大數據分析感興趣和有志于從事數據分析工作的讀者閱讀使用。
第1章大數據概述
1.1大數據的背景
1.2大數據的基本概念
1.3大數據的來源及分類
1.4大數據分析的價值
1.5案例:上海聯(lián)通大數據應用實踐
【本章小結】
【關鍵術語】
【復習思考題】
第2章大數據生態(tài)系統(tǒng)
2.1.Hadoop生態(tài)系統(tǒng)
2.2Spark生態(tài)系統(tǒng)
2.3Hadoop和Spark的應用案例
【本章小結】
【關鍵術語】
【復習思考題】
第3章大數據收集
3.1Flume
3.2Kafka
3.3Kafka和Flume的區(qū)別
【本章小結】
【關鍵術語】
【復習思考題】
第4章大數據計算
4.1MapReduce
4.2Impala
4.3Stolln
【本章小結】
【關鍵術語】
【復習思考題】
第5章大數據挖掘
5.1機器學習
5.2Mahout
5.3Weka
5.4R語言
【本章小結】
【關鍵術語】
【復習思考題】
第6章大數據可視化
6.1Tableau
6.2ECharts
6.3大數據可視化應用實例
【本章小結】
【關鍵術語】
【復習思考題】
第7章大規(guī)模搜索日志用戶行為分析
7.1Linux環(huán)境下進行數據預處理
7.2基于Hive構建日志數據的數據倉庫
7.3搜索日志數據分析
【本章小結】
【關鍵術語】
【復習思考題】
第8章電子商務大數據推薦系統(tǒng)
8.1電子商務推薦系統(tǒng)
8.2數據預處理
8.3Mahout基于項目的推薦方法
【本章小結】
【關鍵術語】
【復習思考題】
附錄
附錄1Flume中組件的度量
附錄2Linux系統(tǒng)下配置實驗環(huán)境
附錄3安裝部署Hive
附錄4Mahout實驗環(huán)境配置及數據準備
附錄5大數據分析學習資源
參考文獻