定 價:45 元
叢書名:大數(shù)據人才培養(yǎng)規(guī)劃教材
當前圖書已被 1 所學校薦購過!
查看明細
- 作者:韓寶國 張良均
- 出版時間:2018/4/1
- ISBN:9787115474483
- 出 版 社:人民郵電出版社
- 中圖法分類:F712.3-39*
- 頁碼:228
- 紙張:
- 版次:01
- 開本:16開
本書以任務為導向,較為全面地介紹了商務領域中R語言數(shù)據分析的應用。全書共9章,介紹商務領域不同方向項目的數(shù)據分析方法,具體內容包括R語言數(shù)據分析概述、商品零售購物籃分析、航空公司客戶價本書以任務為導向,較為全面地介紹了商務領域中R語言數(shù)據分析的應用。全書共9章,介紹商務領域不同方向項目的數(shù)據分析方法,具體內容包括R語言數(shù)據分析概述、商品零售購物籃分析、航空公司客戶價值分析、財政收入預測分析、金融服務機構資金流量預測、P2P信用貸款風險控制、電子商務網站智能推薦服務、電商產品評論數(shù)據情感分析、餐飲企業(yè)綜合分析。除第 1章外,本書各章都包含了實訓與課后習題,通過練習和操作實踐,幫助讀者鞏固所學的內容。值分析、財政收入預測分析、金融服務機構資金流量預測、P2P信用貸款風險控制、電子商務網站智能推薦服務、電商產品評論數(shù)據情感分析、餐飲企業(yè)綜合分析。本書的每個章節(jié)都包含了實訓與課后習題,通過練習和操作實踐,幫助讀者鞏固所學的內容。
大數(shù)據專家張良均領銜暢銷書作者團隊,教育部長江學者特聘教授、國家杰出青年基金獲得者、IEEE Fellow、華南理工大學計算機與工程學院院長張軍傾力推薦。
本書采用了以任務為導向的教學模式,按照解決實際任務的工作流程路線,逐步展開介紹相關的理論知識點,推導生成可行的解決方案,落實在任務實現(xiàn)環(huán)節(jié)。
全書大部分章節(jié)緊扣任務需求展開,不堆積知識點,著重于解決問題時思路的啟發(fā)與方案的實施。通過從任務需求到實現(xiàn)這一完整工作流程的體驗,幫助讀者真正理解與消化R語言數(shù)據分析。
書中案例全部源于企業(yè)真實項目,可操作性強,引導讀者融會貫通,并提供源代碼等相關學習資源,幫助讀者快速掌握R語言數(shù)據分析相關技能。
張良均,高 級信息系統(tǒng)項目管理師,泰迪杯全國大學生數(shù)據挖掘競賽(www.tipdm.org)發(fā)起人。華南師范大學、廣東工業(yè)大學兼職教授,廣東省工業(yè)與應用數(shù)學學會理事。兼有大型高科技企業(yè)和高校的工作經歷,主要從事大數(shù)據挖掘及其應用的策劃、研發(fā)及咨詢培訓。全國計算機技術與軟件專業(yè)技術資格(水平)考試繼續(xù)教育和CDA數(shù)據分析師培訓講師。發(fā)表數(shù)據挖掘相關論文數(shù)二十余篇,已取得國家發(fā)明專利12項,主編《Hadoop大數(shù)據分析與挖掘實戰(zhàn)》《Python數(shù)據分析與挖掘實戰(zhàn)》《R語言數(shù)據分析與挖掘實戰(zhàn)》等多本暢銷圖書,主持并完成科技項目9項。獲得SAS、SPSS數(shù)據挖掘認證及Hadoop開發(fā)工程師證書,具有電力、電信、銀行、制造企業(yè)、電子商務和電子政務的項目經驗和行業(yè)背景。行、制造企業(yè)、電子商務和電子政務的項目經驗和行業(yè)背景。
第 1章 R語言數(shù)據分析概述 1
任務1.1 認識數(shù)據分析 1
1.1.1 掌握數(shù)據分析的概念 1
1.1.2 熟悉數(shù)據分析的流程 2
1.1.3 了解數(shù)據分析應用場景 4
任務1.2 熟悉R語言數(shù)據分析工具 5
1.2.1 了解數(shù)據分析常用工具 6
1.2.2 了解R語言數(shù)據分析的優(yōu)勢 6
1.2.3 了解R語言數(shù)據分析常用的Packages 7
小結 10
課后習題 10
第 2章 商品零售購物籃分析 12
任務2.1 了解購物籃分析 12
2.1.1 分析商品零售企業(yè)現(xiàn)狀 12
2.1.2 了解某商品零售企業(yè)基本數(shù)據情況 13
2.1.3 熟悉購物籃分析的步驟與流程 13
任務2.2 分析商品銷售狀況 14
2.2.1 分析熱銷商品 14
2.2.2 分析商品結構 15
2.2.3 任務實現(xiàn) 17
任務2.3 使用Apriori關聯(lián)規(guī)則構建購物籃分析模型 18
2.3.1 了解Apriori算法的基本原理與使用方法 18
2.3.2 分析結果 23
2.3.3 任務實現(xiàn) 24
小結 24
實訓 使用Apriori算法對西餅屋訂單進行關聯(lián)分析 25
課后習題 25
第3章 航空公司客戶價值分析 28
任務3.1 了解航空公司現(xiàn)狀與客戶價值分析 28
3.1.1 了解航空公司現(xiàn)狀 28
3.1.2 了解客戶價值分析 30
3.1.3 熟悉航空客戶價值分析的步驟與流程 30
任務3.2 預處理航空客戶數(shù)據 31
3.2.1 處理數(shù)據缺失值與異常值 31
3.2.2 構建航空客戶價值分析的關鍵特征 31
3.2.3 標準化LRFMC的5個特征 35
3.2.4 任務實現(xiàn) 36
任務3.3 使用K-Means算法進行客戶分群 37
3.3.1 了解K-Means聚類算法 37
3.3.2 分析聚類結果 38
3.3.3 模型應用 41
3.3.4 任務實現(xiàn) 42
小結 43
實訓 43
實訓1 處理信用卡數(shù)據異常值 43
實訓2 構造信用卡客戶風險評價關鍵特征 45
實訓3 構建K-Means聚類模型 45
課后習題 46
第4章 財政收入預測分析 48
任務4.1 了解財政收入預測的背景與方法 48
4.1.1 分析財政收入預測背景 48
4.1.2 了解財政收入預測的方法 50
4.1.3 熟悉財政收入預測的步驟與流程 51
任務4.2 分析財政收入數(shù)據特征的相關性 51
4.2.1 了解相關性分析 51
4.2.2 分析計算結果 52
4.2.3 任務實現(xiàn) 53
任務4.3 使用Lasso回歸方法選取財政收入預測的關鍵特征 53
4.3.1 了解Lasso回歸方法 53
4.3.2 分析Lasso回歸結果 54
4.3.3 任務實現(xiàn) 54
任務4.4 使用灰色預測和SVR構建財政收入預測模型 55
4.4.1 了解灰色預測算法 55
4.4.2 了解SVR算法 56
4.4.3 分析預測結果 58
4.4.4 任務實現(xiàn) 60
小結 61
實訓 61
實訓1 求取企業(yè)所得稅各特征間的相關系數(shù) 61
實訓2 選取企業(yè)所得稅預測關鍵特征 62
實訓3 構建企業(yè)所得稅預測模型 62
課后習題 62
第5章 金融服務機構資金流量預測 64
任務5.1 了解金融服務機構現(xiàn)狀與資金流量預測 64
5.1.1 分析金融服務機構現(xiàn)狀 64
5.1.2 認識資金流量預測 65
5.1.3 熟悉金融服務機構資金流量預測的步驟與流程 66
任務5.2 檢驗數(shù)據的平穩(wěn)性 67
5.2.1 檢驗平穩(wěn)性 67
5.2.2 處理非平穩(wěn)序列 69
5.2.3 任務實現(xiàn) 71
任務5.3 檢驗數(shù)據的純隨機性 72
5.3.1 了解純隨機性檢驗 73
5.3.2 檢驗純隨機性 73
5.3.3 任務實現(xiàn) 74
任務5.4 建立ARIMA模型 74
5.4.1 了解ARIMA模型 74
5.4.2 識別模型階數(shù) 75
5.4.3 建立ARIMA模型 76
5.4.4 任務實現(xiàn) 81
小結 83
實訓 83
實訓1 檢驗資金贖回數(shù)據的平穩(wěn)性與純隨機性 83
實訓2 識別資金贖回數(shù)據集的階數(shù) 83
實訓3 構建ARIMA模型 83
課后習題 84
第6章 P2P信用貸款風險控制 85
任務6.1 認識P2P信貸行業(yè)的風險控制 85
6.1.1 分析P2P信貸行業(yè)的現(xiàn)狀 86
6.1.2 了解某P2P平臺數(shù)據情況 86
6.1.3 熟悉用戶逾期預測的步驟與流程 87
任務6.2 探索P2P信貸用戶逾期的相關因素 88
6.2.1 分析用戶信息完善程度與逾期率的關系 88
6.2.2 分析用戶信息修改情況與逾期率的關系 89
6.2.3 分析用戶所在區(qū)域經濟發(fā)展情況與逾期率的關系 90
6.2.4 分析借款月份與逾期率的關系 91
6.2.5 任務實現(xiàn) 92
任務6.3 預處理P2P信貸用戶數(shù)據 95
6.3.1 使用第三方平臺信息構建新特征 95
6.3.2 對登錄信息表與更新信息表進行長寬表轉換 95
6.3.3 清洗P2P信貸數(shù)據 97
6.3.4 任務實現(xiàn) 98
任務6.4 構建用戶逾期還款概率預測模型 107
6.4.1 了解GBM算法 107
6.4.2 評價GBM模型 108
6.4.3 分析結果 109
6.4.4 任務實現(xiàn) 109
小結 111
實訓 111
實訓1 探索某銀行貸款數(shù)據規(guī)律 111
實訓2 預處理某銀行貸款數(shù)據 111
實訓3 使用GBM算法構建信貸審批模型 111
課后習題 112
第7章 電子商務網站智能推薦服務 113
任務7.1 了解某網站現(xiàn)狀與智能推薦系統(tǒng) 113
7.1.1 分析某網站現(xiàn)狀 113
7.1.2 了解智能推薦服務 115
7.1.3 熟悉網站智能推薦的步驟與流程 116
任務7.2 使用R連接數(shù)據庫并提取數(shù)據 117
7.2.1 訪問數(shù)據庫 117
7.2.2 任務實現(xiàn) 118
任務7.3 統(tǒng)計網頁整體流量狀況 118
7.3.1 分析網頁類型 119
7.3.2 分析網頁點擊次數(shù) 122
7.3.3 分析網頁排名 123
7.3.4 任務實現(xiàn) 124
任務7.4 預處理網頁瀏覽數(shù)據 130
7.4.1 刪除不符合規(guī)則的網頁 130
7.4.2 還原翻頁網址 131
7.4.3 劃分正確的網頁類別 131
7.4.4 選擇用戶和用戶訪問網頁記錄 132
7.4.5 任務實現(xiàn) 133
任務7.5 構建智能推薦模型 136
7.5.1 了解協(xié)同過濾算法 136
7.5.2 評價智能推薦模型 139
7.5.3 分析模型結果 142
7.5.4 任務實現(xiàn) 142
小結 144
實訓 實現(xiàn)MovieLense電影數(shù)據的智能推薦 144
實訓1 清洗MovieLense原始數(shù)據 144
實訓2 構建MovieLense智能推薦模型 144
實訓3 評估推薦系統(tǒng)模型 145
課后習題 145
第8章 電商產品評論數(shù)據情感分析 147
任務8.1 了解電商企業(yè)現(xiàn)狀與文本情感分析流程 147
8.1.1 分析電商企業(yè)現(xiàn)狀 147
8.1.2 了解電商產品評論數(shù)據 148
8.1.3 實現(xiàn)電商評論數(shù)據情感分析的步驟與流程 149
任務8.2 獲取電商產品評論數(shù)據 149
8.2.1 了解R語言獲取網絡數(shù)據的方法 149
8.2.2 了解數(shù)據獲取的方法 151
8.2.3 任務實現(xiàn) 153
任務8.3 對電商產品評論數(shù)據進行預處理 156
8.3.1 去除評論數(shù)據中的重復數(shù)據 156
8.3.2 清洗評論數(shù)據 156
8.3.3 對評論數(shù)據進行分詞 157
8.3.4 去除停用詞 158
8.3.5 提取有意義的評論 159
8.3.6 繪制詞云查看分詞效果 160
8.3.7 任務實現(xiàn) 162
任務8.4 評論數(shù)據情感傾向分析 163
8.4.1 匹配情感詞 164
8.4.2 修正情感傾向 164
8.4.3 檢驗情感分析效果 164
8.4.4 任務實現(xiàn) 165
任務8.5 使用LDA模型進行主題分析 169
8.5.1 了解LDA主題模型 169
8.5.2 尋找最 優(yōu)主題數(shù) 171
8.5.3 進行LDA主題分析 171
8.5.4 評價主題分析結果 172
8.5.5 任務實現(xiàn) 173
小結 176
實訓 176
實訓1 清洗酒店評論原始數(shù)據 176
實訓2 對酒店評論數(shù)據進行預處理 176
實訓3 使用LDA模型建模并分析酒店評論 177
課后習題 177
第9章 餐飲企業(yè)綜合分析 179
任務9.1 了解餐飲企業(yè)分析需求 179
9.1.1 分析餐飲企業(yè)現(xiàn)狀與需求 180
9.1.2 了解餐飲企業(yè)數(shù)據基本狀況 181
9.1.3 熟悉餐飲企業(yè)數(shù)據分析的步驟與流程 183
任務9.2 統(tǒng)計餐飲菜品數(shù)據 184
9.2.1 統(tǒng)計每日用餐人數(shù)與銷售額 184
9.2.2 統(tǒng)計菜品熱銷度 190
9.2.3 統(tǒng)計菜品的毛利率 191
9.2.4 任務實現(xiàn) 192
任務9.3 使用ARIMA算法預測銷售額 194
9.3.1 檢驗平穩(wěn)性和純隨機性 194
9.3.2 構建ARIMA模型 196
9.3.3 任務實現(xiàn) 198
任務9.4 使用協(xié)同過濾算法實現(xiàn)菜品的智能推薦 201
9.4.1 選取特征 202
9.4.2 使用基于物品的智能推薦算法進行推薦 202
9.4.3 了解基于用戶的智能推薦算法 203
9.4.4 分析協(xié)同過濾結果 203
9.4.5 任務實現(xiàn) 204
任務9.5 使用Apriori算法實現(xiàn)菜品的關聯(lián)分析 207
9.5.1 構建Apriori模型 207
9.5.2 分析關聯(lián)規(guī)則結果 209
9.5.3 任務實現(xiàn) 210
任務9.6 使用K-Means算法進行客戶價值分析 214
9.6.1 構建關鍵特征 214
9.6.2 構建K-Means模型 214
9.6.3 分析K-Means模型結果 215
9.6.4 任務實現(xiàn) 217
任務9.7 用決策樹算法實現(xiàn)餐飲客戶流失預測 219
9.7.1 了解客戶流失 219
9.7.2 了解決策樹算法 220
9.7.3 構建客戶流失特征 221
9.7.4 分析決策樹模型結果 223
9.7.5 任務實現(xiàn) 223
小結 226
實訓 226
實訓1 使用ARIMA模型預測網站訪問量 226
實訓2 使用決策樹算法實現(xiàn)運營商客戶流失預測 227
實訓3 使用協(xié)同過濾算法實現(xiàn)網站的智能推薦 227
實訓4 使用Apriori算法實現(xiàn)網站的關聯(lián)分析 227
實訓5 使用K-Means算法實現(xiàn)運營商客戶價值分析 228
課后習題 228