本書以Python為基礎(chǔ),圍繞使用scikit-learn平臺,詳細介紹機器學(xué)習(xí)模型、算法、應(yīng)用場景及其案例實現(xiàn)方法,逐步帶領(lǐng)讀者熟悉并掌握機器學(xué)習(xí)的經(jīng)典算法。全書共13章,主要內(nèi)容包括配置開發(fā)環(huán)境、機器學(xué)習(xí)的基本概念、文件管理和KNN、線性回歸、邏輯回歸、K-means聚類算法、決策樹、集成算法、AdaBoost算法、梯度提升樹、降維算法、樸素貝葉斯、LGBM算法等。本書內(nèi)容精練,文字簡潔,結(jié)構(gòu)合理,案例經(jīng)典且實用,綜合性強,面向機器學(xué)習(xí)入門讀者,側(cè)重提高。
本書可以作為機器學(xué)習(xí)初學(xué)者、研究人員或從業(yè)人員的參考書,也可以作為計算機科學(xué)、大數(shù)據(jù)、人工智能、統(tǒng)計學(xué)和社會科學(xué)等專業(yè)的大學(xué)生或研究生的教材。
第一章 配置開發(fā)環(huán)境
第一節(jié) Anaconda下載與安裝
第二節(jié) Jupyter基本操作
第三節(jié) 升級與維護
第二章 機器學(xué)習(xí)的基本概念
第一節(jié) 機器學(xué)習(xí)概念
第二節(jié) 建模準備
第三節(jié) 模型訓(xùn)練
第四節(jié) 建模流程
第三章 文件管理和KNN
第一節(jié) 設(shè)置工作文件夾
第二節(jié) 虛擬環(huán)境的設(shè)置
第三節(jié) KNN算法原理
第四節(jié) 預(yù)測案例
第五節(jié) K折交叉驗證
第四章 線性回歸
第一節(jié) 線性回歸方程
第二節(jié) 誤差分析
第三節(jié) 似然函數(shù)求解
第四節(jié) 回歸求解
第五節(jié) 梯度下降
第六節(jié) 評價指標
第七節(jié) 案例
第五章 邏輯回歸
第一節(jié) Sigmod函數(shù)
第二節(jié) 邏輯回歸本質(zhì)
第三節(jié) 閾值
第四節(jié) 參數(shù)估計
第五節(jié) 評估指標
第六章 Kmeans聚類算法
第一節(jié) 聚類算法的特征
第二節(jié) 算法原理
第三節(jié) 常用參數(shù)
第四節(jié) Kmeans優(yōu)缺點
第七章 決策樹
第一節(jié) 決策樹歷史
第二節(jié) 決策樹原理
第三節(jié) 熵
第四節(jié) 構(gòu)造實例
第五節(jié) 信息增益率和gini系數(shù)
第六節(jié) 回歸決策樹
第七節(jié) 剪枝方法
第八節(jié) 決策樹優(yōu)缺點
第八章 集成算法
第一節(jié) 隨機森林
第二節(jié) boosting算法
第三節(jié) stacking模型
第四節(jié) 隨機森林參數(shù)
第九章 AdaBoost算法
第一節(jié) 算法原理
第二節(jié) 算法流程
第三節(jié) 參數(shù)求解
第四節(jié) AdaBoost參數(shù)
第十章 梯度提升樹
第一節(jié) GBDT概述
第二節(jié) 數(shù)學(xué)流程
第三節(jié) GBDT優(yōu)缺點
第四節(jié) GBDT調(diào)參
第十一章 降維算法
第一節(jié) 維的解釋
第二節(jié) 。PCA與SvD
第十二章 樸素貝葉斯
第一節(jié) 樸素貝葉斯原理
第二節(jié) 樸素貝葉斯分類器
第三節(jié) 評估指標
第四節(jié) 樸素貝葉斯優(yōu)缺點
第五節(jié) 應(yīng)用場景
第十三章 LGBM算法
第一節(jié) LGBM原理概述
第二節(jié) LGBM相關(guān)技術(shù)
第三節(jié) GOSS采樣與直方圖優(yōu)化算法
第四節(jié) LGBM數(shù)學(xué)推導(dǎo)
參考文獻