書單推薦
更多
新書推薦
更多

強化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用

強化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用

定  價:99 元

        

  • 作者:張百珂
  • 出版時間:2025/5/1
  • ISBN:9787302685913
  • 出 版 社:清華大學(xué)出版社
  • 中圖法分類:TP312.8PY 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
6
8
8
7
5
3
9
0
1
2
3

《強化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用》循序漸進(jìn)地講解了使用Python語言實現(xiàn)強化學(xué)習(xí)的核心算法開發(fā)的知識,內(nèi)容涵蓋了數(shù)據(jù)處理、算法、大模型等知識,并通過具體實例的實現(xiàn)過程演練了各個知識點的使用方法和使用流程!稄娀瘜W(xué)習(xí)基礎(chǔ)、原理與應(yīng)用》共分為17章,主要內(nèi)容包括強化學(xué)習(xí)基礎(chǔ)、馬爾可夫決策過程、蒙特卡洛方法、Q-learning與貝爾曼方程、時序差分學(xué)習(xí)和SARSA算法、DQN算法、DDQN算法、競爭DQN算法、REINFORCE算法、Actor-Critic算法、PPO算法、TRPO算法、連續(xù)動作空間的強化學(xué)習(xí)、值分布式算法、基于模型的強化學(xué)習(xí)、多智能體強化學(xué)習(xí)實戰(zhàn):Predator-Prey 游戲及自動駕駛系統(tǒng)。本書內(nèi)容簡潔而不失技術(shù)深度,以極簡的文字介紹了復(fù)雜的案例,易于閱讀和理解。
《強化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用》適用于已經(jīng)了解Python語言基礎(chǔ)語法的讀者,想進(jìn)一步學(xué)習(xí)強化學(xué)習(xí)、機器學(xué)習(xí)、深度學(xué)習(xí)及相關(guān)技術(shù)的讀者,還可作為大專院校相關(guān)專業(yè)的師生用書和培訓(xùn)機構(gòu)的教材使用。

 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容