書單推薦
更多
新書推薦
更多

強化學(xué)習(xí)與隨機優(yōu)化:序貫決策的通用框架

強化學(xué)習(xí)與隨機優(yōu)化:序貫決策的通用框架

定  價:256 元

        

  • 作者:(美) 沃倫·B.鮑威爾 (Warren B.Powell) 著
  • 出版時間:2025/9/1
  • ISBN:9787302697145
  • 出 版 社:清華大學(xué)出版社
  • 中圖法分類:TP181 
  • 頁碼:780頁
  • 紙張:
  • 版次:1
  • 開本:25cm
9
7
6
8
9
7
7
3
1
0
4
2
5
本書是第一本探討如何對不同方法進(jìn)行均衡處理, 以便建模和解決序貫決策問題的圖書, 承襲了大多數(shù)聚焦于機器學(xué)習(xí)、優(yōu)化和模擬的書籍的風(fēng)格。本書專為具有概率和統(tǒng)計背景知識并對建模和應(yīng)用程序感興趣的讀者而設(shè)計。線性規(guī)劃有時用于特定的問題類型。本書提供了一個可以借助5個核心組件 (狀態(tài)變量、決策變量、外部信息變量、轉(zhuǎn)移函數(shù)和目標(biāo)函數(shù)) 對任何序貫決策問題進(jìn)行建模的通用框架; 強調(diào)了可能影響任何模型的12種不確定性, 并將做決策的各種方法 (稱為策略) 歸納為4個基本類別, 涵蓋學(xué)術(shù)文獻(xiàn)中提出的或?qū)嵺`中使用的所有方法。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容