書單推薦 新書推薦 |
強化學(xué)習(xí)與隨機優(yōu)化:序貫決策的通用框架
本書是第一本探討如何對不同方法進(jìn)行均衡處理, 以便建模和解決序貫決策問題的圖書, 承襲了大多數(shù)聚焦于機器學(xué)習(xí)、優(yōu)化和模擬的書籍的風(fēng)格。本書專為具有概率和統(tǒng)計背景知識并對建模和應(yīng)用程序感興趣的讀者而設(shè)計。線性規(guī)劃有時用于特定的問題類型。本書提供了一個可以借助5個核心組件 (狀態(tài)變量、決策變量、外部信息變量、轉(zhuǎn)移函數(shù)和目標(biāo)函數(shù)) 對任何序貫決策問題進(jìn)行建模的通用框架; 強調(diào)了可能影響任何模型的12種不確定性, 并將做決策的各種方法 (稱為策略) 歸納為4個基本類別, 涵蓋學(xué)術(shù)文獻(xiàn)中提出的或?qū)嵺`中使用的所有方法。
你還可能感興趣
我要評論
|