123,123,123

強化學(xué)習(xí)與隨機優(yōu)化：序貫決策的通用框架

定　　價：256 元

作者：(美) 沃倫·B.鮑威爾 (Warren B.Powell) 著
出版時間：2025/9/1
ISBN：9787302697145
出版社：清華大學(xué)出版社

中圖法分類：TP181
頁碼：780頁
紙張：
版次：1
開本：25cm

內(nèi)容簡介

本書是第一本探討如何對不同方法進(jìn)行均衡處理, 以便建模和解決序貫決策問題的圖書, 承襲了大多數(shù)聚焦于機器學(xué)習(xí)、優(yōu)化和模擬的書籍的風(fēng)格。本書專為具有概率和統(tǒng)計背景知識并對建模和應(yīng)用程序感興趣的讀者而設(shè)計。線性規(guī)劃有時用于特定的問題類型。本書提供了一個可以借助5個核心組件 (狀態(tài)變量、決策變量、外部信息變量、轉(zhuǎn)移函數(shù)和目標(biāo)函數(shù)) 對任何序貫決策問題進(jìn)行建模的通用框架; 強調(diào)了可能影響任何模型的12種不確定性, 并將做決策的各種方法 (稱為策略) 歸納為4個基本類別, 涵蓋學(xué)術(shù)文獻(xiàn)中提出的或?qū)嵺`中使用的所有方法。

你還可能感興趣

我要評論