123,123,123

本書旨在介紹近年來作者在強化學(xué)習(xí)和隨機優(yōu)化交叉領(lǐng)域的研究成果，主要內(nèi)容包括隨機優(yōu)化的定量穩(wěn)定性分析，求解多階段隨機優(yōu)化的新型情景樹生成、約減方法，機會約束規(guī)劃問題的模型轉(zhuǎn)換、凸逼近與求解，非平穩(wěn)強化學(xué)習(xí)的樣本復(fù)雜度與泛化能力分析，隨機優(yōu)化和強化學(xué)習(xí)的統(tǒng)一模型及其基本性質(zhì)，風(fēng)險厭惡馬氏決策過程與強化學(xué)習(xí)，分布魯棒機會約束馬氏決策過程及其轉(zhuǎn)換與求解算法設(shè)計，連續(xù)狀態(tài)集合、連續(xù)動作集合下無限智能體的連續(xù)時間平均場強化學(xué)習(xí)問題的性質(zhì)與Actor-Critic型求解算法，以及強化學(xué)習(xí)在多期投資組合選擇中的應(yīng)用。本書的目的是幫助讀者掌握如何應(yīng)用強化學(xué)習(xí)或隨機優(yōu)化來處理不確定環(huán)境下的復(fù)雜動態(tài)決策問題、如何開展強化學(xué)習(xí)和隨機優(yōu)化的交叉研究，以便他們能夠盡快進入相應(yīng)研究領(lǐng)域的前沿。

更多科學(xué)出版社服務(wù)，請掃碼獲取。

你還可能感興趣

我要評論