書單推薦
更多
新書推薦
更多

強化學(xué)習(xí)與隨機優(yōu)化

強化學(xué)習(xí)與隨機優(yōu)化

定  價:158 元

叢書名:大數(shù)據(jù)與數(shù)據(jù)科學(xué)專著系列

        

  • 作者:陳志平,劉嘉,徐宗本
  • 出版時間:2025/10/1
  • ISBN:9787508867519
  • 出 版 社:科學(xué)出版社
  • 中圖法分類:TP181 
  • 頁碼:410
  • 紙張:
  • 版次:1
  • 開本:B5
9
7
8
8
6
7
7
5
5
0
1
8
9

讀者對象:高等院校數(shù)學(xué)、計算機科學(xué)、人工智能、管理科學(xué)等專業(yè)的高年級本科生、研究生、教師及相關(guān)領(lǐng)域的科技工作者

本書旨在介紹近年來作者在強化學(xué)習(xí)和隨機優(yōu)化交叉領(lǐng)域的研究成果,主要內(nèi)容包括隨機優(yōu)化的定量穩(wěn)定性分析,求解多階段隨機優(yōu)化的新型情景樹生成、約減方法,機會約束規(guī)劃問題的模型轉(zhuǎn)換、凸逼近與求解,非平穩(wěn)強化學(xué)習(xí)的樣本復(fù)雜度與泛化能力分析,隨機優(yōu)化和強化學(xué)習(xí)的統(tǒng)一模型及其基本性質(zhì),風(fēng)險厭惡馬氏決策過程與強化學(xué)習(xí),分布魯棒機會約束馬氏決策過程及其轉(zhuǎn)換與求解算法設(shè)計,連續(xù)狀態(tài)集合、連續(xù)動作集合下無限智能體的連續(xù)時間平均場強化學(xué)習(xí)問題的性質(zhì)與Actor-Critic型求解算法,以及強化學(xué)習(xí)在多期投資組合選擇中的應(yīng)用。本書的目的是幫助讀者掌握如何應(yīng)用強化學(xué)習(xí)或隨機優(yōu)化來處理不確定環(huán)境下的復(fù)雜動態(tài)決策問題、如何開展強化學(xué)習(xí)和隨機優(yōu)化的交叉研究,以便他們能夠盡快進入相應(yīng)研究領(lǐng)域的前沿。

更多科學(xué)出版社服務(wù),請掃碼獲取。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容