中文久久久字幕|亚洲精品成人 在线|视频精品5区|韩国国产一区

事件驅(qū)動的強(qiáng)化學(xué)習(xí)多智能體編隊控制

作者:徐鵬; 謝廣明; 文家燕; 高遠(yuǎn) 廣西科技大學(xué)電氣與信息工程學(xué)院; 廣西柳州545006; 北京大學(xué)工學(xué)院; 北京100871; 北京大學(xué)海洋研究院; 北京100871

摘要:針對經(jīng)典強(qiáng)化學(xué)習(xí)的多智能體編隊存在通信和計算資源消耗大的問題,本文引入事件驅(qū)動控制機(jī)制,智能體的動作決策無須按固定周期進(jìn)行,而依賴于事件驅(qū)動條件更新智能體動作。在設(shè)計事件驅(qū)動條件時,不僅考慮智能體的累積獎賞值,還引入智能體與鄰居獎賞值的偏差,智能體間通過交互來尋求最優(yōu)聯(lián)合策略實(shí)現(xiàn)編隊。數(shù)值仿真結(jié)果表明,基于事件驅(qū)動的強(qiáng)化學(xué)習(xí)多智能體編隊控制算法,在保證系統(tǒng)性能的情況下,能有效降低多智能體的動作決策頻率和資源消耗。

注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社

智能系統(tǒng)學(xué)報

北大期刊 下單

國際刊號:1673-4785

國內(nèi)刊號:23-1538/TP

雜志詳情
相關(guān)熱門期刊

服務(wù)介紹LITERATURE

正規(guī)發(fā)表流程 全程指導(dǎo)

多年專注期刊服務(wù),熟悉發(fā)表政策,投稿全程指導(dǎo)。因為專注所以專業(yè)。

保障正刊 雙刊號

推薦期刊保障正刊,評職認(rèn)可,企業(yè)資質(zhì)合規(guī)可查。

用戶信息嚴(yán)格保密

誠信服務(wù),簽訂協(xié)議,嚴(yán)格保密用戶信息,提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉(zhuǎn)刊。資金受第三方支付寶監(jiān)管,安全放心。