基于雙向長(zhǎng)短時(shí)記憶與混合獎(jiǎng)勵(lì)函數(shù)的多無(wú)人車協(xié)同圍捕控制
中國(guó)科學(xué):技術(shù)科學(xué)
頁(yè)數(shù): 11 2024-09-10
摘要: 針對(duì)未知、不確定環(huán)境下多無(wú)人車協(xié)同圍捕問(wèn)題,本文提出了一種基于雙向長(zhǎng)短時(shí)記憶與混合獎(jiǎng)勵(lì)函數(shù)(BM-MADDPG)的多智能體協(xié)同圍捕決策算法解決無(wú)人車圍捕策略生成與協(xié)同控制問(wèn)題.首先,通過(guò)雙向長(zhǎng)短時(shí)記憶(bidirectional long short-term memory, Bi-LSTM)網(wǎng)絡(luò)捕捉狀態(tài)和動(dòng)作序列間時(shí)序信息特征,評(píng)估當(dāng)前狀態(tài)采取不同動(dòng)作的長(zhǎng)期效果,解決協(xié)作圍捕... (共11頁(yè))