新一代信息技術(shù)
一種基于SAC的汽車自適應(yīng)巡航控制優(yōu)化方法
一種基于SAC的汽車自適應(yīng)巡航控制優(yōu)化方法,屬于自動駕駛領(lǐng)域,其特征在于,該方法包括以下模塊:駕駛環(huán)境、狀態(tài)信息處理模塊、SAC強化學(xué)習(xí)模塊、動態(tài)獎勵函數(shù)模塊、經(jīng)驗分類模塊和經(jīng)驗采樣模塊。首先,從駕駛環(huán)境中獲取兩個維度的融合信息,得到當前狀態(tài),然后,SAC強化學(xué)習(xí)模塊基于當前狀態(tài)決策控制動作并應(yīng)用于駕駛環(huán)境,更新環(huán)境并獲取下一時刻的狀態(tài)。其中,動態(tài)獎勵函數(shù)模塊根據(jù)動作效果和重要性差異計算獎勵值;經(jīng)驗分類模塊根據(jù)駕駛環(huán)境對經(jīng)驗樣本進行分區(qū)域存儲;經(jīng)驗采樣模塊采用固定經(jīng)驗采樣和局部優(yōu)先經(jīng)驗回放方法,對樣本進行采樣,用于訓(xùn)練SAC強化學(xué)習(xí)模塊,并決策出最優(yōu)控制動作,實現(xiàn)自適應(yīng)巡航控制。
長春工業(yè)大學(xué)
授權(quán)發(fā)明