14.2. 設定參數

DQN Agent 的目標是讓 TurtleBot3 能避開障礙物到達目的地。當 TurtleBot3 越接近目的地時,它會獲得一個正的獎勵(positive reward),當它離目的地越來越遠時,它會獲得負的獎勵(negative reward)。當 TurtleBot3 碰撞到障礙物或經過一段時間後,這段事件(episode)就終止了。 在這一事件中,當 TurtleBot3 在達到目的地時,會獲得大的正獎勵,而當 TurtleBot3 碰到障礙物時,會獲得大的負獎勵。

Last updated