如题,请问有没有大佬在做RL或者DRL来控制无人机的姿态的?我设计的奖励函数是分阶段的:如果姿态误差值,下一步比上一步的误差小,给一个r1=2;每一步的姿态误差和角速度误差的值都给一个负的惩罚;当所有的姿态误差和角速度误差加起来都小于1°的时候,给一个正的奖励r3=5,当加起来小于0.5°的时候给一个更大的正奖励r3=150.
奖励函数设计的思路大概如上。我看到一些论文里说,可以用RL训练智能体输出飞机的四个端到端的控制量直接控制无人机的姿态,分别是发动机推力T和三个舵面:升降舵偏角、方向舵偏角和副翼。论文里都说这四个值作为控制量直接作用于无人机模型,影响气动系数,进而影响气动力和力矩,最后影响飞机的姿态。
请问 能用RL直接输出这四个action直接输给无人机模型里吗?我试了很久,飞机的姿态完全控制不住,而且还发散震荡的很厉害,reward也没有收敛,完全是负数而且负的数值很大很大。
求助求助!真的对我很重要!希望有懂的大佬帮帮我!谢谢!