宇航学报 ›› 2019, Vol. 40 ›› Issue (2): 199-206.doi: 10.3873/j.issn.1000-1328.2019.02.009
张振宁,张冉,聂文明,李惠峰
ZHANG Zhen ning, ZHANG Ran, NIE Wen ming, LI Hui feng
摘要:
针对再入飞行器姿态控制问题,应用自适应动态规划(ADP)理论设计了姿态控制器。将再入飞行器的姿态控制建模为非线性系统的最优控制问题,提出单网络积分型强化学习(SNIRL)算法进行求解,该算法简化了积分型强化学习(IRL)算法在迭代计算中的执行-评价双网络结构,只需要采用评价网络估计值函数就可以求得最优控制律,其收敛性得到了理论证明。基于SNIRL算法设计了自适应最优控制器,并证明了闭环系统的稳定性。通过数值仿真校验了SNIRL算法比IRL算法计算效率更高,收敛速度更快,并校验了自适应最优姿态控制器的有效性 。
中图分类号: