tian_tian
强化学习中对李雅普诺夫这一块好像没怎么提及,具体也不太清除,顺便理解了一下在整个概念,给大家也分享一下
表格值用压缩映射证明收敛性,线性和非线性的函数估计需要用李雅普诺夫稳定性判定,只不过李雅普诺夫函数都比较好找