• 落地应用
  • 深度强化学习训练双足机器人行走如何实现?

7 天 后

Aruen

个人建议先在模拟环境中训练出一个智能体,然后尝试sim2real的思路,不然10个机器人都不够你摔

19 天 后

模拟环境怎么选?强化学习怎么和电机相结合?

    Aruen 有很多开源的环境模拟器,从这个方向切入。了解一下 Openai gym 库及其生态

    建议先在虚拟环境下训练好,然后迁移至机器人。

    有许多开源的训练环境。

    16 天 后

    大致流程可能是这样的,

    1. 建立环境模型: 建立一个双足机器人的动力学模型,模拟其在不同腿部姿态和脚步长度下的运动。
    2. 选择策略模型: 使用深度神经网络来模拟机器人的策略,即决定机器人在每一步应该采取哪种腿部姿态和脚步长度。
    3. 设计奖励函数: 设计一个奖励函数来评估机器人的行走效果,如平衡、步态稳定性、步长等。
    4. 训练: 使用强化学习算法如 Q-learning, SARSA, DDPG或PPO 训练策略模型,使其学会最优策略。
    5. 验证和测试: 在真实机器人上验证和测试训练的策略模型,评估其在真实环境中的行走效果。

    可能对你有帮助的开源资料:

    OpenAI's baselines: https://github.com/openai/baselines
    rllab: https://github.com/rllab/rllab
    TensorFlow's RL: https://github.com/tensorflow/agents
    Pybullet: https://github.com/bulletphysics/bullet3
    MuJoCo: http://www.mujoco.org/

    可以先看一下baselines示例代码


    MujoCo 是个物理模拟引擎,可用于机器人控制环境模拟,

      在模拟环境中训练出的智能体,如何迁移到实际机器人上?

      这里面涉及到将训练的结果跟硬件关联起来,怎么能跟硬件关联起来,然后硬件还要做得好?

      整个机器人的控制,通信之间关系等

      sepilqi 用MujoCo建立一个双足机器人的动力学模型?在真实机器人上验证和测试训练的策略模型这个有很多问题,不知具体如何验证?

      1 个月 后

      sepilqi

      @Aruen 路上的这个方法是可行的,最好有个模拟器可能会帮助更大

      说点什么吧...
      Document