比如,当数据量极大且包含各种噪声和异常值时,模型如何仍然能够准确地理解和生成有效的 3D 视觉与语言的交互结果?
怎样评估和保证模仿学习所得到的策略在长期运行中的性能和稳定性,避免出现短期有效但长期失效的情况?以机器人在长期执行任务为例,如何确保通过模仿学习得到的策略不会因为环境的微小变化而逐渐失效?