正在加载...
请使用更现代的浏览器并启用 JavaScript 以获得最佳浏览体验。
加载论坛时出错,请强制刷新页面重试。
全部主题
【重磅中文综述】南京大学LAMDA团队发布“开放环境下的协作多智能体强化学习进展综述”,包含519篇参考文献
国内外做强化学习的老师,高校以及公司总结
任务目标提前结束,导致奖励下降,怎么解决?
MADDPG平均奖励不收敛
如何评价openai最新提出的Q*算法?
基于强化学习的底盘AI控制策略研究招聘
[2024] Reinforcement Learning Conference征稿中
我现在在使用ddpg算法实现基于连续动作空间的局部路径规划。但是算法跑出来的结果,不收敛。有没有大佬能帮我解答一下。代码已上传
model based 模型如何才能预测的更远
西湖大学流体智能与信息化实验室博士后/科研助理/访问学生招聘
PILCO控制无法收敛
西湖大学齐国君老师实验室研究员/科研助理/访问学生招聘
DDPG网络训练前后测试效果均不佳
多智能体RL,联合动作限制条件问题
【实验室赠书5本】白辰甲等老师撰写新书《强化学习:前沿算法与应用》
【京东招聘-北京-强化学习博士实习生】
微软亚洲研究院数据知识智能组招聘强化学习方向研究实习生
【新书推荐】多智能体强化学习
博士申请 | 香港中文大学(深圳)刘桂良老师招收强化学习方向全奖博士/硕士/RA
求助,QMIX算法官方代码的agent决策网络是共用的吗?
下一页 »
Document