关于我们
博客
捐赠
RL问题智能体
简体中文
简体中文
English
注册
登录
问题求助
理论推导问题
多智能体强化学习中,让所有智能体同构时,让他们参数共享时有没有理论保证?
登录以回复
登录以回复
最近浏览的人
Guest
2 天前
Guest
6 天前
Guest
9 天前
Guest
10 天前
Guest
10 天前
1
/
3
条
最早内容
1
/
3
条
一月 2021
0 条未读
最新回复
NanNan
RL
16
2021年1月3日
发布 #1
2021年1月3日星期日 10点38分
PS:
(1)TRPO为何能收敛?
(2)如何克服环境的non-stationary?
3 年 后
Kaige2000
RL
0
2023年8月17日
发布 #2
2023年8月17日星期四 13点12分
同问
10 天 后
R
RLer
RL
34
2023年8月27日
发布 #3
2023年8月27日星期日 03点40分
NanNan
知乎搜一下,记得之前看到过
说点什么吧...
正在加载...
请使用更现代的浏览器并启用 JavaScript 以获得最佳浏览体验。
加载论坛时出错,请强制刷新页面重试。
多智能体强化学习中,让所有智能体同构时,让他们参数共享时有没有理论保证?
NanNan
PS:
(1)TRPO为何能收敛?
(2)如何克服环境的non-stationary?
RLer
NanNan
知乎搜一下,记得之前看到过
Kaige2000
同问
Document