正在加载...
请使用更现代的浏览器并启用 JavaScript 以获得最佳浏览体验。
加载论坛时出错,请强制刷新页面重试。
全部主题
ACM图灵奖授予强化学习领域的两位奠基人: Andrew Barto 和 Richard Sutton
国内外做强化学习的老师,高校以及公司总结
求助:工业上RL应用遇到的问题
魔法原子:招聘强化学习算法(校招or社招)初阶-专家岗位都有
DDPG算法中平均reward震荡不收敛,如何解决?
使用PPO算法出现均值,标准差计算nan,求求大神解答
DQN奖励往差的跑、跑好了后跳水,求助
强化学习之父理查德·萨顿,新加坡国立大学关于AI的科学趋势、社会影响和宇宙视角讲座
DeepSeek深度求索招聘强化学习研究员和工程师(实习、全职)
出资助力强化学习算法模型项目
Limx双足机器人Tron1使用中的问题汇总以及解决方法
DDPG算法
【重磅综述】多智能体具身智能:进展和未来方向(北理工/南京大学/西交大/浙大)
JMLR 论文解读 | 北航团队提出SIDM:基于 结构信息原理的通用分层决策框架
【2025-CCF分区】计算领域高质量科技期刊分级目录
【2025-中科院分区】计算机&人工智能-期刊分区及预警期刊名单(完整版下载)
MAPPO算法训练效果好,评估效果一般
MAPPO训练效果好训练效果一般
最近专注在给mt大模型团队beam项目招募强化学习的算法同学,有兴趣做下一代颠覆级AI产品的同学欢迎多多交流呀!
逐际动力发售首款多形态双足机器人TRON 1
下一页 »
Document