全部主题: Page 2 - 深度强化学习实验室(社区)

正在加载...

加载论坛时出错，请强制刷新页面重试。

全部主题

魔法原子:招聘强化学习算法（校招or社招）初阶-专家岗位都有
DDPG算法中平均reward震荡不收敛，如何解决？
使用PPO算法出现均值，标准差计算nan，求求大神解答
DQN奖励往差的跑、跑好了后跳水，求助
强化学习之父理查德·萨顿，新加坡国立大学关于AI的科学趋势、社会影响和宇宙视角讲座
DeepSeek深度求索招聘强化学习研究员和工程师（实习、全职）
出资助力强化学习算法模型项目
Limx双足机器人Tron1使用中的问题汇总以及解决方法
DDPG算法
【重磅综述】多智能体具身智能：进展和未来方向(北理工/南京大学/西交大/浙大)
JMLR 论文解读 | 北航团队提出SIDM：基于结构信息原理的通用分层决策框架
【2025-CCF分区】计算领域高质量科技期刊分级目录
【2025-中科院分区】计算机&人工智能-期刊分区及预警期刊名单（完整版下载）
MAPPO算法训练效果好，评估效果一般
MAPPO训练效果好训练效果一般
最近专注在给mt大模型团队beam项目招募强化学习的算法同学，有兴趣做下一代颠覆级AI产品的同学欢迎多多交流呀！
逐际动力发售首款多形态双足机器人TRON 1
逐际动力发布 LimX VGM 具身机器人操作算法
多级脉冲机动追逃博弈
Tron1首款多形态双足机器人——人形RL科研入门不二之选

« 上一页下一页 »

Document

关于实验室

社区使用规范
捐赠/Donate
E-mail联系我们
微信公众：DeepRLHub

实验室服务

开源项目: Github
开源项目: Gitee
Bilibili视频
CSDN博客

社区规范 | 违法和不良信息举报
本网站页面发布内容版权归发布作者和平台所有，本站仅做学术分享和学习交流使用，如有侵犯，请立即联系E-mail，我们将在24小时内进行处理和解决