正在加载...
请使用更现代的浏览器并启用 JavaScript 以获得最佳浏览体验。
加载论坛时出错,请强制刷新页面重试。
全部主题
国内外做强化学习的老师,高校以及公司总结
车联网仿真环境如何搞定呢?
全职 【社招】深度求索DeepSeek 招聘强化学习算法研究员/工程师(北京/杭州均可)
【RLC2024会议总结】关于 RL/ML 历史的讨论——Andrew Barto
求大家推荐一下 强化学习结合边缘计算卸载和资源分配方向的学习
触觉算法专家#
RLC2024 accept papers list
PPO 训练过程中 performance 先变好 后变坏, 甚至比初始结果还坏
如何看待最新发布的Agent Q 方法?对行业有什么影响?
强化学习算法工程师招聘
百度招大模型和Agent方向实习生!
使用PPO算法出现均值,标准差计算nan,求求大神解答
【重磅快讯】强化学习大牛John Schulman离职OpenAI, 曾开发PPO|TRPO|GAE等算法, 领导OpenAI强化学习团队!
有没有全量微调过大模型MiniCPM-Llama3-V 2.5的?显存多少?
大家如何看“具身智能”+强化学习的结合点的发展前景
#强化学习工程师社会招聘#具身智能/抓取操作算法工程师
[滴滴实习生招聘] 强化项目落地 大有可为
如何设计高效的架构和算法,以应对 3D 视觉数据和语言数据的高维度和大规模特性,同时保证模型的泛化能力和鲁棒性?
某人形机器人公司诚邀请具身算法首席科学家加入!
强化学习/模仿学习/Q-learning/GAIL/GANs实习生招聘(出海游戏)
下一页 »
Document