岗位职责:
1. 在强化学习、多智能体强化学习、博弈论等领域开展前沿技术研究,包括但不限于多智能体协同探索、分布式合作等;
2. 非完全信息和不确定性环境下的博弈决策算法研究及应用;
3. 完成相关算法的开发和测试工作;
4. 参与相关paper和专利的撰写。
岗位要求:
1. 硕士在读及以上学历,计算机、软件等相关专业背景,有强化学习经验的其他专业背景亦可;
2. 了解深度强化学习,尤其是多智能体强化学习相关知识,掌握值函数分解、多智能体协作等理论和算法;熟悉多智能体强化学习框架PyMARL者优先;
3. 有较强的编程能力,熟练使用tensorflow/pytorch等至少一种深度学习框架;
4. 需全职实习三个月,可实习6个月及以上优先; 5. 在相关顶级会议或期刊上有论文发表者优先。
工作地点:杭州余杭区科创大道之江实验室新园区
诚邀有意者投递简历至邮箱:luyf@zhejianglab.com