职位名称:强化学习算法实习工程师
工作地点:杭州
公司简介:我们是一家专注于人工智能领域的创业公司,隶属于上海算法创新研究院,致力创建行业领先的大模型。我们的团队成员来自于卡内基梅隆大学、清华大学、中科院等国内外知名高校和阿里、华为、美团等知名企业,具有丰富的研究和实践经验。
职位描述:
1. 负责强化学习算法的研究和开发,核心包括RLHF和Safe RL;
2. 参与团队的算法研究和开发,提出创新性的想法和解决方案;
3. 参与大模型从0-1的搭建和训练;
4. 撰写技术文档和论文。
职位要求:
1. 计算机、数学等相关专业硕士及以上学历;
2. 熟练掌握Python编程语言,熟悉TensorFlow、PyTorch等深度学习框架;
3. 熟悉强化学习算法,有RLHF方向的经验者优先;
4. 有论文发表经验者优先;
5. 具备良好的团队合作精神和沟通能力;
本次实习你可以获得什么:
1. 全程参与一个大模型的训练,我们这有丰富的A100,欢迎你来实验任何你觉得有价值的想法;
2. 强化方向所带实习生每年在ICML、NIPS上均有论文的发表,相信你也可以;
3. 富有活力的创业团队,在这,我们没有领导,只有一群充满激情的创业者,随时可以畅所欲言;
4. 具有竞争性的实习薪酬,大厂实习工资2倍。
如果您对该职位感兴趣,请将简历发送至邮箱llm_new@163.com