负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式。主要工作方向包括:
1. 探索超大规模模型,并进行极致系统优化;
2. 数据建设、指令微调、偏好对齐、模型优化;
3. 相关应用落地,包括生成创作、逻辑推理、代码生成等;
4. 深入研究和探索在未来生活中的更多使用场景。
1. 全日制本科及以上学历,计算机、软件工程相关专业;
2. 具备优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
3. 熟悉NLP、CV相关的算法和技术,熟悉大模型训练、RL算法者优先;
4. 在大模型领域主导过大影响力的项目或论文者优先;
5. 具备出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题;
6. 具有良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。