AI Infra研发工程师(LLM)-至知创新研究院
岗位职责
1、负责超大规模机器学习系统的架构设计与实现,直面高并发、低延迟、高可靠性与可扩展性等核心工程问题;
2、覆盖系统多个关键子领域:资源调度、分布式模型训练、数据管理与高性能计算等,能在不同岗位边界灵活切换与贡献;
3、与算法团队紧密协作,推动算法与系统的协同优化;
4、主动跟踪并引入前沿技术,把最新硬件、异构计算、编译优化、以及RL/Agent型交互等新方向落地到工程实践中。
岗位要求
1、在工程实现或机器学习算法上有扎实基础与丰富实践经验;
2、有解决棘手问题的经历,愿意钻研根源、追查底层问题,具备敏锐观察力和清晰的逻辑思维;
3、热爱技术、有责任感、学习能力强、沟通顺畅并能自驱推进工作;
4、善于团队协作,积极创新,乐于挑战,具有自我驱动和自我管理能力。
加分项
1、熟悉LLM/NLP/CV相关算法,或有大模型训练、强化学习(RL)经验优先;
2、具备高性能计算/CUDA、RDMA/通信库、系统与算法联合优化、异构加速硬件、分布式系统或大数据架构等任一方向的实践经验尤佳;
3、有千卡/万卡级别训练集群的架构设计、容量规划或运维经验,或有开源贡献、论文或专利者优先。