company logo
#2354
AI Infra研发工程师(LLM)-至知创新研究院
北京
上海
深圳
工程
岗位职责 1、负责超大规模机器学习系统的架构设计与实现,直面高并发、低延迟、高可靠性与可扩展性等核心工程问题; 2、覆盖系统多个关键子领域:资源调度、分布式模型训练、数据管理与高性能计算等,能在不同岗位边界灵活切换与贡献; 3、与算法团队紧密协作,推动算法与系统的协同优化; 4、主动跟踪并引入前沿技术,把最新硬件、异构计算、编译优化、以及RL/Agent型交互等新方向落地到工程实践中。 岗位要求 1、在工程实现或机器学习算法上有扎实基础与丰富实践经验; 2、有解决棘手问题的经历,愿意钻研根源、追查底层问题,具备敏锐观察力和清晰的逻辑思维; 3、热爱技术、有责任感、学习能力强、沟通顺畅并能自驱推进工作; 4、善于团队协作,积极创新,乐于挑战,具有自我驱动和自我管理能力。 加分项 1、熟悉LLM/NLP/CV相关算法,或有大模型训练、强化学习(RL)经验优先; 2、具备高性能计算/CUDA、RDMA/通信库、系统与算法联合优化、异构加速硬件、分布式系统或大数据架构等任一方向的实践经验尤佳; 3、有千卡/万卡级别训练集群的架构设计、容量规划或运维经验,或有开源贡献、论文或专利者优先。
Contact Our Consultant
avatar
Zoy Wang
Consultant
wechat