岗位职责:
1、参与AI infra 平台、AI 应用平台的后端开发、设计、研发、调试、测试工作;
2、参与AI平台本身各项功能以及用户训练任务、AI 应用的性能监控、分析、调优(以及可能的重构)工作;
3、 将平台与框架结合进行分析,保证平台中各种不同框架下的不同训练任务的稳定、高效运行,并参与框架本身的改进工作;
4、 能够积极学习新知识,积极参与团队协作,共同完成多项功能的研发。
任职要求:
1、 熟悉Python、Golang、C++ 程序语言,高度熟练使用Python、Golang语言;
2、熟练 AI 训练的全周期,熟悉Pytorch的使用。
3、 了解 AI 应用的常见模式,了解数据清洗和RAG、Prompt 工程等。
4、熟练掌握k8s的原理、技术、使用、开发,有高度相关的开发经验;
5、具有扎实的代码功底和实战能力,对代码的性能、扩展性、可读性有较高的要求,对自己写的代码高度负责;
6、 具备独立解决复杂以及未知的新问题的能力,能够在较大压力下较好完成任务;
7、 具有良好的工作文档习惯,及时撰写更新工作流程及技术文档。
加分项:
1、对k8s的底层和各项技术了解,有深入的开发经验;
2、熟悉pytorch等分布式训练框架的优化、瓶颈监控与性能分析、改进;
3、熟悉业界常见大模型的使用