20-45k
大模型微调算法工程师
岗位描述:
1. 参与产品涉及领域模型能力建设及优化工作,不限于(M) LLM、模型SFT、RLHF、多模态理解等,使模型效果位于业界领先水平;
2. 负责 (M) LLM、Agents 和 RAG 技术的研究与应用,构建自动化前后端工程生成与维护能力,进行技术验证和持续优化;
3. 调研大模型前沿技术方案,在模型训练范式、模型结构、数据配比探索最佳实践方案,取得业务效果大幅提升的同时实现前沿技术突破。
岗位职责
1. 计算机科学或相关领域学位,拥有丰富的深度学习理论和实践经验,以及至少1年以上的大模型算法开发经验;
2. 熟悉深度学习的并行处理和分布式训练技术,具备在多节点多GPU环境下进行大模型训练的经验或能力;
3. 熟练掌握transformer架构,MOE,机器学习,深度学习,强化学习等核心原理以及pytorch,tensorflow框架的应用以及原理;
4. 熟练大模型微调技术,掌握unsloth,SWIFT,llamafactory等一种或多种微调框架或 熟练掌握百度千帆,阿里百练等在线微调平台一种或多种;
5. 熟练掌握模型推理优化,熟练掌握vllm,LLaMA.cpp,triton,Xinference等。