company logo
#2158
大模型微调算法
北京
工程-算法
20-45k 大模型微调算法工程师 岗位描述: 1. 参与产品涉及领域模型能力建设及优化工作,不限于(M) LLM、模型SFT、RLHF、多模态理解等,使模型效果位于业界领先水平; 2. 负责 (M) LLM、Agents 和 RAG 技术的研究与应用,构建自动化前后端工程生成与维护能力,进行技术验证和持续优化; 3. 调研大模型前沿技术方案,在模型训练范式、模型结构、数据配比探索最佳实践方案,取得业务效果大幅提升的同时实现前沿技术突破。 岗位职责 1. 计算机科学或相关领域学位,拥有丰富的深度学习理论和实践经验,以及至少1年以上的大模型算法开发经验; 2. 熟悉深度学习的并行处理和分布式训练技术,具备在多节点多GPU环境下进行大模型训练的经验或能力; 3. 熟练掌握transformer架构,MOE,机器学习,深度学习,强化学习等核心原理以及pytorch,tensorflow框架的应用以及原理; 4. 熟练大模型微调技术,掌握unsloth,SWIFT,llamafactory等一种或多种微调框架或 熟练掌握百度千帆,阿里百练等在线微调平台一种或多种; 5. 熟练掌握模型推理优化,熟练掌握vllm,LLaMA.cpp,triton,Xinference等。
Contact Our Consultant
avatar
Zoy Wang
Consultant
wechat