职位描述

#2158

大模型微调算法

北京

工程-算法

20-45k 大模型微调算法工程师岗位描述： 1. 参与产品涉及领域模型能力建设及优化工作，不限于(M) LLM、模型SFT、RLHF、多模态理解等，使模型效果位于业界领先水平； 2. 负责 (M) LLM、Agents 和 RAG 技术的研究与应用，构建自动化前后端工程生成与维护能力，进行技术验证和持续优化； 3. 调研大模型前沿技术方案，在模型训练范式、模型结构、数据配比探索最佳实践方案，取得业务效果大幅提升的同时实现前沿技术突破。岗位职责 1. 计算机科学或相关领域学位，拥有丰富的深度学习理论和实践经验，以及至少1年以上的大模型算法开发经验； 2. 熟悉深度学习的并行处理和分布式训练技术，具备在多节点多GPU环境下进行大模型训练的经验或能力； 3. 熟练掌握transformer架构,MOE,机器学习,深度学习,强化学习等核心原理以及pytorch,tensorflow框架的应用以及原理； 4. 熟练大模型微调技术,掌握unsloth,SWIFT,llamafactory等一种或多种微调框架或熟练掌握百度千帆,阿里百练等在线微调平台一种或多种； 5. 熟练掌握模型推理优化,熟练掌握vllm,LLaMA.cpp,triton,Xinference等。

Contact Our Consultant

Zoy Wang

Consultant

Surrienta Consulting Ltd. @2024