岗位职责:
您将根据团队目标和个人专长,参与以下关键领域的架构设计与工程实现:
一、高并发服务端与 API 系统:
1.深度参与面向数千万日活用户的产品后端架构设计;
2.负责核心服务的性能优化、数据库调优与分布式系统可靠性保障;
3.开发与迭代 AI Chat Bot 等创新产品功能,探索 AI 技术的应用边界。
二、大规模数据处理 Pipeline:
1.负责数据采集、清洗、去重与质量评估系统的设计与开发;
2.构建服务于搜索、多模态与模型训练的高质量数据湖与索引系统;
3.持续优化数据处理各环节的性能与吞吐,确保数据管道的稳定高效。
三、Agent 基础设施与运行时平台:
1.设计与开发支撑海量 AI Agent 运行的下一代容器调度与隔离平台;
2.攻克容器生命周期管理、资源精细调度、多硬件平台统一支持等核心难题;
3.构建高性能、高安全性的 Agent 运行时环境。
四、异构超算基础设施:
1.参与设计、构建与优化支撑大模型训练与推理的异构计算集群管理平台;
2.负责加速卡(如GPU/NPU)等异构计算资源的抽象、池化、调度与性能优化;
3.与超算团队、硬件团队深度协作,解决大规模集群下的资源编排、通信优化、故障容错与能效比提升等挑战,为上层AI研发提供稳定高效的算力底座。
核心要求:
一、工程与架构能力:
1.精通 Rust / C++ / TypeScript / Python 中至少一门语言,具备优秀的设计能力与代码质量意识;
2.对分布式系统有深刻理解与实践经验,能够设计高可用、高可靠的系统架构;
3.对数据库原理有深入理解,拥有丰富的性能调优与大数据处理经验。
二、系统与运维功底:
1.深刻理解计算机组成、操作系统、计算机网络等核心原理;
2.熟练运用 Profiling 和可观测性工具分析与定位复杂系统问题;
3.对 Kubernetes 及云原生部署有深入理解,具备云上系统优化经验。
三、视野与思辨:
1.对世界充满好奇心,这种好奇心会自然延伸到对复杂系统底层运作机制的持续探索;
2.不满足于被动执行,对通用人工智能(AGI)的技术路径与发展有着独立的思考与执着的好奇心;
3.相信广泛的兴趣能滋养创造力。无论是音乐、体育、美术,还是其他领域的热情与审美,我们相信这些都将为你带来独特的视角与创新灵感。