1. 基础设施与集群管理
- 负责公司IDC机房、本地服务器集群及云资源的⽇常运维,管理服务器(Linux为主)、存储及虚拟化平台(VMware/KVM)
- 监控上下游系统正常运行(极速交易柜台、行情分发系统、网关)。
- 规划并实施集群的高可用架构。
2. ⾃动化运维与部署
- 设计和维护⾃动化运维平台,实现系统批量配置、应⽤⾃动发布与升级管理。
- 编写Python脚本,解决监控、⽇志分析、数据备份等运维⼯作。
- 管理CI/CD流⽔线,⽀持量化研究环境的快速迭代。
3. ⽹络与安全管理
- 维护公司核⼼⽹络架构(交换机、路由器、防⽕墙),管理交易⽹络与办公⽹络的物理/逻辑隔离。
- 负责低延迟⽹络调优,监控⽹络延迟、丢包率,配合量化部⻔降低交易链路时延。
- 执⾏信息安全策略(漏洞扫描、访问控制、⽇志审计),符合私募基⾦合规要求。
4. 监控与应急响应
- 部署监控体系(Prometheus+Grafana),覆盖服务器、⽹络设备、交易进程及⾏情源。
- 制定应急预案,作为第⼀响应⼈处理交易时段突发故障(如:服务器宕机、⽹络拥塞、⾏情断流)。
职位要求
1. 本科及以上学历,计算机、⽹络⼯程或相关专业。
2. 三年以上Linux系统运维经验,有⾦融⾏业(私募、券商、期货)背景者优先。
3. Linux技能:精通Ubuntu优先。
4. 英⽂流利,能作为⼯作语⾔沟通
5. ⾃动化运维:熟练掌握Ansible/Puppet/SaltStack中⾄少⼀种,能编写复杂Playbook;熟练使⽤Python/Shell。
6. ⽹络技术:熟悉TCP/IP协议、VLAN、OSPF/BGP路由、防⽕墙策略;了解RDMA、DPDK、SOLIDfire等低延迟技术者优先。
7. 集群管理:有Docker环境运维经验、熟悉分布式存储优先。
8. 沟通能⼒强,能和相关的参与⽅和上下游沟通。
9. 极强的问题排查能⼒,能在突发时间下保持冷静。
10. 良好的⽂档习惯,能清晰记录变更、故障及合规⽇志。