交易后数据工程师 (Post Trading Data Engineer)
您将是公司交易数据价值链的核心构建者。负责设计、实施和维护交易后数据处理管线(Pipeline),确保所有历史交易、市场和账户数据的高完整性、高准确性和高可用性。您的工作直接支撑公司的财务核算、风险管理和量化研究。
1. PnL 核算与报告:
- 主导开发和维护精确的盈亏(PnL)计算系统,负责日终 PnL (EOD PnL) 的最终核算,确保与外部对账单和清算数据的一致性。
- 构建自动化报告系统,生成包括历史 PnL 趋势、回撤分析、风险回报比等关键业务指标报告。
2. 合规与审计支持:
- 设计和维护交易数据完整性校验工具,每日核对交易记录与经纪商对账单,确保数据零丢失、零错误。
- 负责根据监管要求,生成标准的交易报告和审计所需的历史证据链(Traceability)。
3. 交易质量分析 (TCA):
- 开发 Transaction Cost Analysis 工具,计算历史交易的滑点、冲击成本、成交均价等指标,并按经纪商、策略、合约等维度进行细致分析。
- 利用历史日志数据,对系统的 P99.9 延迟抖动进行深入研究,找出导致极端延迟的根本原因(如特定时段的 CPU 中断、网络拥堵等),并将发现反馈给核心技术团队。
4. 交易数据持久化、清洗与管理:
- 数据抽取与 ETL:负责设计和维护高效的 ETL (Extract, Transform, Load) 流程,将来自 Co-location 的 Journal Files (日志文件) 中的原始数据(市场、订单、回报)同步、清洗和结构化到核心数据中心, 以文件或时间序列数据库形式加以持久化管理。
- 数据完整性校验:设计自动化工具,每日将交易记录与经纪商/交易所的对账单进行严格核对,这是确保数据可信度的关键步骤。
- Prod-Sim 结果校验:与核心技术团队协作,量化并报告实盘(Prod)和回测(Sim)结果之间的偏差,帮助定位策略或系统 Replay 逻辑中的潜在问题。
职位要求
1. 学历背景:计算机科学、数据科学、金融工程或相关理工科专业硕士及以上学历。
2. 经验要求:具备丰富的数据工程经验,至少 2 年在金融、交易或高并发系统背景下的数据处理经验。
3. 技术专长:
- 精通 Python(作为主要的数据处理语言),熟悉高性能库(如 Pandas, NumPy)。
- 了解数据中间件如:Kafka
- 掌握 SQL 和数据库技术,具备 Time-Series Database(如 InfluxDB, TimescaleDB,PostgreSQL)或分布式数据库(如 Cassandra, HBase)的实战经验。
- 熟悉数据 ETL 工具和流程设计。
4. 金融与业务知识:
- 对交易数据有深刻理解:熟悉订单生命周期、PnL 计算原理、交易费用和清算流程。
- 具备数据驱动思维,能够将数据分析结果转化为业务优化建议。
加分项
- 了解 FIX 协议和交易 Journal File 的数据结构。
- 有开发或维护高并发、分布式数据采集系统经验。
- 熟悉云计算环境下的数据存储和处理方案。
- 了解 C++,能够阅读和理解交易系统核心模块的日志结构和数据格式。