2026-05-08 · 约 8 分钟

combo_eq alpha 验证 · z-score N=300

SQTS 选股因子的统计显著性证伪 — 4 段 × 4 metric 对比 random baseline

#研究#zscore#alpha验证#SQTS

⚠️ 本研究基于历史回测,仅作为研究记录公开,不构成任何投资建议。市场有风险,决策请独立判断。

摘要

问题: SQTS C1 (Baseline B 纯股) 的 combo_eq 选股算法 — 5 行业 × 每行业 combo (12M 动量 + ROE_yearly + 20D 低波) rank 等权 top 10, 共 50 股 — 全样本 CAGR ~21.8% / Sharpe 0.94 的表现, 究竟是真实 alpha 还是运气?

方法: 在每月底, 同 5 行业 + 同 30 股池 内部, 跑 N=300 个随机选 10 股 baseline (与 combo_eq 同规模 50 股、同 rebalance 频率), 用 z-score 衡量 combo_eq 相对 random 分布的偏离程度.

4 段拆分:

  • 全样本: 2016-02 → 2026-04 (~125 个月)
  • IS (in-sample): 2016-02 → 2022-02
  • OOS (out-of-sample): 2022-02 → 2026-04
  • 近 4 年: 2022-04 → 2026-04 (信任资本敏感期)

判读阈值:

  • z > 2.0 → 95% 显著 (alpha 真)
  • z ∈ [1.5, 2.0] → 边际显著
  • z < 1.5 → 不能拒绝 random hypothesis (alpha 可能是运气)

主表 — combo_eq vs random N=300

全样本

指标combo_eqrandom 均值 ± stdrandom p5 / p95z-scorep-value (单侧)
CAGR+21.81%+18.20% ± 2.06%+14.86% / +21.73%+1.750.040
Sharpe0.940.81 ± 0.060.70 / 0.92+2.010.022
MDD-36.07%-37.61% ± 2.79%-42.13% / -32.86%-0.550.710
月胜率+59.35%+58.04% ± 1.88%+55.28% / +60.98%+0.700.242

IS

指标combo_eqrandom 均值 ± stdrandom p5 / p95z-scorep-value (单侧)
CAGR+27.86%+30.35% ± 3.53%+25.43% / +36.50%-0.700.759
Sharpe1.031.04 ± 0.080.90 / 1.18-0.030.511
MDD-34.04%-34.79% ± 2.19%-38.30% / -31.28%-0.340.633
月胜率+58.90%+59.82% ± 2.46%+56.16% / +63.01%-0.370.645

OOS

指标combo_eqrandom 均值 ± stdrandom p5 / p95z-scorep-value (单侧)
CAGR+14.84%+8.58% ± 2.47%+4.62% / +12.60%+2.530.006
Sharpe0.810.49 ± 0.110.32 / 0.67+2.910.002
MDD-15.35%-24.46% ± 3.15%-29.48% / -18.98%-2.890.998
月胜率+60.00%+55.38% ± 3.09%+50.00% / +60.00%+1.500.067

近 4 年

指标combo_eqrandom 均值 ± stdrandom p5 / p95z-scorep-value (单侧)
CAGR+21.85%+15.53% ± 2.53%+11.57% / +19.50%+2.510.006
Sharpe1.190.83 ± 0.110.64 / 1.02+3.20<0.001
MDD-15.35%-24.38% ± 3.08%-30.00% / -19.50%-2.930.998
月胜率+62.50%+57.73% ± 3.43%+52.08% / +62.60%+1.390.082

判读

核心数字 (CAGR z-score):

  • 全样本: +1.75
  • OOS: +2.53 ← 最关键, 这是 strategy 见过历史外数据的表现
  • 近 4 年: +2.51 ← 信任资本敏感期

判定: ✅ 接受: combo_eq alpha 在 OOS 段显著, 且近 4 年仍有正向偏离. SQTS C2 可继续作为 candidate strategy 使用. 但仍需控仓位+追踪.

方法学说明

  • N=300: random baseline 数量, 标准误 ≈ 5.77% (越大越稳, 但收益递减)
  • 同池同规模: random baseline 不是从全市场随机抽, 而是 同 5 行业 + 同 circ_mv top 30 池子内 随机选 10 股, 严格控制 size/sector beta
  • rng_seed 隔离: 每个 random seed 独立 rng, 300 个独立路径, 避免 random walk 相关性
  • PIT 安全: ROE 用 ann_date 而非 end_date, 不引入未来函数
  • 复合基准: 此处 z-score 是 vs 绝对收益, 即 combo_eq 直接对照同池 random pick. IR 维度 (vs 复合基准 60% HS300+40% 国债) 未计算, 留作下一篇研究

代码 + 数据复现

  • 数据湖: t6:/data_n008/datalake/sqts/parquet/ (15 datasets, 5598 万行)
  • 算法源: SQTS scripts/phase5_factor_alpha.py + scripts/zscore_validation.py
  • 复现命令: ZSCORE_N_SEEDS=300 python scripts/zscore_validation.py

(本文由 t6 数据湖 + SQTS phase5 因子框架自动生成。复盘日期: 2026-05-08)

← 返回首页 — czapple —