2.1 实证研究“黄金标准”:投资组合排序法与Fama-MacBeth回归
2.1 实证研究“黄金标准”:投资组合排序法与Fama-MacBeth回归一、引言:从直觉到证据的科学验证在产生一个因子想法(如“低估值股票未来收益更高”)后,我们必须用标准、严谨的方法进行实证检验。本节介绍学术界与顶级机构公认的两种“黄金标准”方法:投资组合排序法 和 Fama-MacBeth回归。它们是因子研究的基石,能有效避免数据挖掘偏差,并提供直观且稳健的经济学证据。核心目标:科学地回答——“这个因子真的能预测未来收益吗?”二、方法一:投资组合排序法1. 核心思想模拟一个最直观的投资决策过程:“根据因子值高低对股票排序,买入高的组,卖出低的组,看这个多空组合能否赚钱。”它直接检验因子的单调性和经济显著性。2. 标准操作流程(以月频调仓为例)第t月末:确定股票池:剔除ST、*ST、上市不足N月、停牌等股票(根据研究设计)。计算因子值:使用截至t月末的已知信息(严防前视偏差!)计算每只股票的因子值(如BP=1/市净率)。分组:按因子值从高到低排序,通常分为10组(十分位)或5组(五分位)。关键:可使用市值加权或等权方式构建组合。等权更能检验纯因子效应,而市值加权更接近实际可投资组合(这里指大资金,小资金使用等权方式构建组合即可)。第t+1月:持有收益:计算每个分组在t+1月的整体收益率(按构建时的权重计算)。构建多空组合:做多Top组(因子值最高),做空Bottom组(因子值最低)。多空组合的收益率 = Top组收益率 - Bottom组收益率。这个收益率可视为因子模拟组合的收益率。时间序列:在样本期内的每个月末重复步骤1-5,得到每个分组以及多空组合的月度收益率时间序列。3. 结果分析与经济解读分组收益曲线:绘制各分组的平均收益(或累计净值曲线)。观察是否存在单调递增/递减关系。这是因子有效性的直观视觉证据。多空组合统计:对多空组合的收益率序列计算关键统计量:年化收益率:因子带来的预期收益。年化波动率/夏普比率:风险调整后收益。最大回撤:策略可能承受的最大损失。胜率:月收益率为正的月份占比。t统计量注① ^{注①}注①:检验多空组合的平均收益是否显著不为0。通常|t-stat| 2视为在5%水平下显著。这是统计显著性的核心标准。4. 方法优势与局限优势:直观、易于理解、直接模拟交易、能检验单调性。局限:未控制其他变量:如果“估值”因子和“规模”因子高度相关,那么估值分组的收益差异可能部分来源于规模效应。分组粗糙:分组损失了部分信息(组内股票被视为同质)。三、方法二:Fama-MacBeth回归1. 核心思想在每个时间截面上,用股票的因子暴露(特征)去横截面地解释其下一期的收益率,从而得到该期因子的“价格”。然后,在时间序列上检验这些因子“价格”的平均值是否显著不为零。它能同时控制多个变量,分离出因子的独立贡献。2. 标准两步流程第一步:横截面回归在每个时间点t(如每月末),运行一次横截面回归:R i , t + 1 = γ 0 , t + γ 1 , t ∗ F 1 , i , t + γ 2 , t ∗ F 2 , i , t + . . . + γ K , t ∗ F K , i , t + ε i , t R_{i, t+1} = γ_{0, t} + γ_{1, t} * F_{1, i, t} + γ_{2, t} * F_{2, i, t} + ... + γ_{K, t} * F_{K, i, t} + ε_{i, t}Ri,t+1=γ0,t+γ1,t∗F1,i,t+γ2,t∗F2,i,t