• QQ空间
  • 回复
  • 收藏

【宽客研报】剔除行业、风格因素后的大类因子检验

gyshssl 数据策略 2019-8-21 13:14 130535人围观

研究结论
 A 股呈现明显的市值效应和行业效应,不少选股因子的 alpha 也大部分来源于此。如果采用因子的原始数据和股票收益率做相关性检验,选出的股票会明显受到市场风格因素的影响,我们有必要从因子原始数据中剥离这些因素,检验因子是否能贡献行业、风格因素之外的 alpha,本报告用新的方法对估值、成长、技术、风险四类因子过去十年的表现重新做了检验总结,并综合给出了最新的推荐选股因子。
 估值类因子能够稳定地提供超额收益,但是高估值股票的负 alpha 普遍要比低估值股票的正 alpha 更为显著,呈现出明显的不对称超额收益,在 A 股市场缺乏有效的个股做空机制的情况下,难以充分获得估值类因子的 alpha
 成长类因子在财务因子中表现最为优异,即使在剔行业和市值的影响以后,成长类因子仍然表现不俗,季度净利润同比增长因子的多空组合夏普比率高达 1.82. 我们同时发现利用总量指标计算的成长因子比利用每股指标计算的成长因子更加适合 A 股市场,并且高成长股票的正 alpha 普遍要比低成长股票的负 alpha 更为显著,使得成长类因子的 alpha 更加容易被获取。
 技术类因子中反转因子和换手率因子在剔除市值和 Beta 影响后,对收益仍然具有很强的预测能力,月均 Rank IC 超过 7%。但是技术因子整体波动较大,换手率高,多空组合的月度最大回撤也普遍较大。这说明技术类指标不适合作为独立的选股指标,应当与其他更为稳健的因子结合使用。
 风险因子中,市值、流动性风险和特质风险因子表现突出。市值因子 Rank IC中位数超过 0.1,但也具有十足杀伤力,波动幅度大,多空组合最大回撤高达 25%。流动性风险因子具有独立于市值效应之外的收益预测能力,并且表现稳健,多空组合夏普比率达高 2.13。捕捉股票投机行为的特质风险因子普遍表现稳健,其中特异度因子最为优异,多空组合夏普比高达 2.62,最大回撤 5%.
风险提示
量化模型结论为统计上的概率事件,并不保证百分之百能获利;
模型有失效的风险;
yb19082101.png

目录
因子显著性检验的方法
估值类因子
成长类因子
技术类因子
风险类因子
总结
风险提示
参考文献
因子显著性检验的方法
因子有效性检验的时间区间为 2006 年 6 月 30 日到 2015 年 12 月 31 日,为了检验因子的显著性,我们主要考察如下指标:因子 Rank IC、Rank IC 的 t 统计量、IR、IC 正显著比例、IC 负显著比例、多空组合收益率、多空组合年化波动率、多空组合夏普比以及多空组合最大回撤等绩效指标,各项指标具体的计算方式可以参考我们之前关于单因子有效性检验的报告。按照因子内在的经济逻辑和构建方法,我们将对估值类、成长类、技术类和风险类因子风别进行因子显著性检验。
因子显著性检验的细节如下:
  • 因子检验时间区间为 2006 年 6 月 30 日到 2015 年 12 月 31 日
  • 利用每个月末的中证全指的成分股作为回测的样本空间,避免公司退市带来的生存偏误(survivor ship bias)
  • 对于原始因子值,我们首先采取中位数去极值的方法调整异常值,将原始因子值调整到 3 倍绝对偏离中位数的范围内,然后进行横截面正态标准化处理得到标准化 z-score。
  • 行业中性处理是将标准化 z-score 对行业虚拟变量回归的方法,取回归的残差作为因子值,行业划分采用申万一级行业。风格中性处理则是将标准化 z-score 对市值对数和 beta 进行回归,取回归的残差作为因子值。
  • 对于财务类因子(估值、成长类),我们首先对原始因子值做行业中性化处理,然后作风格中性处理,剔除行业,beta, 市值的影响。
  • 对于技术类因子和部分风险类因子,我们对因子作风格中性处理,剔除 beta 和市值的影响。
  • 组合每个月末进行调仓,利用下个月的收益计算相关绩效指标。
  • 构建组合时,剔除样本空间内的停牌股票,然后按照因子值分为 5 组,构建 5 个等权组合。基准为中证全指的等权组合。
估值类因子
低估值股票具备更高的安全边际和预期收益,个股估值水平的高低可以用市盈率、市净率、市现率、市销率等指标度量, 但这些指标并非一直都有效,需用统计方法在这些指标中动态筛选,此项得分高的股票具备更好的估值优势。我们检验的估值类指标包括:

yb19082102.pngyb19082103.png

首先从表 2 可以看出,估值类因子的在 A 股市场能够持续地提供超额收益,所有因子的 Rank IC的 t 统计量都大于 4,结合图 1 的信息,我们可以得出如下结论:
  • BP_LF 因子的 Rank IC 平均值和中位值在估值类因子中都排在首位,说明该因子对收益具有较强的预测能力。但是 BP_LF 因子的 IR 相对较低,从箱型图上也可以看出,BP_LF 的 RankIC 分别范围是所有估值因子中最广的,这说明 BP_LF 具有较为明显的风险因子特征。
  • 在 EP 类因子中,采用分析师预测净利润的 EP_FY1 和 EP_Fwd12M 因子要比采用历史净利润的 EP_TTM 和 EP2_TTM 因子具有更高的平均 IC 和更低的 IC 波动率,表现为更高的 IR。这说明在国内市场,分析师预测的净利润的确包含了对未来估值预期的前瞻性信息,并且这些预期在短期内还没有完全反映到股价上。进一步对比 EP_FY1 和 EP_Fwd12M 因子,我们发现 EP_Fwd12M 因子的各项指标均优于 EP_FY1 因子,这说明在综合 FY1 和 FY2 的预测净利润信息比仅采用 FY1 的预测净利润信息能够更加充分反映未来 12 个月的估值预期,
  • 估值类因子中最为稳定的则是 CFP_TTM 因子,其 IR 高达 0.61,从箱图上来看其 Rank IC 的分布也最为集中,但是其 Rank IC 的均值相对较低,说明现金流对未来收益的预测能力并不十分强,但是现金流相对于收入和净利润更为稳定,不容易受到上市公司的操纵。
  • 采用历史财务数据计算的因子覆盖度普遍较高,除历史股息率因子外其他均在 95%以上。分析师预测的净利润数据覆盖率在 75%左右。而分析师预测的股息数据对样本空间的覆盖率较低,仅在 30%左右。

表 3 展示了估值类因子多空组合(做多等权 Top 组合,做空等权 Bottom 组合)的各项绩效指标。我们可以看到因子多空组合的表现同 Rank IC 表现相对一致。EP_Fwd12M 因子表现优异,夏普比率超过 1. 另外由于财报公布频率较低,估值类因子的换手率普遍较低,Top 组合单边换手率均在 20%左右。yb19082104.pngyb19082105.png

表 4 则展示了估值类因子分组组合相对全市场等权组合的超额收益及超额收益的 t 统计量。我们将表中 95%显著性水平的 t 统计量予以绿色高亮标注( t>1.65 或 t<-1.65). 综合考察分组超额收益的单调性和每个分组超额收益的显著程度。从表 4 可以看出,估值类因子 Bottom 组合的负 alpha 普遍要比 Top 组合的正 alpha 较为显著,这可能与 A 股市场缺乏有效的个股做空机制有关,综合来看,10 个估值类因子中有 2 个因子能够同时在 Top 和 Bottom 组合提供显著的超额收益,它们分别是 CFP_TTM 和 EBIT2EV. 其中表现最为优异的是 EBIT2EV,它在 Top 端和 Bottom 端的 2 个分组都能提供显著的超额收益, BP_LF 因子在 Top 组合的超额收益也相对较高,但是 t 统计量略低,仅在 90%显著性水平上显著不等于 0.

yb19082106.png

最后,我们关心这些不同的估值因子之间的相互关系。这里我们考察的是不同因子历史 Rank IC的时间序列线性相关系数。相比于因子值之间的秩相关系数,IC 相关系数能够提供如下的信息:当基于净利润的估值因子能够获得正的超额收益时,基于股息率或者净资产的估值因子能否也获得正的超额收益。这是构建多因子模型时我们最为关注的因素。较低的 IC 相关系数表明,在一类因子表现不佳时,另一类因子仍然能够获得正的超额收益,这样可以大幅提高多因子模型的稳定程度。
通过表 5 可以看出,采用分析师预测数据计算的因子和采用对应历史数据计算的因子相关性较高,如EP_TTM 因子和 EP_FY1、EP_Fwd12M,EBIT2EV 因子 IC 相关系数都在 0.9 左右, BP_LF因子和基于利润的估值因子相关性普遍较低,均在 0.3 以下。另一方面,BP_LF 因子和基于收入、股息或现金流的估值因子相关性普遍较高,均在 0.5 以上。这说明结合 BP_LF 因子和 EBIT2EV因子能够获得较好的分散效果。
yb19082107.png
成长类因子
高成长性的股票更容易获得市场溢价,个股成长性得分根据上市公司收入增长率、利润增长率等财务指标,结合公司营运能力分析综合计算而得。我们检验的估值类指标包括:
yb190821008.png
yb19082109.pngyb19082110.png

从表 7 可以看出,成长类因子表现普遍较好,其中净利润同比增长率和 PEG 的 IR 都超过 0.6。净资产增长率则表现最差。结合图 2 和表 8 的信息,我们可以得出以下结论:
  • ProfitGrowth_YOY因子和EPS1Ygrowth_YOY因子捕捉的都是公司净利润的短期历史增长情况,唯一的区别是 ProfitGrowth_YOY 计算的是总量的增长,而 EPS1Ygrowth_YOY 计算的是每股收益的增长,但是从表 7 和图 2 可以看出,ProfitGrowth_YOY 因子在各方面明显优于EPS1Ygrowth_YOY 因子。正常来说,每股净利润增长率更能合理地反映公司的成长性,因为公司增发后现金流量和净利润会自然增加,但是这与公司的成长性不一定有直接关系。我国股市存在较为特殊的情况,高成长的上市公司经常会送转股份,送转股份导致每股收益被摊薄,进而使得每股收益的增长率并不能反映真实的成长性,所以总量增长指标比每股增长指标更加适合目前的中国市场情况。
  • PEG 因子则结合了公司的估值水平和未来的预期增长率,也取得非常不错的表现,其因子Rank IC 高达 0.66,多空组合夏普比率高达 1.48。由于计算 PEG 时需要剔除 PE 为负数的公司,同时采用了分析师预测的未来年化复合增长率,使得该因子的覆盖率相对较低,为 75%
  • CFP_TTM 因子较为稳定,从箱图上来看其 Rank IC 的分布也最为集中,但是其 Rank IC 的均值仅为1.4%,说明现金流的增长虽然相对稳定,但是对未来收益的预测能力较弱,
  • 成长类因子与估值类因子相类似,换手率普遍较低,Top 组合的月均换手率都在 20%左右。与估值因子不同的是,成长类因子 Top组合的正 alpha普遍要比 Bottom组合的负alpha更为显著,综合来看,除EquityGrowth_YOY 因子外,其他成长类因子都能够同时在 Top 和 Bottom 组合提供显著的超额收益,其中表现最为优异的是 ProfitGrowth_YOY,它在 Top 端和 Bottom 端的 4 个分组都能提供显著的超额收益,并且 Top 分组超额收益的均值和 t 统计量都表现优异,而EPS1Ygrowth_YOY 因子虽然在 Top 分组的超额收益较高,但是整体缺乏单调性,而且超额收益的显著性也不敌 ProfitGrowth_YOY 因子。

值得思考的是净资产增长率因子 EquityGrowth_YOY在 Top 和 Bottom端都表现为负的超额收益,而在第 3 组表现为显著的正超额收益,呈现出明显的非线性特征。这种现象并非中国所独有,它同公司治理中的代理问题(agency problem)相关。具体而言,EquityGrowth_YOY 因子的 Top 组合代表的则是净资产扩张速度非常快的公司,管理层通常能够从规模过度扩张中获得更大的权威感和经济利益,然而这可能损害股东权益,使公司背上沉重的债务,造成经营困难。反过来,公司如果投资不足也会使公司丧失行业竞争优势和未来的成长潜力,这同样也会损害股东权益。这就反映在Bottom 组合也表现为负的超额收益。而最好的那些公司则处于这两个极端的中间,它们的净资产扩张相对稳健。但是如何持续稳定地捕捉这些公司不是一件容易的事情,目前有一些处理方法可以在一定程度上解决非线性的问题,具体可以参考 Qian,E, Hua,R., and Eric.S. (2007).
yb19082111.pngyb19082112.pngyb19082113.png
最后,通过表 5 可以看出,成长类因子之间相关性最高的 SalesGrowth_YOY 和 ProfitGrowth_YOY因子,高达 0.827. 因为公司的净利润增长同营业收入增长通常是高度正相关的。其他成长类因子相关性则普遍较低。综合考虑,结合 ProfitGrowth_YOY 因子和 PEG 因子能够在获取较高的超额收益的同时取得较好的分散效果。
技术类因子
个股技术形态反映了资金强弱、市场情绪高低等公司价值之外的信息,直接影响二级市场投资收益。该指标根据一些技术因子指标,如:换手率、反转因子等,定量描述个股在技术形态上的强弱。从我们之前的研究可以得知,技术类指标普遍有风格倾向,比如小盘股比大盘股更容易反转,而大盘股比小盘股的换手率通常更低,因此我们对技术类因子作了风格中性处理,剔除市值和 beta 对因子的影响。我们检验的技术类指标包括:

yb19082114.png

从表 12 可以看到,技术类因子表现非常突出,所有因子的 Rank IC 都在 7%以上,换手率因子 TO的 IR 超过 0.7。而另一方面,众多研究已证明我国市场不存在显著的中长期动量效应,如高秋民,胡聪慧,燕翔(2014)。 这说明我国市场上投资者倾向于对各种利好和利空消息作出过度反应,并且普遍存在追涨杀跌心理,导致股票经常出现超买和超卖的现象,而反转因子捕捉的就是股价最终回归其基本价值过程中的收益。
但是需要注意的是,技术类因子整体波动较大,表现为 Rank IC 的分布较为分散,同时多空组合的月度最大回撤也普遍较大。这说明技术类指标不适合作为独立的选股指标,应当与其他更为稳健且的因子结合使用。
yb19082116.png

yb19082123.png
从表 13 可以看出,技术类因子 Bottom 组合的负 alpha 普遍要比 Top 组合的正 alpha 更为显著,综合来看,几乎所有技术类因子都能够同时在 Top 和 Bottom 组合提供显著的超额收益,换手率因子 TO 在 Top 端表现最为优异,月度超额收益达到 9.6%,t 统计量超过 4. 而在几个反转指标中,PPReversal 因子具有更好的单调性和更高的正端超额收益。PPReversal 因子是我们结合成交价格和成交量构造的历史持仓成本偏离度指标,该指标值越低,表示短期均价相对于长期均价越低;当该指标值过低时,我们认为出现了“超跌”,股价短期出现反转的概率较高。具体可以参考我们之前的相关报告。
另外由于计算技术指标的价格和成交量更新频率高,使得技术类因子的 Top组合换手率非常之高,Ret1M 因子的 Top 组合月均换手率高达 83%。虽然 Ret1M 比 Ret3M 因子的多空组合年化收益率稍高,但是代价是换手率增加了 29%,在扣除实际交易成本后,Ret1M 因子的收益率会受到较大影响。这也提醒我们在构建多因子模型时,应当适当控制这类高换手率因子的权重。

yb19082118.pngyb19082119.png

最后,从表 15 可以看出,各个反转因子之间的相关系数普遍较高,均在 0.6 到 0.9 之间。但是换手率因子同其他技术类因子相关性普遍较低,均在 0.4 以下。另外,经过风格中性处理以后,各技术类因子同市值因子的 IC 相关系数都非常低,全部都在 0.3 以下,说明处理后的技术类因子对市值没有明显的偏好, 提供了独立于市值效应之外的超额收益,综合来看,结合 PPRevesal 和 TO因子是较优的选择,
风险类因子
风险类因子则涵盖了不同的风险类型,包括:财务风险,流动性风险,市场风险,特质风险等。我们检验了如下的风险类指标:

yb19082120.pngyb19082121.png
从表 17 可以看出,风险类因子的总体表现非常抢眼,特质波动率和特异度的 Rank IC 超过 9%,特异度因子的 IR 更是超过 1,结合图 4 和表 18, 我们可以得出以下结论:
  • 市值因子 MV 和流通市值因子 FFMV 的 Rank IC 都超过 7%,显示出了非常强的收益预测能力。同时负显著率明显高于正显著率,这也说明小盘股票在大部分时候都跑赢了大盘股。但是市值因子呈现出非常大的波动性,从图 4 中可以看出,MV 因子 Rank IC 的左边缘一直延续到了-0.4,右边缘延续到了 0.5. 这说明虽然小盘股在多数时候跑赢大盘股,但是偶尔一些时候小盘股显著跑输大盘股,并且有着相当大的负超额收益。这从表 18 中市值因子多空组合的最大回撤也能体现出来,MV 和 FFMV 的多空组合最大回撤均高达 25%,在所有风险类因子中居于榜首。
  • 基于流动性冲击指标的 ILLIQ 因子表现优异,其 Rank IC 超过 6%,IR 值超过 0.7. 更难得的是 ILLIQ 因子非常稳定,其 Rank IC 分布在所有风险因子中最为集中。基于 ILLIQ 因子的多空组合最大回撤仅 7%,夏普比率高达 2.13. 通常来说,流动性指标同市值高度相关,小市值的股票流动性要显著低于大市值股票。而 ILLIQ 因子在剔除了市值影响后还能够获得显著的超额收益,说明流动性风险有着独立于市值效应之外的收益预测能力,也说明低流动性的股票需要更高的风险溢价来补偿。但是需要注意的是由于 ILLIQ 因子 TOP 组合股票普遍流动性较差,当组合资产规模较大时,ILLIQ 因子不一定是合适的选择。
  • 基于 CAPM 或者 Fama Frech 三因子模型的特质波动率和特异度因子表现十分抢眼,其中特异度因子 IRFF 表现最为稳健,IR 值高达 1.04,多空组合月度胜率高达 83%,而月度最大回撤仅为 5%。特异度因子 IRFF 和特质波动率因子 IVRFF 类似,都是利用 Fama Frech 三因子模型进行回归得到,区别是 IVRFF 是回归的残差波动率,而 IRFF 是回归的残差平方和(SSR)与总偏差平方和(SST)之比。IRFF 在 IVRFF 的基础上剔除了不同个股自身波动率水平不同带来的影响,能够更加直接反映出个股收益率脱离市场风格的程度,也就是被投机的程度。详细介绍可以参考我们之前的报告“投机,交易行为与股票收益(上)”。


yb19082122.pngyb19082123.png
风险类因子中 FFMV, MV, ILLIQ, IVRFF 和 IRFF 这 5 个因子都能够同时在 Top 端和 Bottom 端提供显著的超额收益。IVRFF 因子表现最为优异,在 TOP 端和 Bottom 端 4 个分组均能提供显著的超额收益,而且 Top 组合的超额收益高达 12.4%,t 统计量高达 6.43。


yb19082124.png

最后,从表 20 可以看出,市值因子和其他风险因子相关性普遍较低,ILLIQ,Beta,IVRCAPM,IVRFF 因子都与市值因子呈现出了负相关,说明它们与市值因子结合可以实现显著的分散效应,提升多因子模型的稳定性。综合考虑因子的显著性水平和相关性,推荐采用 MV, ILLIQ 和 IRFF 三个因子。

yb19082125.png
总结
综合考察四类因子过去十年的表现,我们推荐以下 9 个选股因子:
yb19082126.png

这些因子均通过了历史较长时间严格的显著性检验,并且具合理的经济逻辑。因子之间具有较低的相关性,能够带来显著的分散效应。但是有几点需要注意:
  • 本文实证检验采用的样本空间为中证全指,包括了市场所有风格的股票。而同样的因子在不同的样本空间(如大盘股和小盘股,价值股和成长股)内表现通常会有显著性的区别。因此针对不同的投资标的,可以在相对应的样本空间内采取同样的检验方法,
  • 本文检验因子时没有考虑到交易成本和流动性的问题,当资金规模较大时,换手率较高的因子(如PPReversal)和流动性较差的因子(如 MV、ILLIQ)会导致较高的交易成本,使得组合难以获得因子提供的超额收益。
  • 历史的情况不能完全代表未来,当市场结构、规则和政策等因素发生变化时,因子的有效性也会受到影响,因此定期的重复检验和调整也是有必要的。

风险提示
  • 个股各项得分与股票未来收益的正相关性是基于全市场股票大样本数据的统计分析,是一个整体性的大概率结论,并不百分百保证得分高的股票未来一定获利。
  • 量化模型基于历史数据分析而得,存在模型失效的风险,市场极端行情和黑天鹅事件也可能对模型效果造成较大冲击;股市有风险,投资须谨慎!
参考文献
Grinblatt, Mark and Bing Han. 2005. “Prospect Theory, Mental Accounting, andMomentum." Journal of financial economics 78(2):311-339.
Qian,E, Hua,R., and Eric.S. 2007. Quantitative Equity Portfolio Management:Modern Techniques and Applications
高秋明,胡聪慧,燕翔. 中国 A 股市场动量效应的特征和形成机理研究[J]. 财经研究,2014,(40): 107-118.
作者:东方证券金工团队

yb19082111.png
yb19082112.png
yb190821008.png

路过

雷人

握手

鲜花

鸡蛋
原作者: 量子量化

财经媒体撰稿人,自由投资者

关注微信