【量化研报】选股因子系列研究十六——选股因子空头收...

4
回复
4685
查看
[复制链接]

209

主题

26

回帖

1424

积分

超级版主

积分
1424
来源: 2019-7-31 06:22:52 显示全部楼层 |阅读模式
宽客之家研报名称:《选股因子系列研究十六——选股因子空头收益的转化》

宽客之家研报作者:海通证券 高道德 袁林青

近年来,随着投资者对于因子选股体系研究的深入,越来越多的选股因子出现在大家的视线中。在对于选股因子进行总结以及探究的过程中,我们发现很多选股因子具有极强的空头效应。考虑到A 股市场做空的限制,选股因子空头收益的获取成为了值得研究的问题。

宽客之家A股多数选股因子具有较强的空头效应。除了极少数强势选股因子外(如市值、成交金额),多数选股因子空头收益更加明显。在 IC超过0.07的选股因子中,多数选股因子空头收益占比极高。如1 个月反转、3个月反转、日均成交金额、异质波动率等因子其空头收益占比皆高于 70%。

单因子的情况下,逆向剔除的方法能够较好的转化因子的空头收益。考虑到空头收益较强的因子其多头组合并无法明显跑赢市场平均水平但可通过它规避明显跑输市场平均水平的标的,所以可通过逆向剔除的方式利用空头因子的空头收益。根据模拟抽样的结果,因子逆向剔除随机组合收益分位数分布相对于全市场随机组合收益分位数分布更为右偏。换句话说,在因子逆向剔除后的选股范围内选股将更加有可能得到较好的收益表现(较高的收益分位数)。

多因子模型中,复合因子ICIR的分析框架有助于分析因子收益的转化。可将多 因子打分的选股系统看作是复合因子选股系统,而复合因子单期 IC 可表述为:



当因子截面值协方差恒定时,复合因子的 IR 则可表述为:



从上述公式可知,因子在多因子模型中的收益转化不仅仅取决于因子本身的选股能力,还取决于因子间的IC协方差以及各因子的权重。

正交因子能够极好地满足模型假设,同时也能有效剔除合成型选股因子。因子间的截面协方差会随着时间的变动而有所波动。若想基于ICIR的分析框架去理解以及构建多因子模型,需要对于因子进行正交处理,使其满足截面协方差恒定这一模型前提要求。本文推荐使用逐步回归的方式进行处理。此外,正交因子将有 效剔除合成型选股因子。

风险提示。市场系统性风险、资产流动性风险以及政策变动风险会对策略表现产生较大影响。

近年来,随着投资者对于因子选股体系研究的深入,越来越多的选股因子出现在大家的视线中。在对于选股因子进行总结以及探究的过程中,我们发现很多选股因子具有极强的空头效应。考虑到A股市场做空的限制,选股因子空头收益的获取成为了值得研究的问题。

本文分别对于单因子空头收益的转化以及多因子选股中因子空头收益的转化进行了讨论。对于单因子而言,空头收益主要通过逆向剔除的方式进行转化。而在多因子模型中,因子空头收益主要通过影响股票综合打分的方式来实现。多因子下的因子收益的转 化可通过复合因子ICIR的分析框架来理解。

1. 选股因子的空头效应

简单的说,选股因子的多头效应是指选股因子选出表现优于市场平均水平的股票的能力,而空头效应是指因子选出表现劣于市场平均水平的股票的能力。选股因子的多头 效应以及空头效应合在一起形成了因子的多空效应。在对于经典的选股因子进行回测时常常能发现很多因子多空收益明显,但是多空收益更多是来自于空头收益。也就是说,这些因子能够选出未来表现明显低于市场平均收益的股票,但无法选出明显跑赢市场平均水平的股票。不妨以市值和1个月反转为例对于因子的多头收益以及空头收益进行说明。

从2006年以来,可在每月月初对于市场上所有可交易股票以其总市值(前1个月涨幅)进行排序并从小到大分成10组并统计随后一个月各组股票相对于市场所有股票平均收益的超额收益。各分组收益情况详见下图。



不难发现,两因子都具有较强的多空收益,市值因子月度的多空收益达2.87%,而反转因子的月度多空收益达2.19%。虽然两因子多空收益较强,但因子的多头效应和空头效应却各有不同。对于多头端,市值最小的一组股票在月度上跑赢市场平均收益1.66%,而前期涨幅最小的一组股票仅能跑赢0.49%,相比而言市值因子多头效应更强,更能够选出表现优于市场平均水平的股票。对于空头端,市值最大的一组股票月度上跑输市场平均1.21%,而涨幅最大的一组股票月度上跑输市场平均1.71%,相比而言反转因子空头效应更强。对于上述两个因子,反转因子空头收益占多空收益的78%,而市值因子空头收益仅占多空收益的42%。

由于A股存在做空方面的限制,投资者可做多因子多头组合股票获取因子多头收益,但选股因子的空头收益很难通过组合构建直接获得。此外,对于多空收益中空头收益占比较高的因子(例如反转因子),其多头组合很难获得明显的超额收益。下图给出了从 2006年以来,月度换仓的市值多头组合以及1个月反转多头组合相对于市场等权组合的相对强弱指数。



通过简单对比可以看到,反转因子虽然具有较明显的多空收益,但是由于多头效应较弱以及组合换手较高的因素导致组合很难明显跑赢市场等权组合。从单因子的角度来看,这种现象并不少见。在众多常见的选股因子中,多数选股因子空头效应偏强。下文图表就对于月度换仓下部分选股因子的多头收益以及空头收益情况进行了总结。



观察上图不难发现,除了极少数强势选股因子外(如,市值、成交金额),多数选股因子空头收益更加明显。下表对于上述选股因子的多头收益、空头收益、IC、IR进行了更加详细的统计。观察下表也可以发现,在IC超过0.07的选股因子中,多数选股因子空头收益占比极高。如1个月反转、3个月反转、日均成交金额、异质波动率等因子其空头收益占比皆高于70%。总体上来看,A股市场中多数选股因子具有较强的空头效应。



2. 单因子空头收益的转化

在上一节中,我们发现A股市场中多数选股因子空头收益较强,而简单做多空头因子的多头组合并无法得到较好的选股效果所以空头收益的转化尤为重要。本节将重点讨论单因子空头收益的转化。考虑到空头收益较强的因子其多头组合并无法明显跑赢市场 平均水平但可通过它规避明显跑输市场平均的标的,所以可通过逆向剔除的方式利用空头因子的空头收益。

接下来,我们将通过模拟抽样的方式对于逆向剔除法的效果进行展示。在月度换仓的框架下,对于某因子,在每个调仓日:

1)从全市场所有可交易的股票中随机选出10%的股票构建等权组合并计算该组合在后一个月的收益分位数(即计算该组合收益能够跑赢同期市场上百分之多少的股票),重复上述抽样1万次;

2)使用因子对于市场上所有可交易的股票排序并剔除空头端的股票(以反转为例,剔除涨幅排序6~10组的股票);

3)在上述选股范围内随机选出10%的股票构建等权组合并计算该组合在后一个月的收益分位数,重复上述抽样1万次。

通过上述模拟抽样可得全市场随机组合的收益分位数分布以及因子逆向剔除后随机选股组合的收益分位数分布。下图展示了全市场随机等权组合收益分位数分布情况以及市值、反转、换手率、PB、残差波动率因子逆向剔除随机等权组合收益分位数分布情况。感兴趣的投资者可使用相同方法对于其余选股因子进行类似模拟抽样。



观察上图可知,因子逆向剔除随机组合收益分位数分布相对于全市场随机组合收益分位数分布更为右偏。换句话说,在因子逆向剔除后的选股范围内选股将更加有可能得到较好的收益表现(较高的收益分位数)。当然,也可以对于随机组合的年化收益进行统计。下图展示了上述随机选股组合的年化收益分布。



上图中的虚线给出了各因子多头等权组合的收益,对于全市场组合而言,其虚线给出的是全市场等权组合的年化收益。通过观察上述分布可知,各因子逆向剔除随机等权组合能够大概率战胜全市场随机等权组合。此外,对于个别因子(如换手率因子),其多头等权组合仅能小概率战胜逆向剔除随机等权组合。

对于市值加权组合,我们可以得到类似的结论。下图展示了市值加权随机组合的收益分位数分布情况。虽然市值加权随机组合整体收益较等权随机等权组合有明显下降,但是依旧可以看到在各因子逆向剔除后的选股范围内选股能够得到更好的组合表现。



总而言之,从单因子的角度来看,可通过逆向剔除的方式对于因子的空头收益进行利用。通过模拟抽样可以发现,在逆向剔除后的选股范围中选股能够获得更好的组合收益表现。

3. 多因子模型中因子空头收益的转化

对于单因子而言,因子的空头收益可通过逆向剔除的方式来进行转化。在多因子选股模型中,因子空头收益,甚至多空收益,都是通过综合打分的形式来进行转化的。对于某一因子空头组的股票,该股票在这一因子上的得分会较低,从而影响其整体得分。 通过选取得分较高的股票,模型实现了因子收益的转化。

然而多因子模型中因子空头收益转化取决于多方面的因素,并不是所有具有空头收益的选股因子在加入到模型中就能对于组合最终表现产生提升的。现以市值、反转、换手率、成交金额为例进行简单展示。

在月度选股框架下,可使用市值因子、1个月反转因子、1 个月日均换手率因子以及1个月日均成交金额因子构建以下四个选股组合;1)市值单因子组合;2)市值、换手率等权因子组合;3)市值、换手率、反转等权因子组合;4)市值、换手率、反转、成交金额等权因子组合。下表展示了上述四个组合与市场等权组合的相对强弱情况。



下表对于不同组合的年化超额收益、最大回撤、收益回撤比、信息比率以及月度胜率进行了统计。



不难发现,虽然上述因子从单因子来看都有着十分显著的多空收益,但是随着因子的增多,组合的收益或者信息比并未出现持续上升。市值因子在加上换手率因子后,组合年化收益略有降低,但是回撤出现了极大的改善,信息比稍有降低。在加上反转因子后,收益、回撤以及信息比率皆出现了十分明显的改善。然而,在加入成交额因子后,组合各方面指标反而出现了下降。

通过上述例子,可以看到简单的因子叠加并不能有效地转化因子的空头收益。即使从单因子来看具有显著空头收益的因子,放入到多因子模型中时也可能对于组合的提升毫无帮助。在此我们引入《Quantitative Equity Portfolio Management》中选股因子的ICIR分析框架,希望通过这一框架对于多因子模型下因子空头收益甚至多空收益的转化进行系统的分析。

假设多因子模型中共有k个选股因子,对于任意股票i,因子j的因子值为,所以股票i的综合打分为:



其中,wj为因子j的权重,且w1 + w2 + ··· + wk = 1。需要注意的是,此处使用的因子值全都是经过去极值以及标准化处理过的。

在分析时,我们实际上可将这 k 个因子看做是一个复合因子,复合因子对于每个股票的打分为fi。那么复合因子单期的IC可被表述为:



其中,w为因子权重向量,IC为因子IC向量,Σ为因子值截面协方差矩阵。基于上式,复合因子的单期IC实际取决于各成分因子IC、因子截面值的协方差以及各因子的权重。当然,在多因子模型中,投资者最终关注的不仅仅是复合因子的单期IC还有复合因子在多期上的IR,



若因子截面值的协方差在不同时点保持不变,则可将复合因子的IC的表达式进行进一步的简化,(其中,τ为常数)



对于复合因子的 IR 则有:



其中<span tabindex="0" class="MathJax" id="MathJax-Element-1-Frame" style="padding: 0px; margin: 0px; display: inline; font-style: normal; font-weight: normal; line-height: normal; font-size: 16px; text-indent: 0px; text-align: left; text-transform: none; letter-spacing: normal; word-spacing: normal; word-wrap: normal; white-space: nowrap; float: none; direction: ltr; max-width: none; max-height: none; min-width: 0px; min-height: 0px; border: 0px;" data-mathml='IC&#x00AF;'>IC¯¯¯¯¯¯IC¯为各选股因子IC的均值,而ΣIC为选股因子的IC协方差矩阵。在假定因子界面值协方差矩阵恒定的情况下,复合因子的IR最终取决于各因子的IC、因子IC的协方差以及因子的权重共同决定。所以,在多因子框架下,任意因子收益的转化取决于其因子本身的IC、与其他因子的协方差以及因子的权重。通过寻找最大化复合因子IR的因子权重w,我们可最大化地利用因子的选股能力。

当然,上述分析框架成立的最重要的前提是因子值截面协方差恒定。然而,实际应 用中,各选股因子的因子值截面协方差远非恒定。下图展示了 2006 年到 2016 年间不同 时点上市值因子与 1 个月反转因子之间的截面相关性。



通过上述例子可以看到,因子间的截面协方差会随着时间的变动而有所波动。那么,若想基于ICIR的分析框架去理解以及构建多因子模型,首先需要对于因子进行正交处理,使其满足截面协方差恒定这一模型前提要求。本文推荐使用逐步回归的方式进行处 理。具体方法如下:

1)选择某一因子i为初始因子,其正交因子值等于原始因子值;

2)对于某一因子j,其正交因子值可通过截面回归取残差的方式获得,即以其原始因子值为自变量,现有的正交因子值为因变量进行多元回归,取回归残差为该因子的正交因子值。具体回归方程如下:



其中,of1···ofk为现有的正交因子;

3)将该因子加入现有的正交因子集合中去。

通过上述方法遍历所有因子则可得到相互正交的选股因子,从而满足因子截面协方差恒定的先决条件。通过正交的处理,我们还能够极好的规避“合成型”选股因子。所谓合成型选股因子是指在单因子回测时因子呈现出极强的选股效果,但是由于该因子是 现有因子的组合,将它引入多因子模型中时并不能带来额外的提升。成交额因子就是一个典型的“合成型”选股因子,它是市值因子与换手率因子的结合。下图展示了前文第1章中所回测的选股因子在正交后的多头收益以及空头收益情况。下图是以行业因子为原始因子,并从左往右的进行逐个正交回归。本篇报告在对于因子进行正交前并未进行降维,在后续研究报告中会对于相关内容进行讨论。



观察上图可以看到,部分选股因子的多空收益在正交后出现了较为明显的变化,3个月反转、6个月反转、成交额等因子的多空收益出现了极大的变化,而其余选股因子的多空收益也受到了不同程度的影响。下表使用2006年至2016年6月间各正交因子的月度IC序列计算了各正交因子间的IC相关性。



上表中标红的部分为IC相关性为负的因子,根据前文IR的公式,IC为正且与其他因子IC低相关或者负相关的选股因子的加入将有助于多因子组合整体选股能力的提升。

4. 总结

在对于选股因子进行研究时,空头型选股因子常常出现在大家的视线中。由于国内市场做空的限制,该类因子的实际应用存在着一定的障碍。在单因子的情况下,考虑到空头因子多头组合超额收益偏低,逆向剔除的方法能够较好地转化因子的空头收益。

而在多因的情况下,因子收益的转化相对较为复杂,因此本文引入了ICIR的分析框架。在使用正交因子时,可将综合打分的多因子模型看做是一个复合因子的选股系统,而复合因子的IR可表述为:



基于上述公式,可以发现在多因子选股模型中,因子收益的转化取决于其本身的选股能力(IC)、与其他选股因子的协方差以及因子的权重。另外,通过正交的处理也可以极好地过滤合成型的选股因子。

此外,基于复合因子IR的公式,可通过优化复合因子IR来得到最优的因子权重从而对于等权的多因子模型进行进一步的提升。对于这一部分的内容,我们将在接下来的报告中进行详细分析。

5. 风险提示

市场系统性风险、资产流动性风险以及政策变动风险会对策略表现产生较大影响。
城市-地铁.jpg
来自宽客之家





回复

使用道具 举报

34

主题

33

回帖

270

积分

中级会员

积分
270
2019-7-31 08:16:15 来自手机 显示全部楼层
在对于选股因子进行研究时,空头型选股因子常常出现在大家的视线中。由于国内市场做空的限制,该类因子的实际应用存在着一定的障碍。在单因子的情况下,考虑到空头因子多头组合超额收益偏低,逆向剔除的方法能够较好地转化因子的空头收益。
回复

使用道具 举报

196

主题

140

回帖

1444

积分

管理员

积分
1444
2019-7-31 09:01:30 显示全部楼层
回复

使用道具 举报

196

主题

140

回帖

1444

积分

管理员

积分
1444
2019-7-31 09:01:39 显示全部楼层
回复

使用道具 举报

196

主题

140

回帖

1444

积分

管理员

积分
1444
2019-7-31 09:02:13 显示全部楼层
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 免费注册
关注微信