【量化研报】价格形态选股因子

0
回复
3906
查看
[复制链接]

209

主题

26

回帖

1424

积分

超级版主

积分
1424
来源: 2019-8-1 17:07:21 显示全部楼层 |阅读模式
宽客之家研报名称: “选股因子系列研究(十八) - 价格形态选股因子”


宽客之家研报作者:海通证券冯佳睿袁林青


本文主要讨论了价格形态因子的构建与选股效果。之所以考虑构建价格形态因子是因为传统的技术因子大多使用收盘价作为计算输入值(如反转,MACD等),然而股票走势所包含的信息却远非收盘价能描述。因此我们在本报告中引入股票每日的最高价,最低价,开盘价以及成交均价对于价格形态因子进行构建,希望能够为多因子模型带来额外的选股能力。


价格形态因子具有一定的选股能力。开盘冲高,盘低回升以及均价偏离三个因子皆具有一定的选股能力,并且这三个因子在计算时间窗口为半个月的情况下具有更强的选股能力。从单因子的角度来看,各个因子空头效应较强,且在分组收益上呈现出了非线性的特征。


正交后,部分价格形态选股因子依旧具有选股能力。从正交因子的IC以及ICIR来看,半个月窗口计算的开盘冲高因子,其选股效果受到了明显影响,而盘低回升以及均价偏离因子依旧具有一定的选股能力。对于一个月窗口计算的价格形态因子,开盘冲高因子以及盘低回升因子选股效果基本消失,而均价偏离因子依旧保留了较为明显的选股效果。


从回归法来看,价格形态因子具有额外选股能力。半个月计算周期下的开盘冲高,盘低回升,均价偏离以及一个月计算周期下的均价偏离均能够为模型提供额外的选股能力,其回归系数时间序列Ť统计量绝对值皆在3以上。除了一个月计算得到的均价偏离因子外,半个月计算得到的价格形态因子的二阶项皆具有显着的额外选股能力。也即,可考虑将其二阶项引入到多因子模型中去。


从全市场TOP100组合来看,改进组合能在年化收益,收益回撤比以及信息比率上有所提升。对于半个月计算的价格形态因子,在加入了价格形态因子一阶项后,组合表现在年化收益,最大回撤,收益回撤比以及信息比率上皆有提升。在引入了二阶项后,TOP100组合表现在上述几个维度中得到了进一步的提升。对于一个月计算的均价偏离因子,在加入一阶项后模型有所改善,但是在加入二阶项后模型表现未出现提升。该结果也和前文回归法的结论相符。整体上来看,价格形态因子在引入到强势因子构成的多因子模型后对于模型年化收益的提升基本在2%〜3%左右。


在正交因子最大化单期IC的因子权重分配模型中,价格形态因子依旧能够获得10%以上的权重分配。由于“逐步正交+最大化单期IC”模型在分配权重时对于因子收益有着更高的要求,若因子无法提供额外的选股效果则无法获得明显的权重分配,所以这也从侧面说明了价格形态类因子的选股能力。


本文主要讨论了价格形态因子的构建与选股效果。之所以考虑构建价格形态因子是因为传统的技术因子大多使用收盘价作为计算输入值(如反转,MACD等),然而股票走势所包含的信息却远非收盘价能描述。因此我们在本报告中引入股票每日的最高价,最低价,开盘价以及成交均价对于价格形态因子进行构建,希望能够为多因子模型带来额外的选股能力。


本文主要分为三部分。第一部分介绍了因子的构建与计算。第二部分从单因子的角度对于因子表现进行了总结。第三部分将前文构建的价格形态因子放入到了多因子模型中并观察此类因子对于模型的提升效果。


1.不仅仅是收盘价


在计算传统的技术因子时我们常常使用收盘价作为输入变量,虽然使用收盘价计算得到的指标的确能够较好地刻画股票日间收益的特征并为模型贡献选股能力,但是在使用这些指标时我们也忽略了其他价格所包含的信息。若把股票的价格走势以ķ线的形式表达出来,不难发现股票走势中所包含的信息很难仅使用收盘价进行刻画,如ķ线的上影线,或者下影线等。


因此本报告考虑引入开盘,盘高,盘低以及均价构建相关指标刻画股票日内的形态特征本报告共引入三个指标:。开盘冲高,盘低回升以及均价偏离具体指标计算方式如下:


1)开盘冲高:log(盘高/开盘价)。该指标越大,股票盘中冲高幅度越大

.2)盘低回升:log(收盘价/盘低)。该指标越大,股票从盘低回升的幅度也就越大

.3)均价偏离:log(均价/收盘价)。该指标体现了股票成交均价相对于收盘价的偏离。


在计算因子值时,我们使用各股票在过去一段时间的指标均值。本报告将分别考察时间窗口为一个月和半个月下各因子的表现。因子计算公式见下式若遇到股票停牌,则剔除该交易日数据。若股票在计算时间窗口内超过一半的时间处于停牌状态,则取股票因子值为NAN)




2.单因子回测


。现对于前文构建的开盘冲高,盘低回升以及均价偏离的单因子选股能力进行检验在进行因子检验时按照以下规则进行:


1)使用2009年1月至2017年2月28日间的数据进行回测;

2)每月月末计算因子值,并对因子统一进行截面标准化的处理;

3)在调仓时,组合按照涨停不买,跌停不卖的规则进行;

4)调仓考虑双边千五的交易费用;

5)选股范围剔除ST股,上市不满6个月的股票。


下表统计给出了各因子的IC,ICIR以及RankIC,RankICIR。




从上表可知,各因子皆具有一定的选股能力。在使用半个月的数据计算因子时,开盘冲高以及盘低回升因子IC以及rankIC绝对值能够达到0.07且ICIR绝对值在1.5以上。均价偏离因子IC以及rankIC虽然只有0.04和0.05,但是ICIR以及rankICIR较高。


在使用一个月的数据计算因子时,开盘冲高以及盘低回升的选股能力有所下降,并且两因子的ICIR和rankICIR也出现了下降。均价偏离因子IC以及rankIC并未出现明显变化,且ICIR以及rankICIR有所上升。


除了统计各因子的IC以及ICIR外,我们还可以在每月月末按照股票因子值大小对于股票进行分组并统计各组股票在接下来一个月中相对于选股范围平均收益的超额收益。各因子分组收益情况详见下图。




从分组收益可知,随着股票前期开盘冲高幅度以及盘低回升幅度的上升,股票未来收益也在逐渐降低。而日内均价高于收盘价的比例越高,股票未来的收益表现就越好。此外,开盘冲高以及盘低回升两因子虽然对于股票未来收益有一定区分能力,但是组间收益也呈现出了较为明显的非线性特征(即,两边组别收益低,中间组别收益高)。可在构建因子时考虑引入非线性因子。下表统计了各因子的分组平均超额收益以及多空收益。




综合前文统计结果来看,开盘冲高,盘低回升以及均价偏离三个因子皆具有一定的选股能力,并且这三个因子在计算时间窗口为半个月的情况下具有更强的选股能力。从单因子的角度来看,各因子空头效应较强,且在分组收益上呈现出了非线性的特征。在分析了各因子截面的选股能力后,我们可通过多空组合观察各因子选股能力在时间序列上的特征。下表给出了各因子全市场顶Bottom10%组合分年度收益以及胜率情况。




由于对于新因子的研发最终是要服务于多因子模型的,所以本节还构建了正交因子,从而考察各价格形态因子在剔除了常见选股因子的影响后的选股能力。本部分将上述三个因子相对于行业,市值,反转,换手,特异度以及非线性市值6个因子进行正交处理并构建正交因子。在进行正交时,我们主要通过截面回归取残差的方式进行回归方程见下式(详细处理细节可参考专题报告“选股因子系列研究(十七) - 选股因子的正交”。)。




下表展示了正交后各因子的IC以及ICIR情况。




从正交因子的IC以及ICIR来看,半个月窗口计算的开盘冲高因子,其选股效果受到了明显影响,而盘低回升以及均价偏离因子依旧具有一定的选股能力。对于一个月窗口计算的价格形态因子,开盘冲高因子以及盘低回升因子选股效果基本消失,而均价偏离因子依旧保留较为明显的选股效果。下图展示了各因子的分组收益情况。




观察分组收益特征,各因子分组收益依旧呈现出了较为明显的非线性特征。所以本报告会在第三部分中讨论加入价格形态因子平方项的可能。


简单来说,各价格形态因子皆具有一定选股能力,但是在进行了正交以后,半个月窗口计算的价格形态因子以及一个月窗口计算的均价偏离因子均保留有一定的选股能力。所以本文的第三部分将重点对半个月窗口计算的开盘冲高,盘低回升,均价偏离以及一个月窗口计算的均价偏离在多因子模型中的表现进行讨论。


3.多因子模型回测


由于新因子的研究最终还是要服务于多因子模型,所以本部主要讨论价格形态因子在加入到多因子模型后对于模型的影响。首先,我们会从回归法的角度讨论价格形态类因子在加入到模型后的额外选股能力。其次,我们会从纯多头组合的角度对比原始多因子组合与改进后的多因子组合。最后,我们会从权重分配的角度讨论价格形态类因子在多因子打分时所占的权重。


在进行模型对比时,原始模型为使用市值,反转,换手,特异度以及非线性市值因子构建的最大化单期IC加权的月度选股组合。(相关权重分配方式可参考专题报告“从最大化复合因子单期IC角度看因子权重“)其中,因子集合进行正交化处理。改进模型在原始模型的基础之上分别加入了前文讨论的价格形态因子中的任意一个(开盘冲高2W ,盘低回升2W,均价偏离2W以及均价偏离1M)。


3.1回归法


使用2009年1月至2017年2月底之间的数据可分别对于原始模型以及改进模型进行法玛-麦克白回归检验。由于模型组成因子为正交因子,所以任意新因子的引入并不会影响原有因子回归系数以及系数的显着性。故而,我们可将注意力集中在新加入因子的回归系数及其Ť统计量上。下表给出了加入价格形态因子一阶项后的回归结果。




观察上表结果可知,半个月计算周期下的开盘冲高,盘低回升,均价偏离以及一个月计算周期下的均价偏离均能够为模型提供额外的选股能力,其回归系数时间序列Ť统计量绝对值皆在3以上。


考虑到因子分组收益上所具有的非线性特征,我们也可尝试引入各价格形态因子的二阶项。下表展示了引入各因子二阶项后的回归检验结果。




观察上表可知,除了一个月计算得到的均价偏离因子外,半个月计算得到的价格形态因子的二阶项皆具有显着的额外选股能力。也即,可考虑将其二阶项引入到多因子模型中去。


3.2纯多头组合


基于前文提到的模型构成,可分别使用原始模型以及改进模型在2009年1月至2017年2月底间构建全市场TOP100选股组合。在进行选股时剔除上市不满6个月的股票,ST股以及无法交易的股票。下表对比了原始模型TOP100组合以及改进模型TOP100组合的历史表现。




对于半个月计算的价格形态因子,在加入了价格形态因子一阶项后,组合表现在年化收益,最大回撤,收益回撤比以及信息比率上皆有一定提升。在引入了二阶项后,TOP100组合表现​​在上述几个维度中得到了进一步的提升。对于一个月计算的均价偏离因子,在加入一阶项后模型有所改善,但是在加入二阶项后模型未有改善。该结果也和前文回归法的结论相符。整体上来看,价格形态因子在引入到多因子模型后对于模型年化收益的提升基本在2%〜3%左右。


3.3因子权重分配情况


因子对于多因子模型的影响很大程度上取决于因子在模型中所占有的权重,所以本节将展示价格形态因子在改进模型中所占的权重。


下图为加入了半个月计算的开盘冲高因子的改进模型因子权重分布情况。从因子权重上看,半个月计算的开盘冲高因子以及开盘冲高因子二阶项的权重在2012年4月以后才出现了较为明显的上升。两个因子在模型中的权重基本在10%左右波动。




下图为加入了半个月计算的盘低回升因子的改进模型因子权重分布情况。从因子权重上看,半个月计算的盘低回升因子以及盘低回升因子二阶项的权重之和基本在10%〜15%之间波动。近期盘低回升因子二阶项权重较低。




下图为加入了半个月计算的均价偏离因子的改进模型因子权重分布情况。均价偏离因子及其二阶项在模型中同样占有较高的权重,两因子权重之和基本在15%至20%之间波动。近期二阶项权重较低,均价偏离因子权重约为15%。




下图为加入了一个月计算的均价偏离因子的改进模型因子权重分布情况。一个月计算的均价偏离因子在模型中占有约10%的权重。




总的来说,各价格形态因子在这种“逐步正交+最大化单期IC”的权重分配模型下都能够获得一定的权重。由于“逐步正交+最大化单期IC”模型在分配权重时对于因子收益有着更高的要求,若因子无法提供额外的选股效果则无法获得明显的权重分配,所以这也从侧面说明了价格形态类因子的选股效果。


4.总结


考虑到传统技术指标基本上都使用日收盘价作为输入变量,而收盘价很难完全反映日级别股票走势信息。所以本文通过引入其他价格数据(开盘,盘高,盘低以及均价)构建价格形态类因子,简要刻画股票日内价格形态。


从单因子的角度来看,价格形态因子皆具有一定的选股效果,但是和传统强势选股因子相比依旧存在一定差距。价格形态因子的特征可总结为“空头收益强,分组收益非线性明显”。在将价格形态因子相对于传统强势因子进行正交后,半个月计算的价格形态类因子以及一个月计算的均价偏离因子依旧具有一定的选股能力。


从多因子的角度来看,价格形态因子能够为多因子模型提供额外的选股能力。在法玛 - 麦克白回归检验中,各价格形态因子的回归系数均值都极为显着。在尝试加入二阶项后,仅一个月的均价偏离因子二阶项回归系数均值不显着。通过构建TOP100多头组合,我们发现在加入价格形态因子后,组合在年化收益,收益回撤比以及信息比率上都有所提升在加入二阶项后,除一个月的均价偏离因子外其余各改进组合皆有进一步的提升。从模型权重分配来看,价格形态因子在“逐步正交+最大化单期IC”。的权重分配框架下普遍能够得到10%以上的权重分配。



来自宽客之家



白银 5.jpg
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 免费注册
关注微信