机器学习多因子动态调仓策略 —— 多因子 Alpha 系列报告...

0
回复
5648
查看
[复制链接]

41

主题

32

回帖

248

积分

中级会员

积分
248
来源: 2019-8-20 12:48:16 显示全部楼层 |阅读模式
机器学习多因子动态调仓策略 —— 多因子 Alpha 系列报告之(三十六)报告摘要:
 传统因子表现不佳,因子择时大显身手
在历史上表现良好的规模、反转和流动性因子在 17 年以来都出现了明显的回撤,导致主流多因子选股策略表现欠佳。在这样的大背景下,如何把握 Alpha 因子的风格轮动,选择最有效的风格因子,成为重要的研究课题。
 基于机器学习的因子择时框架
本报告选择常见的 7 个风格因子,通过机器学习方法,基于历史数据提炼因子风格轮动的规律,将因子 IC 历史信息、宏观经济变量、市场变量等信息作为特征,采用性能优良的 XGBoost 模型对因子未来的 IC 进行预测,来衡量不同风格因子未来选股的有效性。在因子配权时,赋予预期表现好的因子更高的权重,而减小预期表现不佳的因子的权重。
 基于机器学习的多因子动态调仓策略
根据机器学习模型对不同风格因子未来一期 IC 的预测,对因子动态加权得到复合因子。根据复合因子得分进行调仓,等权买入复合因子得分最高一档的个股。与因子等权策略相比,因子动态调仓策略的换手率较高,导致多因子组合的部分收益被交易成本蚕食,降低每次调仓的换手率能够显著增强本报告提出的动态调仓策略。基于滚动样本训练的机器学习多因子动态调仓策略能够更好地追踪市场风格的变化,2014 年以来该策略累积收益率达到 107.89%,胜率达到63.21%,年化收益率达到 20.08%,最大回撤为 7.68%,信息比为 1.74,分
别较因子等权策略和固定模型的多因子策略提高了 59.6%和 27.9%。
 结论
回测表明,限制换手率的多因子动态调仓策略的表现显著好于因子等权策略,而基于模型滚动训练的策略则进一步提升了策略表现,在胜率、年化收益率、信息比、最大回撤等各项指标上都显著高于因子等权策略。分年
度来看,在市场风格稳定的年份里,基于模型滚动训练的多因子策略能够获得更高的超额收益,而在市场风格剧变的年份里,该策略也能做出相应调整,始终获得更好的表现。
 风险提示
本报告提出的机器学习多因子动态调仓策略基于历史数据进行回测,策略模型并非百分百有效,市场结构及交易行为的改变以及类似交易参与者的增多有可能使得策略失效。
目录索引
一、背景介绍
1.1 主流因子历史表现
1.2 因子择时理论
二、因子择时框架
2.1 风格因子的选取
2.2 外部变量的选取
2.3 XGBOOST 模型简介
三、多因子动态调仓策略
3.1 XGBOOST 预测模型
3.2 特征重要性分析
3.3 模型预测效果评估
四、实证分析
4.1 多因子动态调仓策略实证结果
4.2 限制换手率的多因子动态调仓策略实证结果
4.3 模型滚动训练的多因子动态调仓策略实证结果
五、总结

一、背景介绍1.1 主流因子历史表现
多因子选股策略是A股市场最主流的量化交易策略之一,其本质是:市场中的个股行情会出现分化,对个股的分化特征进行提取得到所谓的风格因子。风格因子是Alpha收益的最终来源,而因子的有效性则直接影响Alpha策略的收益。通过对国内A股市场进行分析,我们发现在不同阶段,个股均出现不同的分化规律,这意味着A股市场长期存在Alpha。然而,股市是一个博弈的游戏,随着时间的推移和市场博弈,任何一个风格因子都不可能长期产生稳定的Alpha收益。在中证500成份股的备选池下,按月调仓,考察自2011年1月至2017年12月主流因子的表现,如图1所示,在历史上表现良好的规模因子、反转因子和流动性因子在17年以来都出现了明显的回撤,导致主流的多因子组合表现欠佳。
本报告从常见的盈利、质量、成长、估值、规模、流动性、技术等7大类因子中各选择一个典型因子,表1统计了各个因子从2007年1月至2017年12月在中证500成份股内选股的IC值,其中负向因子的IC值取相反数进行调整,因而经过方向调整的IC值越大,表示因子选股的性能越好。如表1所示,速动比率、流通市值、月成交金额、一个月动量这四个因子在近一年的平均IC值较长期的历史均值有明显的降低,而ROE、ROE同比和EP这三个因子在近一年的平均IC值较长期的历史均值有明显的提升,这也说明了因子风格不是一成不变的。在这样的大背景下,如何把握Alpha因子的走向,动态地对选择最有效的风格因子,成为非常有意义的研究课题。
国外的学者早在2000年以前就发现在美股市场,存在着明显的价值类因子(PE、PB等)和规模类因子(流通市值等)之间的风格轮动。G. Nalbantov, R.Bauer等人通过研究发现,因子风格轮动现象与系统的经济状况和市场状况有关。Keith Miller和Hong Li等人发现Alpha因子的有效性与动量、历史波动率等市场变量和原油价格、美元汇率等宏观经济变量紧密相关。本报告研究的是“因子择时”,通过机器学习方法,基于历史数据提炼因子风格轮动的规律,对因子的未来表现进行预测,在因子配权时,赋予预期表现好的因子更高的权重,而减小预期表现不佳的因子的权重。
yb190820.png yb19082002.png

1.2 因子择时理论
市场上主流的因子择时方法主要有两大类。一类是从因子收益率时间序列本身出发,探究因子风格在不同的时间长度内可能存在的动量或者反转效应。因子IC指的是截面因子值与个股下期收益率之间的相关系数,能够反映因子提供超额收益的能力。《多因子Alpha系列报告之(十二)——从ICIR角度探讨风格因子的均值回复性》中,我们实证了因子IC与ICIR之间存在显著的负相关关系,因此基于因子均值回复性的因子择时策略能够有效提高多因子Alpha策略的收益情况。而另一类,则认为宏观经济情况、市场情况等外部条件会对因子收益率有潜在影响,当给定这些外在条件的取值时,我们可以通过统计模型来预测因子未来的收益情况。影响因子风格轮动的宏观经济变量和市场变量有很多,比如CPI、汇率、国债利率、市场的波动率,等等。而且这些变量对因子收益率影响的方式各不相同,这种复杂关系很难通过线性模型来刻画。
提升树模型是一个性能强大的非线性机器学习模型,相对于线性回归等模型,它不对输入特征的分布有过多假设,对异常值更加鲁棒,且能够学习到特征之间复杂的非线性关系。一般来说,我们可以通过对特征做交叉、采用核函数等方式,使得线性模型也能处理非线性问题,但是如何做特征交叉、选择什么核函数都需要人工干预,事实上要在模型学习前确定合理的特征交叉方式和核函数是很有难度的。而随着决策树的生长,提升树模型能够自适应地产生高度非线性的模型。此外,相对于神经网络等复杂模型来说,提升树模型的可解释性更强,可控性更好。因此,本报告中采用提升树模型来预测因子的有效性。
本报告提出的基于XGBoost模型的多因子动态调仓策略是综合了以上两类因子择时思想,分别将因子IC序列本身、宏观经济变量、市场变量等信息作为特征,采用性能优良的XGBoost模型对因子IC进行预测,根据IC值动态调整各个因子的权值。
二、因子择时框架
在之前的多因子Alpha系列报告中,我们已经建立了一个完整的多因子Alpha选股模型,包括风格因子库的建立、风格因子有效性的检测、Alpha因子的整合以及组合优化和对冲等主要步骤。本报告主要侧重于Alpha因子的整合和赋权。如图2所示,我们首先选择了7大类常见的风格因子,然后将宏观变量、因子历史IC序列以及市场变量作为输入的特征,利用XGBoost模型来预测每个风格因子未来的IC值。在Alpha因子整合阶段,根据预期的IC值对各个因子赋权。
yb19082003.png

2.1 风格因子的选取
本报告从常见的盈利、质量、成长、估值、规模、流动性、技术等7大类因子中选取7个典型因子作为研究对象,所选因子如下表所示。
yb19082004.png
yb19082005.png

2.2 外部变量的选取
A股市场受市场交易行为以及宏观经济因素的影响较大,因此风格因子的有效性也与市场变量和宏观变量密切相关。本报告选择了6个市场变量,其中沪深300过去20日的涨跌幅和中证500过去20日的涨跌幅用来表征大小盘市场的强弱,沪深300过去20日的波动率和中证500过去20日的波动率用来表征市场波动性的高低,沪深300过去20日平均换手率和中证500过去20日平均换手率用来表征市场流动性的好坏。选择了7个关键的宏观经济变量:CPI同比、M1同比、M2同比、一周上海银行间同业拆放利率(SHIBOR1W)、PPI同比、PMI和美元兑人民币汇率。
值得注意的是宏观经济类的数据通常在次月公布,因此实际应用时,此类数据有一个月的滞后期。此外,有些宏观变量在时间轴上的分布非平稳,不同时期的取值可能存在很大的差别,不具备可比性。如下图所示,2009年下半年M2同比创下新高,此后保持一种下降的趋势。可以通过对其作一阶差分,得到更加平稳的时间序列,使不同历史时期的取值具有可比性。假设因子Factor在第i个月取值为
yb19082005.png
yb19082006.png
yb19082007.png
yb19082008.png
yb19082009.png
yb19082010.png
yb19082011.png
yb19082013.png
yb19082014.png
yb19082015.png
yb19082017.png
yb19082018.png
yb19082019.png
yb19082020.png
yb19082022.png
yb19082023.png
yb19082024.png
yb19082025.png
yb19082026.png
yb19082030.png
yb19082031.png
yb19082033.png
yb19082034.png
yb19082036.png
yb19082040.png
yb19082041.png
yb19082043.png
yb19082044.png
yb19082045.png
yb19082050.png
yb19082051.png
yb19082053.png
yb19082057.png
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 免费注册
关注微信