【宽客研报】渤海证券:多因子模型研究之一:单因子测试

2
回复
7028
查看
[复制链接]

294

主题

20

回帖

1380

积分

专栏作家

积分
1380
来源: 2019-9-25 21:54:05 显示全部楼层 |阅读模式
多因子模型研究之一:单因子测试核心观点:
 内容
1、多因子模型(Multiple Factor Model)是金融量化研究的重要课题之一。该模型通过探寻的多种因子和股票收益率之间的统计关系,预测股票未来的收益与风险,从中选择优质标的。
2、多因子模型的建立主要包括单因子测试、收益模型建立、风险模型建立三个步骤。首先通过单因子测试确定模型因子,然后通过收益预测模型估计各个因子的因子收益率,从而得到股票的预期收益率,最后,通过估计因子的协方差矩阵,刻画股票池未来的波动风险,选股结果以及股票配置仓位进行二次优化。本报告为系列研究报告的第一篇:单因子测试部分。
3、本篇报告中,我们共提取了估值、盈利、成长、动量、波动率、流动性六大类共 107 个因子。对因子进行去极值中性化的预先处理后,在每一个横截面上使用同时考虑行业与市值因素影响的回归模型进行加权最小二乘回归(WLS),得到 t 值序列、因子收益序列以及 IC 值序列,并进行统计分析,得到显著性检测结果。然后,我们对因子进行历史收益分层回测,在每个截面期的最后一个交易日,按照因子将样本内股票排序,并按照序号从大到小平均分为 N 组(本报告中N=5),在下一个截面期的首个交易日,对 N 组股票的历史收益率进行回测,并计算其年化收益率、波动率、夏普比率等值。如果 N 组股票的收益率呈现较好的单调性,且每一组股票间的收益差距较大,表示因子在选股上体现了较好的区分度。最终,综合显著性检测和分层回测结果,我们选出 10 个各方面表现较为优异的因子,为下一步多因子收益模型的建立做准备。
4、在分层回测时,我们将股票池分为大市值、中市值、小市值三种。我们发现,不同种类的因子的适用范围也略有不同,如估值、盈利类因子更适用于大中市值股票,动量、流动性因子在小市值股上的表现更好。未来,我们计划根据不同因子的性质,更好的构建模型,使因子的选股能力更大化。
目 录
1.概述
1.1 历史背景
1.2 理论介绍
1.3 基本步骤
2. 单因子测试流程
2.1 数据采集
2.2 基于回归模型的因子显著性测试
2.2.1 数据前期处理
2.2.2 建立回归模型
2.3 单因子选股模型分层回测
2.4 因子的多重共线性问题
3.测试结果
3.1 估值因子
3.2 盈利因子
3.3 成长因子
3.4 动量因子
3.5 波动率因子
3.6 流动性因子
4.总结
表目录
表 1:因子定义
表 2:估值因子的回归测试结果
表 3:估值因子的选股回测结果
表 4:盈利因子的回归测试结果
表 5:盈利因子的选股回测结果
表 6:波动率因子的回归测试结果
表 7:成长因子的选股回测结果
表 8:动量因子的回归测试结果
表 9:动量因子的选股回测结果
表 10:波动率因子的回归测试结果
表 11:波动率因子的选股回测结果
表 12:流动性因子的回归测试结果
表 13:波动率因子的选股回测结果
表 14:单因子测试结果汇总
图目录
图 1:估值因子超额年化收益率分组回测结果
图 2:估值因子多重共线性分析
图 3:盈利因子超额年化收益率分组回测结果
图 4:盈利因子多重共线性分析
图 5:成长因子超额年化收益率分组回测结果
图 6:估值因子多重共线性分析
图 7:动量因子超额年化收益率分组回测结果
图 8:动量因子多重共线性分析
图 9:波动率因子超额年华收益率分组回测结果
图 10:波动率因子多重共线性分析
图 11:流动性因子超额年化收益率分组回测结果
图 12:波动率因子多重共线性分析

[hide]


1.概述1.1 历史背景
优化收益,控制风险,是投资永恒的主题。在 H.M.Markowitz 提出的均值-方差模型中,股票的风险被定义为未来收益率期望的标准差。1964 年,美国学者William Sharpe 等人在资产组合理论和资本市场理论的基础上提出了资本资产定价模型(Capital Asset Pricing Model,简称 CAPM),对证券市场中资产的预期收益率与风险资产之间的关系进行了刻画。套利定价理论(Arbitrage Pricing Theory,简称APT) 是 CAPM 的拓广,其假设证券的回报率与未知数量的未知因素相联系,给出了因素模型。因素模型是一种统计模型,套利定价理论利用因素模型来描述资产价格的决定因素和均衡价格。1992 年,Fama 和 French 对美国股票市场决定不同股票回报率差异的因素的研究发现,股票的市场的 beta 值不能解释不同股票回报率的差异,而上市公司的市值、账面市值比、市盈率可以解释股票回报率的差异。于是建立了 Fama-French 三因子模型。但是,三因子模型并不代表资本定价模型的完结,模型中还有很多未被解释的部分,如动量、波动率、流动性等因素。于是最后诞生了出了利用多个因子刻画股票未来收益率与风险的多因子模型(MultipleFactor Model,简称 MFM)。
1.2 理论介绍
Barra 结构化风险模型是目前全球最知名的多因子模型之一。根据 Barra 手册的内容,多因子模型被分为两部分,收益模型与风险模型,收益模型的基本表达形式如下:
65608f30cdc53535e21378c1a72190c00339f90e.png
已知股票在每个因子上的因子暴露,通过多因子的收益预测模型,估计各个因子的因子收益率,从而得到股票的预期收益率,这就是多因子收益模型的主要思路。多因子风险模型的基本思路为,通过估计因子的协方差矩阵,刻画股票池未来的波动风险。而后对选股结果以及股票配置仓位进行二次优化,一般表达形式为:
40aa7408ace6f1855ed804b76313ab4f078e2375.png
以上模型仅为多因子模型的基础形式,实际应用中,还结合其他约束条件(如单支股票权重上限、风格中性要求、约束误差要求等),对优化模型做出修正。
1.3 基本步骤
多因子模型的建立主要包括以下步骤:
1)单因子测试;
2)收益模型的建立;
3)风险模型的建立与二次规划;
在本篇报告中,我们主要完成了单因子测试部分,通过因子的显著性和选股能力,结合多重共线性检测,筛选出有效的因子,供未来使用。
2. 单因子测试流程2.1 数据采集
样本范围:全体 A 股,剔除 ST/PT 股票,剔除上市交易不满两年的股票。
样本期:2006 年 1 月-2017 年 6 月,按月提取。
因子的选择上,我们具体测试了估值、盈利、成长、动量、波动率、流动性六大类因子,并在测试名单中涵盖了 Barra CNE5 手册中的大部分因子,具体因子定义见下表:

ad6a95f6862eeeea9ca723eec6f426e2b5af38e8_1_481x500.png 3.png[size=1em]815x847 148 KB


e06dcaf68f185c717e53dd0c634ebfdb291964a2.png 4.png[size=1em]812x636 123 KB


f719b3e0f3026db20e2b146a2be87a08c57d12ef.png 5.png[size=1em]815x501 56.7 KB


557c3e22ed3b8becb53d97c83f3c6295d8f21759.png 6.png[size=1em]809x494 66.7 KB


6c57fdb2b531e09abe9a3a35d69d1d7df9805e05.png 7.png[size=1em]817x654 101 KB


1e17cece9c0d56cdf89e9da4c08965185933a3bd.png 8.png[size=1em]821x628 120 KB


2.2 基于回归模型的因子显著性测试2.2.1 数据前期处理
提取的因子数据需经过数据对齐、去极值、标准化、缺失值处理等步骤,才可进入下一步的因子回归模型。
数据对齐:上市公司财报的报告期和报告发布日期之间有一定延迟,为避免未来信息,在提取数据的时候,需要对日期进行修正,保证因子数据为当时能获取的最新财报数据。
去极值:为避免数据中的极端值对回归结果产生过多影响,我们使用“中位数去极值法”,将超过上下限的极端值用上下限值代替。
73f8d01b2e39f806740ea352117433661e7d50d3.png
1bf8869026da62bf51c1816a0d7b325123370c84.png
标准化:由于各个因子的单位不同,为了使其具有可比性,需要对其进行 ZScore标准化处理,即减去序列均值除以序列标准差,使因子序列近似成为一个符合N(0,1)正态分布的序列。
缺失值处理:提取出的因子可能会因为技术原因等情况出现缺失值,在分层回测时,为避免缺失值影响收益结果,选股时直接采取了移除处理。
2.2.2 建立回归模型
根据 Barra 手册中关于因子显著性测试的内容,对因子进行横截面回归,同时考虑行业与市值因素的影响:
ea38eba2a5e401b2d42ed31b5a708fc41791020b.png
在每一个横截面上使用上述模型进行加权最小二乘回归(WLS),权重采用流通市值的平方根,一定程度上消除了异方差性。经过回归模型,我们可以得到 t 检验的t 值序列与因子收益序列
36a98052c4dc4f8b9792ed9d6c231abe1c59bd21.png
2baa0afe22f97abc38108d080e3601cdd6e193f1.png
779b797a7502384e16c2c5c4523735ed4553cae5.png
b3095933106e0ae69192b996cdc10a0a27aef9e4_1_633x500.png
0c6ffafadf93a5fde3139fdcc7255732a8195b27.png
edc4e0f88dfaa493a44c2095c5ff41100db62688.png
e49ca85f1fb90373c46d8c26f04d0f1f35d17c46.png
f109a389013e163eec2986151ed7ebdcc1397f78.png
145de358869bc2cd50cf765c958839c165d5cc95_1_605x500.png
8ae63595378699951565d871f63bd8e22780dbfe.png
ab2f255cafb8ce74e716c66e23942d0824b47e80.png
297117f0b5fcc39ca78b5ac1b659b0fe6618067e.png
3c93dcb721fe82f3eed0faf67c99ceb249118637_1_604x500.png
cccc689c2f77e3564861ae4cc013db96e3661c62.png
42789e0f72caaac04fb0cd43100628df8d865e9e.png
ab6b971e61cbf797f5619dd50992d5e0932fb3fa.png
ef6720bb58b1e0187157775af8186045c493efd3_1_551x500.png
0ef93542801c0261de4f0f50afe6d2016d102b6b.png
44103fa28705030bf1b63912c6dc3c55d9d8b04c.png
f7e41dee2ba5e8d11412a0b432fa27b9b39e3496.png
509a6b55c29d560149636e5a0bd2e253e2f88aeb.png
f0dd9a7e28002e3f39a3a804ca75fcea52226c4e_1_604x500.png
b815639656fb4e680d3f835749bf653ff2dbdd8d.png
c1fc82749602f76770c88c379d9fe94cd01d469b.png
56c842818d2399bbcec7599843657b8ea4dbd321.png
c8c70b685fd6bbe5c1061fbc2df41397024c371c.png
15312fd466d9979508e752492f5ed415f3fc9b2c_1_606x500.png
0469a7923ee7c49b9549576a2671b0e5fee93f6f.png
回复

使用道具 举报

196

主题

140

回帖

1444

积分

管理员

积分
1444
2019-10-5 18:22:05 来自手机 显示全部楼层
感谢分享
回复

使用道具 举报

196

主题

140

回帖

1444

积分

管理员

积分
1444
2019-10-5 18:22:07 来自手机 显示全部楼层
感谢分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 免费注册
关注微信