秒懂量化选股之最经典的因子选股

geek001 资讯 2019-7-16 20:59 287233人围观

先举个例子：

2017上海半程马拉松赛3月16日开始预报名,如果我们想知道哪些选手最终可能会取得比较好的名次，理论上我们可以在开跑前对他们做一个身体测试，比如测一下他们的肺活量、最大摄氧量等指标。并对测试的结果进行排名，排名靠前的选手获得好名次的可能性就比较大。

因子选股模型的原理与此类似，可以利用某些指标也就是因子选择未来可能表现较好的股票。

如此一来，就找到了问题的关键点，选择什么样的因子才能选出这样的股票呢？

我们知道影响股价的因子非常多，宏观经济状况、行业前景、公司经营状况、甚至天气、季节都不是没有可能。而判断这些因子是什么状况，又有一系列可以量化的因子指标，比如：GDP增速、CPI、PPI、行业景气指数、行业集中度、净利润率、主营业务收入增长率、降雨量、日照指数、温度变化……

看起来有种没完没了的节奏，这么多，指望着10个手指头一一算过来，黄花菜都凉了。

可别忘了我们有计算机。

计算机运算快是众所周知的，可是得知计算机每秒运算几十亿次到上千万亿次，仍然感觉很震惊。理论上讲，什么因子我们都可以拿来验证一下是否有效。很多公司的计算机配置很是超前，算这些都是小意思，只有你想不出，没有算不出。不过理论之外，很多因子还是没法计算，再先进的配置也是枉然，因为没有数据或者数据拿不到。而且，如果一个包罗万象的因子库，很有可能导致过度拟合的情况，导致最终选不出好的股票了。结合我们自己的经验和市场规律以及数据的可得性，我们会得到一个候选因子库。

选取候选因子的标准应该遵循哪些规则呢？

这主要是由投资者经验和市场规律来决定的，较多的候选因子将为构建投资组合的全面性做出更强的保证，更有效的候选因子才能保证投资组合的收益率。

如果没有经验，可以先看看别人都选了啥：

估值因子：市盈率、市净率、账面市值比、股息率、现金收益率

成长因子：净资产收益率及变动、总资产收益率及变动、主营收入增长率、毛利率及变动、净利率及变动

价量因子：1、3、6个月收益率、1、3、6个月换手率及变动

预期因子：机构覆盖数量、评级调整……

根据相关研究报告整理，有的机构因子库中有数百个候选因子。

这么多因子，只是有经验的人列出来的清单，在一定的时间段内对选股来说未必都有效。

检验候选因子的选股有效性一般采用的检验方法是排序的方法。

简单来说，每一个因子都是一个指标，把股票按每个指标值从小到大的顺序都排一下，然后分别选取每个指标最高、最低极端的2组计算他们的区间收益率(一般为月度，分组目前一般采用5档)及收益率与因子的相关性。

比如：我们认为身高高的力量可能会大，于是身高最高的组和身高最矮的组选出来，看一下身高高的力量是否真大，身高最矮的力量是否就真的小。