基本面因子研究:一种分析方法摘要 在本报告中,通过设定因子生成规则而非具体指标逻辑,以三张财务报表科目指标作为输入变量,批量构建了基本面因子。 对于基本面因子选股,通常的思路是基于经济理论和财务指标进行因子构建,然而这种方法得到的指标是比较少的。且在因子库已经比较庞大的情况下,思路往往会受现有信息的影响。在此种情况下,如果更多关注因子生成规则,而非单个因子的生成逻辑或指标之间的关联,或能得到一定的增量信息。 基于此,我们以19个资产负债表指标、10个利润表指标和9个现金流量表指标作为输入变量,构建了7种因子生成规则:X、%D(X)、X/Y、D(X)/Y、%D(X/Y)、%D(X)-%D(Y)和(X-Y)/Z,批量进行了基本面因子的构建。 对于第一种因子生成规则X,所得38个因子的IC均值为5.83%,最大值为7.37%,且均是显著异于0的。从年化收益来看,表现最好的5个因子是支付的各项税费、所得税、营业利润、资产总计和净利润因子,相对中证500年化超额收益分别为24.56%、24.08%、23.78%、23.44%和23.35%,Sharpe分别为2.236、2.303、2.274、2.056和2.227,整体表现较好。单边月均换手率为20%左右,整体较低,交易费用对组合收益影响较小。 对于后6种剔除量纲影响的指标,部分因子也有较好的表现,不过整体收益走势较为一致:2017年之前,相对基准可以取得较为明显的超额收益,2017年回撤较大,近期有所回升。从走势来看,这几类因子与小市值有较为密切的联系。 在本报告中,通过设定因子生成规则而非具体因子逻辑,我们对基本面因子进行了批量研究分析。 1 研究出发点对于基本面因子,我们更关注其是否有经济含义,与股票未来表现是否存在逻辑上的关联。为此,从方法论上来看,是基于相同的问题,生成一种或多种有效的解。一般来说,生成一个问题的解是比较困难的。例如,给定一个数13717421,判断其是否能写成两个数的积,与验证3607乘以3803是否可以得到该值,难易程度是差别比较大的。与此类似,先生成一个逻辑,然后进行验证,逻辑的构思相比于验证更为困难。 对于基本面因子选股,通常的思路是基于经济理论和财务指标进行因子构建,然而这种方法得到的指标是比较少的。在没有先验信息的情况下,往往不会将两个变量联系起来。在学术界,对于异常收益现象,也通常是在观测到某一现象之后,开始寻找其逻辑来源,并对其进行持续跟踪或样本外检验。 在现有因子库已经比较庞大的情况下,我们的思路往往会受现有信息的影响。在此种情况下,如果更多关注因子生成规则,而非单个因子的生成逻辑或指标之间的关联,或能得到一定的增量信息。在这种分析方法下,对生成的指标进行回测,然后从中筛选出表现较好的指标,对其逻辑及样本外表现进行分析和观测。如果一些因子在样本外也有较好的表现,且可以发掘其本身的经济含义,则可以将其纳入现有模型中。 在后面的部分中,我们将对因子生成规则和涉及指标进行介绍,并给出回测结果。 2 研究方法在这一部分,我们对使用到的指标和因子生成规则进行说明。具体来说,我们从资产负债表、利润表和现金流量表中筛选出覆盖度较高的指标,然后通过有较强逻辑含义的计算规则,批量得到基本面因子。 2.1 财务指标在本报告中,我们使用到的指标来源于资产负债表、利润表和现金流量表的基础科目指标,未使用衍生数据。在选取指标时,以覆盖度作为标准,共筛选得到19个资产负债表指标、10个利润表指标和9个现金流量表指标,具体如下: 资产负债表:资产总计(asset)、所有者权益合计(equity)、固定资产(fasset)、应交税费(taxpay)、负债合计(tot_liab)、未分配利润(undpro)、应付职工薪酬(empay)、无形资产(intasset)、货币资金(monecap)、流动资产合计(tcasset)、非流动资产合计(tncasset)、流动负债合计(tcliab)、应付账款(acctpay)、预付账款(prepay)、应收账款(acctrcv)、递延所得税资产(defasset)、预收账款(advcust)、存货(invent)、非流动负债合计(tncliab)。 利润表:营业总收入(operrev)、营业总成本(opercost)、营业利润(opprofit)、净利润(nprofit)、管理费用(gaexp)、营业外支出(nonoperexp)、所得税(tax)、营业外收入(noperrev)、财务费用(finexp)、销售费用(sdexp)。 现金流量表:销售商品、提供劳务收到的现金(cashrs)、收到的税费返还(recptax)、购买商品、接受劳务支付的现金(cashrec)、支付给职工以及职工支付的现金(cashempl)、支付的各项税(payalltax)、经营活动产生的现金流量净额(ncashact)、取得投资收益收到的现金(cashinv)、投资活动现金流入小计(tininv)、购建固定资产、无形资产和其他长期资产支付的现金(capx)。 表1中给出的是2018年中报指标覆盖度情况,基本在90%以上。三张报表中的指标较多,如果仅考虑部分行业或板块,可以筛选出更多的指标。 表 1 : 指标覆盖度-20180630 ![]() 在本报告中,我们考虑了7种因子生成规则,具体说明如下: 1. X 即单个指标值,不涉及多个指标之间的运算。从逻辑上来讲,可将该值作为公司价值的代表变量。 2. %D(X) 仅涉及单个指标,计算其同比增长率。增长率和股票收益相关性与指标本身含义关系较大,例如净利润增速与总负债增速便存在较大差别。 3. X/Y 涉及两个指标,计算其比率值。例如ROE,反映财务指标之间的比例关系。 4. D(X)/Y 涉及两个指标,首先计算X的同比变动值,然后计算其与Y的比率值。 5. %D(X/Y) 涉及两个指标,首先计算比率值X/Y,然后计算其同比增长率。 6. %D(X)-%D(Y) 涉及两个指标,分别计算X和Y的同比增长率,然后计算二者之差。财务指标增速之差,比如净利润增速与总资产增速,可以反映公司盈利能力的变动。 7. (X-Y)/Z 涉及三个指标,X-Y得到新的指标,然后计算与Z的比率值。例如,营业收入与营业成本之差是营业利润,与总资产之比反映了公司的盈利能力。 以000002.SZ为例进行说明。X,营业总收入:105974537269.94(2018/6/30), 69810477567.49(2017/6/30);Y,营业总成本:87131631791.63(2018/6/30),57668666741.88(2017/6/30);Z,总资产:1345151635212.87(2018/6/30)。计算结果见表2。 ![]() 2.3 回测方法 在这一部分,我们对回测流程进行说明。所涉及的股票池为全部A股,回测区间为2010年1月至2019年2月。回测流程如下: (1) T时刻,提取所需数据,基于生成规则,计算得到因子值F; (2) 将因子值F对总市值对数和中信一级行业虚拟变量进行截面回归,以残差值作为选股因子F0; (3) T+1时刻,剔除停牌和涨停股票,剔除上市不满60日的次新股; (4) 基于剩余股票因子值,升序排列,等分为10组。因子值最大一组记为G10,最小一组记为G1; (5) 按月调仓,等权配置。 基于上述生成规则,共可得到54207个因子(对于比率值,不区分指标作为分子和分母的差异;对于增长率之差,不区分顺序),具体见表3。在实际计算中可以发现,每一类因子整体回测表现较为接近。因此对于后5种类型,我们仅给出各类中部分因子的回测结果。对于每一因子回测,我们统计了如下结果:因子IC序列;因子分组净值表现;组合换手率。 ![]() 3 因子回测 前文我们对使用到的财务指标及因子生成方法进行了详细说明,此部分我们首先按类型对生成因子的回测结果进行说明,然后对整体结果进行分析。 3.1 结果汇总在这一部分,我们给出每一类因子的回测结果:因子IC值、结果描述性统计、因子净值曲线、组合换手率情况。 3.1.1. X 图1中给出了因子多头组合的单边月均换手率情况;表4给出了38个因子的IC均值及对应T值。下面分别进行说明。 对于换手率,单边月均最小值为acctpay(应付账款)17.79%,最大值为cashinv(取得投资收益收到的现金)26.48%,整体均处于较低水平,交易费用对因子组合收益影响较小。 对于因子IC,均值最高的为净利润nprofit、营业利润opprofit和未分配利润undpro,分别为7.37%、7.33%和7.18%,且均是显著的。对于其余因子,IC均值最小的是财务费用finexp,为3.99%,且是显著异于0的。由此可以看出,这38个因子均较为有效。 图 1 : 因子月均单边换手率(G10) ![]() ![]() 表5中给出的是相对中证500年化超额最高的5个因子,分别是支付的各项税费payalltax、所得税tax、营业利润opprofit、资产总计asset、净利润nprofit;图2至图7给出的是前3个因子的分组净值走势和超额收益及最大回撤情况。下面进行分别说明。 这5个因子的年化收益相差较小,且波动率也较为接近。tax最大回撤最小,为7.30%,Sharpe比为2.303;其余4个因子也处于相似水平。从分组净值走势来看,表现最好的3个因子整体收益也较为接近,整体分组效果较好,且多头表现远优于其他组。例如opprofit因子G1-G10组年化收益分别为-6.45%、-3.03%、-0.38%、-0.11%、1.15%、4.29%、4.79%、9.21%、16.42%、25.32%,具有非常好的线性关系。 相对中证500,多头组合能够持续取得超额收益,且最大回撤相对较小;3个因子的超额收益走势及最大回撤时点保持很高的相关性。 ![]() ![]() ![]() ![]() 2. %D(X) 图8中给出了因子多头组合的单边月均换手率情况;表6给出了38个因子的IC均值及对应T值。下面分别进行说明。 对于换手率,单边月均最小值为gaexp(管理费用),21.12%,最大值为tax(所得税),37.96%,整体均处于较低水平,交易费用对因子组合收益影响较小。 对于因子IC,均值最高的为营业总成本opercost、营业利润opprofit和销售费用sdexp,分别为4.18%、3.61%、3.57%,且均是显著的;反向因子中表现最好的是营业外支出nonoperexp,为-2.09%,基本是显著的。其中部分因子IC均值较小,且未通过显著性检验。 图 8 : 因子月均单边换手率(G10) ![]() ![]() 表7中给出的是相对中证500年化超额最高的5个因子,分别是支付的无形资产intasset、非流动负债合计tncliab、营业利润opprofit、销售费用sdexp、营业总收入operrev;图9至图14给出的是前3个因子的分组净值走势和超额收益及最大回撤情况。下面进行分别说明。 这5个因子的年化收益相差较小,不过整体表现不佳。opprofit波动率最小,其次是intasset。opprofit最大回撤最小,为9.28%,Sharpe比为1.324;其余4个因子也整体处于相似水平。从分组净值走势来看,表现最好的3个因子整体收益也较为接近,整体分组效果较好。例如intasset因子,G1-G10组年化收益分别为0.27%、1.62%、4.29%、2.06%、4.35%、4.17%、4.46%、6.18%、9.92%、12.27%,整体线性关系较好。 相对中证500,2017年之前多头组合多数时间可以获取超额收益,2017年持续跑输,2018年之后有所回升,整体回撤较大。3个因子的超额收益走势及最大回撤时点保持很高的相关性。 ![]() ![]() ![]() ![]() 3. X/Y 图15和图16中给出了因子多头和空头组合的单边月均换手率情况;图17给出了因子IC均值的分布情况;表8给出了部分因子的IC均值及对应T值。下面分别进行说明。 对于换手率,G1组单边月均最小值为fassettcasset(固定资产/流动资产合计),10.01%;最大值为fassetcashinv(固定资产/取得投资收益收到的现金),34.43%。G10组单边月均最小值为fassettcasset(固定资产/流动资产合计),9.52%,最大值为taxpaynonoperexp(应交税费/营业外支出),36.11%,整体均处于较低水平,交易费用对因子组合收益影响较小。 对于因子IC,均值最高的为undpromonecap(未分配利润/货币资金)、undprocashrec(未分配利润/购买商品、接受劳务支付的现金)、undprosdexp(未分配利润/销售费用),分别为4.743%、4.591%、4.479%,且均是显著的;负向因子中表现最好的是empaymonecap(应付职工薪酬/货币资金)、fassetinvent(固定资产/存货)、totliabcashrec(负债合计/购买商品、接受劳务支付的现金),IC均值分别为-4.285%、-4.065%、-4.002%。部分因子IC均值较低,有效性较差;整体呈正态分布特征。 ![]() 图 17 : 因子月均单边换手率(G10) ![]() ![]() 表9中给出的是相对中证500年化超额最高的5个因子,分别是fassetsdexp(固定资产/销售费用)、assetsdexp(资产总计/销售费用)、totliabsdexp(负债合计/销售费用)、undpronoperrev(未分配利润/营业外收入)、equitysdexp(所有者权益合计/销售费用);图18至图23给出的是前3个因子的分组净值走势和超额收益及最大回撤情况。下面进行分别说明。 fassetsdexp年化收益最高,为17.73%。undpronoperrev波动率最小,其次是equitysdexp。undpronoperrev最大回撤最小,为19.70%,整体均处于较高水平;fassetsdexp因子Sharpe比最高,为1.351;其余4个因子也整体处于相似水平。 从分组净值走势来看,表现最好的3个因子整体收益也较为接近,多头收益表现较好。例如fassetsdexp因子G1-G10组年化收益分别为0.98%、-0.56%、-1.08%、1.13%、0.87%、3.90%、3.97%、7.92%、13.08%、19.20%,整体线性关系较好。 相对中证500,2017年之前多头组合多数时间可以获取超额收益,最大回撤也较小;2017年持续跑输,最大回撤持续处于高位;2018年之后组合表现有所回升。3个因子的超额收益走势及最大回撤时点也保持很高的相关性。 ![]() ![]() ![]() ![]() 4. D(X)/Y 图24和图25中给出了因子多头和空头组合的单边月均换手率情况;图26给出了因子IC均值的分布情况;表10给出了部分因子的IC均值及对应T值。下面分别进行说明。 对于换手率,G1组单边月均最小值为fassettcasset(固定资产/流动资产合计),10.01%;最大值为fassetcashinv(固定资产/取得投资收益收到的现金),34.43%。G10组单边月均最小值为fassettcasset(固定资产/流动资产合计),9.52%,最大值为taxpaynonoperexp(应交税费/营业外支出),36.11%,整体均处于较低水平,交易费用对因子组合收益影响较小。 对于因子IC,均值最高的为undpromonecap(未分配利润/货币资金)、undprocashrec(未分配利润/购买商品、接受劳务支付的现金)、undprosdexp(未分配利润/销售费用),分别为4.743%、4.591%、4.479%,且均是显著的;负向因子中表现最好的是empaymonecap(应付职工薪酬/货币资金)、fassetinvent(固定资产/存货)、totliabcashrec(负债合计/购买商品、接受劳务支付的现金),IC均值分别为-4.285%、-4.065%、-4.002%。部分因子IC均值较低,有效性较差。 ![]() 图 26 : 因子IC分布 ![]() ![]() 表11中给出的是相对中证500年化超额最高的5个因子,分别是fassetsdexp(固定资产/销售费用)、assetsdexp(资产总计/销售费用)、totliabsdexp(负债合计/销售费用)、undpronoperrev(未分配利润/营业外收入)、equitysdexp(所有者权益合计/销售费用);图27至图32给出的是前3个因子的分组净值走势和超额收益及最大回撤情况。下面进行分别说明。 fassetsdexp年化收益最高,为17.73%。undpronoperrev波动率最小,其次是equitysdexp。undpronoperrev最大回撤最小,为19.70%,整体均处于较高水平;fassetsdexp因子Sharpe比最高,为1.351;其余4个因子也整体处于相似水平。从分组净值走势来看,表现最好的3个因子整体收益也较为接近,多头收益表现较好。例如fassetsdexp因子G1-G10组年化收益分别为0.98%、-0.56%、-1.08%、1.13%、0.87%、3.90%、3.97%、7.92%、13.08%、19.20%,整体线性关系较好。 相对中证500,2017年之前多头组合多数时间可以获取超额收益,最大回撤也较小;2017年持续跑输,最大回撤持续保持高位;2018年之后组合表现有所回升。3个因子的超额收益走势及最大回撤时点也保持很高的相关性。 ![]() ![]() ![]() ![]() 5. %D(X/Y) 图33和图34中给出了因子多头和空头组合的单边月均换手率情况;图25给出了因子IC均值的分布情况;表12给出了部分因子的IC均值及对应T值。下面分别进行说明。 对于换手率,G1组单边月均最小值为fassettcasset(固定资产/流动资产合计),10.01%;最大值为fassetcashinv(固定资产/取得投资收益收到的现金),34.43%。G10组单边月均最小值为fassettcasset(固定资产/流动资产合计),9.52%,最大值为taxpaynonoperexp(应交税费/营业外支出),36.11%,整体均处于较低水平,交易费用对因子组合收益影响较小。 对于因子IC,均值最高的为undpromonecap(未分配利润/货币资金)、undprocashrec(未分配利润/购买商品、接受劳务支付的现金)、undprosdexp(未分配利润/销售费用),分别为4.743%、4.591%、4.479%,且均是显著的;负向因子中表现最好的是empaymonecap(应付职工薪酬/货币资金)、fassetinvent(固定资产/存货)、totliabcashrec(负债合计/购买商品、接受劳务支付的现金),IC均值分别为-4.285%、-4.065%、-4.002%。部分因子IC均值较低,有效性较差。 ![]() 图 35 : 因子IC分布 ![]() ![]() 表13中给出的是相对中证500年化超额最高的5个因子,分别是fassetsdexp(固定资产/销售费用)、assetsdexp(资产总计/销售费用)、totliabsdexp(负债合计/销售费用)、undpronoperrev(未分配利润/营业外收入)、equitysdexp(所有者权益合计/销售费用);图36至图41给出的是前3个因子的分组净值走势和超额收益及最大回撤情况。下面进行分别说明。 fassetsdexp年化收益最高,为17.73%。undpronoperrev波动率最小,其次是equitysdexp。undpronoperrev最大回撤最小,为19.70%,整体均处于较高水平;fassetsdexp因子Sharpe比最高,为1.351;其余4个因子也整体处于相似水平。从分组净值走势来看,表现最好的3个因子整体收益也较为接近,多头收益表现较好。例如fassetsdexp因子G1-G10组年化收益分别为0.98%、-0.56%、-1.08%、1.13%、0.87%、3.90%、3.97%、7.92%、13.08%、19.20%,整体线性关系较好。 相对中证500,2017年之前多头组合多数时间可以获取超额收益,最大回撤也较小;2017年持续跑输,最大回撤持续保持高位;2018年之后组合表现有所回升。3个因子的超额收益走势及最大回撤时点也保持很高的相关性。 ![]() ![]() ![]() ![]() 6. %D(X)-%D(Y) 图42和图43中给出了因子多头和空头组合的单边月均换手率情况;图44给出了因子IC均值的分布情况;表14给出了部分因子的IC均值及对应T值。下面分别进行说明 |