• QQ空间
  • 回复
  • 收藏

宽客量化投资策略那些事--概念及策略

KUO 数据策略 2020-3-8 11:13 303502人围观

全球量化策略发展已经有超过40年的历史,而国内量化策略发展其实页超过十年化。但是国内量化投资快速发展仅仅是近几年的事情,因为很多量化策略需要一些工具配合才能实现,而以前国内适合量化策略及进行风险对冲的工具是比较少的,而近几年随着国内衍生品的发展,为量化投资提供大量基础配件。2010年之后,中国的投资行业中一颗新的种子正在慢慢生根发芽——随着股指期货产品上市,量化交易真正走入了广大投资人的视野。然而回到2020年的当下,可以说量化投资领域仍然是小众玩家的游乐场,即使是已经购买量化投资产品的绝大部分人也并不十分了解这个领域,并且通常会有以下三个困惑:1、量化投资到底在干什么?2、怎样识别优质的量化投资?3、量化投资与主观投资有什么区别?

这三个问题涉及非常多的数学、金融学知识,如果想通过自学的方式理解这些问题,可以说即使你是TOP 1%的天才,没个三五年的苦修难以形成自己的见地。但任何表象之上都有引导行为的逻辑存在,今天我们试着先用简单的语言让大家明白上面三个问题的核心逻辑,之后我们还会带来一些即使在量化投资领域内部,也并不广为人知的结论。

量化投资到底在干什么?

首先要说明的一点,量化投资绝不是简单的数据统计工作。曾经2015年的时候有位朋友告诉我他认识的一位量化投资人最近业绩平平,这位投资人的方法是:筛选市场中市盈率低于20倍,同时年盈利增长同比大于20%的企业并买入。大致看起来这个策略貌似挺有道理,毕竟有种低位捡漏的感觉,同时这个策略也仿佛需要“量化”的分析方法。但这种投资是不能被称作量化投资的,最核心的原因并不是这个策略过于简单,而是并没有运用数量分析去验证投资结果。这个例子里的投资人仅仅使用了数量方法收集信息(筛选股票),但并没有验证过投资结果,如果他有过分析就一定会知道在13-15年这三年里,这样的选股策略完全无法战胜市场。

当然真正的量化投资策略会比这个例子复杂的多,同时验证结果也并不一定能够确保策略有效。但上面的例子从归纳的角度说明了量化投资的本质:运用数量方法获取、分析信息,形成投资策略,再运用数量方法验证策略的表现。实际运作中这并不是一个单向的链条,而常常是一个无尽的循环——策略需要不断迭代(说的高端点儿,其实就是破房子需要不断的翻新不然就会淋雨)。

当前流行的量化策略主要分为三类:1、股票超额收益类策略;2、期货CTA策略;3、衍生品策略。

1、股票超额收益类策略

很长时间以来,A股市场评价投资好坏的标准都是——你是不是赚钱了。其实这是非常不成熟的标准,任何投资者都能购买代表大盘收益的ETF基金,市场涨了谁都能赚钱,但是赚的比市场多,才说明你的存在有价值。同理市场跌了20%,你只跌了5%,虽然亏了但是还是说明你厉害。事实上对于99%投资者(最后1%有些特殊我们之后会说明),决定你是否有股票投资能力的唯一标准就是你买的股票能否在同期跑赢大盘。

有的投资者这时候会说,你看我虽然2015年上半年只赚了25%,没跑赢同期大盘,但是股灾前精准空仓,一年下来还不是比大盘跑得好多了?这里要搞清楚他的收益被分成了两部分:选股收益和择时收益,选股收益是负的,但择时赚了钱。对于这种投资者我会说,那你买个大盘ETF,6月精准平仓岂不是能赚一倍?比自己辛苦买股票好太多了。更重要的是,对于绝大部分投资者,即使是专业基金经理,择时能力强是一种幻觉,越是优秀的投资人对这个问题的认识越深刻。确实有能够通过择时较为稳定盈利的策略,但极其少见,我们也会在下文中有所介绍。总而言之,对于绝大数人(对!说的就是你),不要考虑你的择时能力,选股能力是你作为人类价值的唯一证明,如果屡战屡败,还请直接移步ETF和股指期货,毕竟买股指期货平均每年能稳定跑赢大盘10个点,已经超过95%散户3年的平均投资业绩了。

因此随着股指期货和ETF品种越来越丰富,市场对于投资质量的评价也越来越成熟:能够稳定战胜市场的投资者才是最优秀的。算一笔账:如果每年跑赢市场30%,10年之后如果市场点位没变,你赚了多少?答案是惊人的12.8倍,对的你没看错,累计收益率1278%。恰好上证综指这10年来收益基本是0,再看看10年翻倍的基金,十年100%收益意味着平均每年跑赢市场7%——这类基金本身产生的投资价值,仅仅略微高于买理财(以前理财收益更高哦)。这样一来我们就理解了股票超额收益的价值,能战胜市场,不管市场涨跌,我迟早是大赢家。

具体说来股票超额收益类策略有两种形式:1、指数增强策略,目的就是能战胜市场;2、市场中性类策略,通过运用股指期货等等金融工具,对冲掉市场本身的涨跌,把指数增强策略的超额收益转化成绝对收益。接下来我们来看看超额收益是怎样产生的。

说到超额收益,大部分人第一反应就是多因子策略:股票的收益可以解释为很多因子线性相加的结果,通过捕捉具有超额收益的因子获取跑赢市场的能力。这么一开头,想要说清楚这个事情一下就变得非常复杂也非常不负责任。可以说,大多学过多因子理论的投资者仅仅从数学角度理解了这个事情,因子到底是什么?因子有效这一统计规律背后的逻辑是什么?

因子体系就是投资者结构

是的,任何因子表现的根源都是某一类相似投资者的行为,当喜欢以同样原因选股的投资者形成一定规模后,就形成了一个新的因子。

举个例子:有提前消息的投资者会买入将要被并购的上市企业,这些企业大部分是“壳公司”;觉得低价股便宜的散户投资者会买入同类型上市公司中价格最低的股票;了解DCF定价理论的学术投资者会发现企业破产有政府兜底的情况下价格被低估,因此会买入垃圾股;观察到上述投资者赚钱后进行统计分析的量化投资者会发现买小股票赚钱。所有这些投资者的行为,形成了“小市值”这个因子的收益来源。

在2016年四季度之前,小市值这个因子表现出了非常强劲的超额收益,只买最小的50只股票,在2010-2015年间能每年跑赢大盘50%以上。在整个A股市场中,市值小的企业也普遍表现出更高的收益,以至于我们说,小市值因子在2017年前是一个阿尔法因子,也就是稳定的超额收益因子,上述的那些投资者们也赚的盆满钵满。

现在我们来改变两个条件:

企业上市IPO制度变成注册制,需要上市的企业不用花太长时间排队;政府不再为企业信用兜底,鼓励市场优胜劣汰——直接的结果是垃圾上市公司真的可能变成垃圾。

这时候上述的投资者收益会发生怎样的变化呢?

有消息的投资者依旧赚的盆满钵满,因为不管怎样企业被收购后还是疯狂上涨;觉得低价股便宜的散户手中的股价越来越便宜;了解DCF定价理论的学术投资者在看清事实后清仓离场;通过统计得出小股票收益高的投资者亏得每天关灯吃面,小市值因子的整体表现变得波动起伏,整体向下。

可以说,上述所有投资者中,真正能够持续赚钱的是有消息的投资者,他们能赚钱和小市值没半点关系,只不过结果恰好符合;真正理解为什么赚钱的是发现政府兜底导致定价被低估的学术投资者,因为理解所以知道当支撑因子的背后逻辑发生变化后,因子表现不复当年而及时离场;其他两类在市场没有发生变化的时候,也能快乐的赚钱,一旦导致因子有效的根本逻辑发生了变化,快乐就变成了痛苦。

现在我们更理解小市值因子了,它是因为不同原因追逐小市值股票的投资者共同行为导致的统计特征。但是统计学永远是一种妥协,是人类无法理解背后逻辑而发明的数学工具,当逻辑发生改变,统计不再具有意义。或者我们说,小市值这个因子还有很多可以改进的空间,通过更深入的挖掘价格之外的信息,或许能通过数量方法找到那些真正应该具有超额收益的小市值上市企业。

所以什么是多因子体系?

多因子体系希望能够将整个市场中所有的投资者进行分类,了解不同投资者的收益特征,并挖掘出那些能够持续战胜市场,或盈利规律性很强的投资者群体,再进行跟踪。毕竟获取提前信息是非常困难也基本上并不合规的,统计方法是大部分时候人类寻找真理的唯一途径。

当然投资者在不同观察期限内表现出的规律性也是完全不同的,比如投资者追逐市值、成长/价值股、高盈利增长等因子的持有周期相对较长;而涨停板、十字星、高换手率等因子往往只影响1到2个交易日;甚至还有更短的,比如盘内闪崩,涨停打开等等现象也有投资者关注,其影响周期甚至只有几分钟。所有这些特征都有特定的投资者群体进行追逐,其中持续稳定的追逐行为,形成了能够带来确定收益的因子,而这种持续稳定追逐的行为,一般都有背后的逻辑原因。但大部分因子的表现并不一直优秀,或者说因子本身仅仅捕捉到了表象而非背后的逻辑,需要更深入的解析,这也是机器学习等高级统计学工具更多运用到A股投资中的重要原因。

你听说过的多因子策略、多因子机器学习策略、高频股票交易策略等等都脱离不开这个体系。

2、期货CTA类策略

CTA的意思是商品程序化交易,说白了就是在期货市场运用数量模型建立交易策略,再通过计算机自动化的执行这一交易策略——其实所有量化投资,不管股票、期货还是其他衍生品,都是这么做的,仅仅是交易品种不同。所以如果你对CTA策略的理解足够深入,你会发现刚才讲述的股票超额类收益策略其实已经说清楚了所有量化策略的实际运行方式,策略开发方法。但是需要你确实足够了解量化投资才能看清这一事实。

为了大家更快的对CTA策略形成理解,我们还是把这一策略的表象进行大致的分类:趋势策略、反转策略、非线性预测策略。

趋势策略很容易理解,当市场上涨,我就买入;市场下跌,我就卖出。为了深入理解趋势策略如何盈利,以及哪些因素会影响趋势策略的表现,我们还是习惯性的举个栗子。

假设大盘从3000点一路上涨到4000点,期间从未下跌。在这个过程中一个严格贯彻追涨杀跌的CTA策略大概能赚1000点——太爽啦。

当然这种市场是不可能存在的,我们考虑一个略微真实点儿的A股涨跌的情况:每秒钟,市场都在不断的波动,上涨或者下跌,但是每天的收盘价都是上涨的。这时候,一个随时进行追涨杀跌的策略会亏得倾家荡产,为什么?因为每秒钟的不断波动会导致这个投资者不断损失交易费用——前一秒在做多,下一秒可能就要做空啦。同时实际交易中你不可能永远按照你希望的价格成交,这会导致滑点而产生额外的交易成本。不管你如何精准的捕捉到了这1000点指数上涨产生的收益,但一天就有60*60*4=14400秒,就算每秒钟的交易只让你损失万分之一的收益,一天时间你就有可能把本金亏光!

但是一个懒惰的,一天执行一次追涨杀跌的趋势策略会获得和之前差不多的盈利,因为每天他只在收盘时判断第二天的交易策略——结果就是完全不用交易,持有一路做多。这么说来难道趋势追的慢是一件好事么?我们再看一个更真实点的例子。

假设市场永远处于这样一个循环中:一周每天上涨,一周每天下跌,然后再上涨、再下跌… 这时候我们来看看日频率和周频率的趋势交易者的盈亏情况是怎样的:日频率交易者会在每周一亏钱,但其余4天都盈利,因为周五的趋势永远和周一相反;周频率交易者每周都亏钱,因为相邻两周的趋势永远相反——这一次交易更慢的策略亏到姥姥家了。

通过这两个例子我们发现了影响趋势策略盈利的关键问题:策略的灵敏度要和市场的波动相匹配。太快了捕捉的收益会被交易成本大幅削弱,太慢了两边扇耳光,啪啪啪啪啪啪。事实上大部分趋势策略的灵敏度不会特别高,这导致一个大家熟悉的现象,市场波动太低的时候这类CTA策略不赚钱,大行情来了才会表现的非常优秀。

反转策略最普遍的表现形式就是统计套利类策略。那统计套利是什么意思呢?通过观察过去的历史,我们发现,两类具有一定相似性的资产价格偏离可以用一种分布规律进行描述,大部分时候是正态分布。因此偏离较大的时候这两者的价格回归的概率变大,我们赚的是回归的钱。

老样子举个栗子:一个养猪的农户一般也会养鸡,因此鸡和猪的供给量是有一定关系的。根据统计我们发现,一般而言鸡肉和猪肉价格涨跌的偏离在5%以内,因此如果一点时间鸡肉涨了5%但猪肉价格没变,我们就做空鸡肉价格,做多猪肉价格,希望他们的价格偏离回归,进而获得盈利。

这种统计套利策略在大部分时间,能够为投资人带来收益,因为世界的改变是缓慢或偶然的。两类资产之所以相似的原因,大部分时候能够保持稳定,然而这种导致他们价格相关的逻辑如果发生了变化(这句话听起来熟悉么),统计将没有意义。

还是上面那个例子:如果某一天科学家发现,鸡的打鸣行为,会降低猪的养殖速度50%。,这一统计规律就完蛋了,鸡和猪的养殖会完全隔离开来。这时候依赖历史数据进行统计套利的投资者将痛苦的发现,概率上低于1%的事件不断发生,最后让他们爆仓离场。(记得那几位屡次爆仓的经济学诺贝尔奖获得者么)

通过上面两个例子我们发现了影响反转策略盈利的关键问题:影响市场定价的根本逻辑才是反转策略得以持续盈利的基础。

那么大家有没有发现,反转策略在逻辑有效性上和股票超额收益策略有些类似,但又和趋势类策略完全不同?这也导致了它们的业绩表现形式有明显的区别:一个优秀的超额收益类策略和反转策略都能在大部分时间内保持稳定的盈利能力,但是一旦逻辑发生变化,会发生大幅的回撤;而趋势类策略大部分时间表现平平,偶尔却能一鸣惊人。

非线性预测策略听起来有种玄之又玄的感觉,但实际上这类策略的本质仍然是统计学,通过更复杂的统计学,去寻找不容易被发现的复杂规律,机器学习类策略大都属于此类。这些策略有效的基础高度依赖市场投资者结构的稳定。当整个市场“性格”稳定的时候,这类策略能表现出惊人的盈利能力,但当“性格”,也就是投资者结构改变时,策略挖掘的深度就会成为影响策略表现的关键因素。能够识别的逻辑越基础,投资者结构对策略的影响就越小,但实际上现有的大部分机器学习策略并不能真正深刻的挖掘逻辑。

3、衍生品交易策略

就目前的中国市场来看,股指期权是唯一可交易的标准化衍生品。在这里我们不详细介绍期权是什么,因为涉及到太多的数学和金融学知识,之后也会有专题给大家做详尽的教学。我们暂时只需要搞清楚一点:绝大多数股指期权策略,本质上都是波动率的CTA策略。波动率的趋势,反转现象是大部分期权策略得以盈利的根本。

这里自然要说明下什么是波动率。波动率可以用数学解释,也可以用大家常用的概念:风险来表述,但更准确的来说,波动率是市场未来趋势的不确定性可能带来的风险。所以波动率上涨,就是市场未来不确定性带来的风险变大,反之亦然。

市场中的波动率分为两种:实现波动率和隐含波动率。什么意思呢,一个是从市场实际表现来看,不确定性有多强;一个是当前投资者对未来不确定性的预期。大部分时候,投资者对风险的预期要高于最后的实际结果,而且对于越极端的情况,这种预期的偏离越大。举个例子,市场会不会在未来一个月上涨20%?从历史和实际情况来看,这种事情发生的概率微乎其微,但你随便询问身边的投资者时,可能很多人会犹豫一下,表示也有些可能——“有些可能”体现在价格上的是远远高于实际发生概率的溢价。

这也是金融市场中最常见的一种现象:不管我多么担忧,事后一看,市场还是老样子,没了你,地球一样转。

所以期权策略赚的最多的钱,就是这种预期对实际情况的高估,比如市场短期剧烈上涨或下跌后波动率上涨到正常时候的3倍以上,这时候做空波动率,并对冲掉其他风险后,投资者大概率能在不远的未来获得颇为丰厚的收益。

那期权波动率交易有怎样的特点呢?从收益来源上来看,期权策略与反转类策略非常相似,赚的都是非理性最终回归理性的钱。但期权类策略盈利的确定性更强,因为市场回归平淡是一定会发生的事情,而两种相似资产确实会因为世界的改变不再相似,再相爱的人也可能分离,变老才是不变的真理。

怎样识别优质的量化投资策略

经过前面的大致介绍,我们可以较为清晰的识别策略的类型了。更重要的是,我们知道了不同策略的盈利基础是什么。

在这里我们使用一张图表总结这些知识:


策略

业绩特征

策略弱点

超额收益(指数增强/中性产品)

大部分时候能持续稳定盈利,短期回撤后的净值回复能力较强,但当投资者结构发生改变后可能失效

投资者结构变化

CTA 非线性预测

CTA 反转

CTA 趋势

大部分时候盈利能力相较其他策略偏弱,但对大行情的捕捉能力较强

市场波动太小

衍生品(股指期权)

大部分时候能持续稳定盈利,短期回撤后的净值回复能力较强,几乎不会失效但需要控制整体风险

短期市场异常

那怎么判断同类策略中哪些更加优秀呢?数据和投资逻辑都给给我们有用的线索。

数据上:

高夏普比率(历史确定性较高)

高换手率(越短期的策略越不依赖市场的宏观环境)

相对较小的管理规模(降低冲击成本)

更丰富的策略库(投资更为分散,对特殊情况的风险暴露较小)

逻辑上:

是否有独特的策略(新策略的持续性一般而言更好,策略内部竞争压力也较小)

数学及IT技术背景是否优秀(增加深度挖掘的能力,降低过度挖掘的风险)

新策略的开发速度如何(保持领先,降低策略失效的代价)

对因子失效的判断能力和处理方法是否优秀

普遍而言,大部分量化投资人最为欠缺的是对策略失效的判断能力。在这里我们提供一种思路和解决方法:当发现市场某一范围内的投资者结构可能发生较大变化时,暂停这个范围内的量化投资行为。例如:2019年下半年开始北上资金大幅流入科技股,这一行为的持续性是量化投资者无法判断的,否则这个事件就成为了机会而不是风险。在此情况下,最好的应对方式是降低基于中证500指数的超额收益策略权重,因为大量的资金持续流入科技股会改变中小板和成长股的投资者结构,进而导致大部分策略失效。此时应该使用更为保守的中证500、1000ETF替代选股策略,确保不会吃亏,依赖其他范围内的策略获利。

如果你的投资范围较为广泛,这种做法的代价非常小,短期离场至少不会产生负收益,其他策略更可能稳定的盈利。但如果你的投资比较集中,你会非常难受,继续持有还是离场,都是困难的选择。因此分散策略投资无论如何都是必要的。

事实上,单纯的趋势和反转策略几乎已经销声匿迹了,所有CTA策略都应该同多因子策略一样形成多种策略的混合,这样既可以相互弥补短板,也可以一定程度上降低策略的整体风险。

主观投资与量化投资有什么区别?

在很多投资者眼中,主观投资与量化投资完全不同,其实这种认知也是非常肤浅的。

本质上,主观与量化投资都包含相同的两个步骤:1、观察历史;2、预测未来。

如果就同百年孤独中所说的那样,“history always repeats itself”,那么主观投资对量化投资并没有任何优势。如果同样的历史总在重演,最优秀的投资策略就应当是对过去的完美拟合,在数学、计算机等丰富的工具面前,人类的数据搜集能力和分析能力捉襟见肘,借助各类前沿技术而生的量化投资在主观投资者面前就如同武装到牙齿的现代士兵和石器时代的穴居人。

但这种看法正确么?至少从最近两年的投资结果来看,主观投资并没有真正落后量化投资,2019年公募基金的亮眼业绩表现超越了大部分私募对冲基金,仿佛量化与主观的差距并没有想象中那么显著。这是因为未来并不一定是历史的重演。

当前金融领域的计算机技术并不像绝大多数人想象的那般无所不能,实际上统计学是金融IT人士唯一擅长的武器。人类之所以能够立足万物之上,最核心的能力是逻辑思考能力,这恰恰是量化工具在应对世界变化的时候最欠缺的能力。绝大多数统计学模型对未来的预测无法脱离“历史重演”这一唯一假设,未曾发生过的事情绝对不会出现在量化模型的预测结果中,所以一旦世界发生明显的变革,主观投资反而能够更快的适应,因为人的真正价值是逻辑推理能力。

或者我们说,至少在当前的技术水平下,如果不能使用量化手段去描述最基本的逻辑原理,无法让博弈论等数学理论合理的应用在金融投资中,那么主观投资并没有丢失所有的优势。但是我们也要明白一个道理,世界的改变是缓慢或突然的,缓慢占据了绝大部分时光,这意味着在更多的时间里,人的分析无法战胜统计学,因为世界的变化太小了,思维的火花并不能弥补巨大的数据搜集和分析能力差距,这也和过去5年或更长时间中我们观察到的投资结果相符合——平淡的市场中量化投资更有优势。

最后我们回到文章的正题:主观投资与量化投资怎么选?一个简单的结论是:在快速变化的领域选择分散的主观投资;在相对稳定的领域拥抱量化投资。至少这是当前技术水平下最为合理的选择。


路过

雷人

握手

鲜花

鸡蛋
关注微信