• QQ空间
  • 回复
  • 收藏

【宽客策略】常见量化投资策略

gyshssl 数据策略 2020-4-13 22:15 159146人围观

量化交易 是指借助现代统计学和数学的方法,利用[计算机技术来进行交易的证券投资方式。量化交易从庞大的历史数据中海选能带来超额**益的多种“大概率”事件以制定策略,用数量模型验证及固化这些规律和策略,然后严格执行已固化的策略来指导投资,以求获得可以持续的、稳定且高于平均**益的超额回报。
量化投资模型只是一种工具、一种方法、一种手段,能实现成熟而有效的投资理念,需要不断根据投资理念的变化、市场状况的变化而进行修正、改善和优化,换而言之,有效的模型建立在适应市场环境的有效投资思想上。量化投资不是靠一个投资模型就能永远赚钱,而且也不是使用一个模型就能解决一切问题,更不是一个模型就能胜任任何市场状况。
量化投资策略以正确的投资理念为根本,通过各种因素的分析,以全市场的广度、多维度的深度视角扫描投资机会。相比于被动型投资策略而言,量化投资更偏向于主动投资。而相比于传统的基本面和技术分析主动投资方式而言,因为利用了计算机技术从而更高效、更有执行力。此外, 传统的主观定性投资大部分时间是在预测市场的方向,例如寻找可能翻倍的股票;而量化投资策略大部分精力花在分析套利机会,例如哪里是估值洼地,哪一个品种被低估了,买入低估的,**出高估的。
量化投资分为:阿尔法策略、低风险套利、统计套利、程序化CTA、高频交易等。
量化投资从本质上讲是通过研究各个因素与未来**益之间的关系,试图寻找较大概率获胜的机会。通常而言需要综合考虑资产的鉴别(个股选择、行业配置、资产配置等)、交易(包括择时)和风控(包括对风险**益的平衡等〕等方面因素,寻找到成功概率最大的投资组合,达到**益最大化。因此,其研究内容囊括了:量化选股、量化择时、股指期货套利、商品期货套利、统计套利、期权套利、算法交易、ETF/LOF套利、高频交易等各个方面。股票市场的量化交易的核心投资思想包括宏观周期、市场结构、估值、成长、盈利质量、分析师盈利预测、市场情绪等多个角度。
综上所述,量化投资的主要思想是挖掘数据的变化背后的信息。如果数据永远不会改变那么就没有信息。价格数据的变化反应并包含了信息,可以认为每个数据都是一个因子表达式,其背后也对应了一个假设或者投资模式。例如:**盘价close这个因子表达式,背后的假设就是股价越高未来**益越大,代表了高价股赚钱的一种投资模式。由此衍生出一种投资策略就是买高价股,**低价股。我们将这种策略/因子表达式也称为Alpha。
一个非常复杂的系统会表现出某种程度的可预测性。市场不断诞生有效的alpha(投资模式)并随着资金的介入而逐渐缩小,直到其逐渐失效。但这一过程将在市场上引入/创造其它的模式,从而诞生新的alpha。
Alpha的典型来源如下:
  • 价格/成交量
  • 基本面
  • 宏观数据
  • 文本:如期刊、新闻、会议记录、社交媒体信息
每个回报来源都来自一个风险源,因此任何投资组合都可以被看作是风险的组合。
理想的投资组合将保持对任何一个广为人知的风险因素(Beta)的零负荷,以及对他所能发现的尽可能多的未知因素(Alpha)的非零负载。而搜索新alpha的过程中,需要不断拷证alpha的稀缺性/背后的逻辑/规模和持久性。
Alpha的研究过程
1、开发Alpha
阿尔法逻辑→数据形式的信息→想法→数学表达式→应用操作→最终稳健的α→转换为金融工具中的头寸→检查历史损益,其他性能度量(信息比、周转率、回撤等)。
2、检验Alpha
检查alpha的健壮性主要考察:
  • 高样本内信息比
  • 良好的样本外信息比
  • 最大回撤、回撤时间等方面
  • 每日成交量,用来衡量调整投资组合的速度
  • 总**益/交易总额,用来衡量每交易1元钱所得的利润
一个好的alpha应该尽可能地分布在尽可能多的行业上,而不是过于集中。此外分层回测也是检验alpha的一个好方法,可以辅助我们查看alpha的头部或者尾部的预测能力。如果多空**益大部分来源于头部分组的盈利,那么如果头部分组**益下降就可能对此阿尔法的性能造成较大的影响。
但是,我们不应该仅仅根据历史测试模拟结果来做判断。原因有以下几点:
  • 当前的市场与历史时期不一样,市场规则可以改变,投资主体、新理论、新技术也会发生变化。因此, 测试周期越长越好,这是不一定正确的 。
  • 模拟假设可能不是真实的 。交易过程可能会影响市场,需要支付交易成本或佣金。在评估模拟结果时,对这些数字的合理估计至关重要。
  • 可能的前瞻性偏见 。 如果你看到有人追随趋势并获利,那么你可以测试趋势跟踪模型,也许你可以得到一个很好的历史模拟。 没有更好的理解,你可能会或可能不会在未来的投资中获利。
  • 过度优化 。 有时候会看到很好的模拟结果,可能只是随机误差或噪声,但没有预测能力。在更长的历史中测试模型,在更广泛的市场中测试模型,都有助于降低过度拟合的风险。不幸的是,在现实世界中,存在着限制。没有一个系统的方法来提高夏普比率。要么没有足够长的可用历史数据,要么市场发生了变化,历史也发生了变化。与机器学习模型类似,如果alpha的参数较少,模型对参数变化的敏感性较低,这有助于降低过度拟合的风险。
敏感性测试和显着性测试是很重要的。 一个好的α信号应该对噪声不敏感。测试稳健性的最常用技术包括对不同时间段、不同持续时间、随机数据子集、每个股票部门等的数据进行测试,我们对那些对这些输入变化不敏感的信号更有信心。另一方面,每个输入数据都应该对结果作出重大贡献。检验显着性的最简单方法是删除一个输入变量,并检查结果是否有显着变化。如果每个输入变量都做出了重大贡献,则我们更好地信任信号。
此外, 当样本外Alpha的数量增加时,样本外的测试也可能有偏差 。
3、改进Alpha
  • 去除原始数据的异常值
  • 改变数据表达方式
例如: 将一个绝对数量含义的变量转化为当前值与其历史值的比值,用来表示该变量的变动
  • 数据的中性化处理
通常市场风险和行业风险是最大的风险,我们通过中性化保证每个行业内的alpha总和为0,同时保证全市场的所有股票alpha的总和为0,这样可以有效消除市场风险和行业风险从而降低最大回撤,提高信息比率。此外通过采用alpha值的rank可以进一步提高信息比率。如果换手率偏高,可以通过利用衰变(时间尺度上的长周期均匀化)在一个时间窗口内平均这个alpha。
  • 提高alpha的鲁棒性
排序:使用因子的排序将原始alpha转换到[0,1]区间
分位数:使用因子分位数
Fisher变换:将原始alpha转换为近似服从正态分布。
Z变换:将原始alpha转化为零均值和单位标准差的分布。
4、Alpha研究中的算法技术
AdaBoost
在α研究中,我们经常处理弱分类器/预测器,通过对弱学习者学习适当的加权函数,可以在很多情况下利用机器学习的概念,从几个弱学习者中培养出一个强学习者。
数字滤波
α研究还涉及时间序列数据的处理。从数字信号处理中提取的时间序列可以有效地去噪时间序列数据,并将时间序列分解为趋势和周期分量。 最简单和最广泛使用的数字滤波器是简单的移动平均线;数字滤波的另一个流行应用是将时间序列分解为趋势和周期分量。趋势提取涉及抑制高频分量(低通滤波),而周期提取涉及抑制低频分量(高通滤波)。
特征提取
α研究的另一种感兴趣的技术是特征提取。 诸如主成分分析(PCA)/聚类之类的算法有助于减小特征空间的维数。

路过

雷人

握手

鲜花

鸡蛋
来自: bigquant
关注微信