章晓珏

朱雀基金量化组负责人

哥伦比亚大学金融数学硕士,上海财经大学金融学士

4年证券从业经验,先后任职于中国国际金融股份有限公司,朱雀股权投资管理有限公司。现负责朱雀基金量化策略开发与产品管理。

CTA又叫做管理期货策略,管理人通过对期货标的的走势做出判断,从而进行做多、做空或多空双向的操作。最终的目的是赚取绝对收益。我们今天要介绍的是量化CTA策略,主要基于量化的手段来建立交易模型,并根据模型所产生的信号进行交易。


量化CTA策略:从传统趋势追踪策略到价格预测型策略

目前国内可以投资的期货品种主要是股指期货、大宗商品期货和国债期货三大类。

CTA的投资策略多种多样,最经典的就是捕捉价格动量的趋势策略,这几年伴随机器学习的发展又开发出基于模式识别的价格预测型策略,这两类策略我们后面会展开来讲。另外一些套利策略,包括跨期套利、期货与现货之间的期现套利、还有跨品种套利等等也属于CTA的范畴。

最早也是最经典的量化CTA其实用的是“追涨杀跌”的趋势追踪策略,比较有代表性的有海龟交易体系。趋势策略是基于一个非常朴素的思想,就是价格的上涨或者下跌具有持续性,于是就跟随价格去做多或者做空。在这个基础上,再通过品种的分散化,加入止损逻辑等手段来提高整个交易模型的稳健性。

为什么这种“追涨杀跌”的朴素逻辑可以赚钱,或者说为什么价格的上涨或者下跌会有持续性?行为金融学提供了一个阐释的角度。

投资者对信息的反应不足,在影响价格的信息到来后,因为投资者无法立即消化信息,就会导致价格无法充分、及时地对消息做出反应,而是需要一段时间来持续地把价格调整到应有的水平,这就引起了价格的持续上涨或者下跌。

另外一个理论解释是,在行为金融学的前景理论下,投资者亏1个点所感受到的痛苦程度比他赚1个点所带来的愉悦要更大。而在期货交易中,作为对手盘的多空双方一定是同时有一方盈利而另一方亏损。这就导致了在价格发生大幅波动的时候,止损盘会大于止盈盘,从而推动价格进一步向相同的方向移动。


量化CTA策略的新方向:机器学习

伴随机器学习浪潮的兴起,受益于GPU运算的提速、以及tensorflow等深度学习框架的开源,我们也在CTA模型的开发上进行了创新。所谓的机器学习CTA,其实是用机器学习来做价格预测。和大部分量化策略一样,机器学习策略盈利的假设是“历史会重演”。这里价格模式的重复性来自投资者根深蒂固的非理性交易心理,包括损失厌恶、处置效应、近期偏好等。这些交易心理难以在短时间内被戒除,从而导致某些非理性交易行为的重复发生,最终导致价格模式的重复出现。而机器学习模型就可以通过对历史数据的学习来寻找价格模式的规律,并且把学到的规模用于实盘的价格预测。

机器学习策略的优势,在于人脑所不能胜任的对历史数据的处理能力,并且机器学习为我们提供了一个非线性的视角,可以帮助我们从一个更高的维度来挖掘一些更复杂的规律。另外,因为机器学习是一个不断滚动训练的过程,所以这类策略有一定的自适应性,在市场环境发生变化后,模型可以基于对新数据的学习来逐渐适应市场的变化。

这两年做机器学习的机构越来越多了,我们也在思考相比于同行我们的优势在哪里?答案是在于对细节的充分考量。机器学习并不是说从网上下载一个开源的包,然后把数据直接丢到里面去训练那么简单。这其中包含了从数据预处理,到特征工程,到模型训练一系列的流程,里面的每一个环节其实都有很多细节问题需要考虑,比如怎么搭建一个非线性的特征工程,也比如样本数据的划分、怎么去给样本打标签、怎么预防过度拟合等等。最终决定策略效果的,其实就是这一些细节问题。我们从2016年就开始研究机器学习这个方向,在这些细节问题上,已经进行了充分的考量和测试。这上面我们认为自己是做得比较好的。

某些情况下,非线性模型可以实现比线性模型更好的分类/拟合效果


朱雀CTA投资理念:三个“分散”,追求绝对回报

我们的CTA投资理念,用一个词来概括就是“分散化”。这包括了交易品种的分散化,交易周期的分散化和交易逻辑的分散化三个方面。

首先,在CTA策略上,品种分散化可以非常有效地提高策略夏普比率,因为大宗商品各品种间的异质性非常强。股票类资产虽然个股有alpha,但所有股票还是会同时受到大盘beta的影响,拉长周期来看,不同股票间还是同涨同跌的正相关关系。而大宗商品不同。这张表格展示了目前流动性比较好的商品品种之间的相关性,可以看到大多数商品品种间的相关性非常低甚至是负相关。因此,品种分散化在期货组合的层面,可以更加有效的降低整个组合的波动率,也就是风险。

来源:Wind,朱雀基金 

其次,交易周期的分散化,也就是不同时间频率的日内策略、日间策略、周度策略互相配合,从而捕捉不同时间维度上的价格模式规律。下面这张图是我们的实盘测算结果。柱状图左边是单一周期的隔夜策略的效果,右边是加入日内策略后的组合效果。可以看到,在做了交易周期的分散化后,策略不论是胜率、收益回撤比,还是夏普都得到了显著的提升。

来源:朱雀基金 

最后,是交易逻辑的分散化,包括不同类型策略的叠加。2019年10月份的时候大家对CTA的集体亏损讨论的比较多。导致这个情况的原因有很多,比如股指波动率的下降、商品截面因子的反转,还有一些外部事件比如沙特阿美的影响。我们自己的策略虽然没有回撤,但我们也在思考。因为CTA策略赚的其实是波动率和指数gamma的beta的钱,换句话说,在波动率下降的时候CTA是有回撤风险的。那么一个自然的想法就是,我们是不是可以在组合里加入一些波动率交易,这样就可以在波动率下降、CTA回撤的时候通过做空波动率来对冲。另一个思路就是是否可以增加一些接近绝对收益的策略,从而在CTA主策略回撤或者横盘的时候通过套利策略来做收益增厚

来源:朱雀基金

事实上,在CTA里做这种策略的分散叠加,是有天然优势的。因为期货是采用的保证金交易,资金利用率非常高,因此新策略的加入不会挤占原有策略的资金。举个例子,比如1000万的产品,我们只需要放200万的钱在保证金账户里,就可以交易1000万的期货合约价值,剩下的800万是做现金管理的。如果要做策略分散化的话,只需要从这800万里切一部分资金出来即可,在加入新策略的同时可以确保原有策略的仓位敞口不受影响。因此,套利及期权策略的加入可以直接起到纯收益增厚的作用,而不用牺牲原有主策略本身的仓位和收益,换句话说,策略组合后的收益呈叠加关系,而非求平均的关系。

所以,我们提倡品种、周期及策略的充分分散,从而使得整个策略更加稳健,并减少净值对波动率和趋势性的依赖,在此基础上来追求绝对回报。


CTA的未来趋势展望

CTA的未来发展趋势如何?首先,我们把CTA的整个研究投资过程拆为原始数据获取、因子提取、交易信号产生和交易执行四大块,然后分别来看每一块的发展方向。

第一,原始数据的获取。我们认为相比于模型的改进,一个好的数据源能带来更多的超额收益。在数据上,未来的趋势主要是数据颗粒的精细化和另类数据的开拓。数据颗粒的精细化主要指的是数据频率的提升,从分钟线到tick到level2。更高频的数据源使我们可以更精细地刻画市场上投资者的交易行为,并从中挖掘因子。同时数据频率的提升也给数据的储存和处理提出了更高的要求。

另类数据的开拓,是指在传统的行情数据和财务数据外,寻找新的可以对期货价格起到预判作用的数据源。当投资者利用算法对传统标准化的数据进行充分挖掘后,传统数据所能提供的超额收益会逐渐降低,从而迫使大家转向于更加前瞻的另类数据。比如用环保排污数据来预测钢材产量、各种互联网销售数据、舆情数据等等。这也是我们未来会着重研究的一个方向。

第二,因子的提取。这里涉及到一个因子频率的概念。一般来说,从低频因子到高频因子,因子的夏普逐步提升,但是因子的资金容量是逐步下降的。换句话说,在更高频的领域,因子的盈利能力更好,但机构间竞争也更激烈,更容易形成赢家通吃的局面。传统的因子构建,往往是基于投资经理的经验和逻辑来构建因子,但未来可能会越来越演变成用算法来做因子的挖掘。算法对可以用更快的速度处理更大量的数据,会加速对高频领域因子的挖掘,当夏普更高的高频因子被充分挖掘、资金容量趋于饱和后,因子挖掘会逐步向更低频的领域迁移,在这个过程中,算力是一个非常重要的优势。目前我们的策略为中高频率,未来一方面会继续引入自动算法对该领域因子进行充分的挖掘;另一方面也会在低频基本面因子上加强布局。

第三,交易信号的产生。主要的趋势是机器学习的引入和策略类型的不断丰富,前面已有论述。

第四,交易执行层面,主要是控制交易速度和冲击成本。未来会由简单的时间加权成交等向强化学习进化。


危机中的保护器,资产组合的减震器

至于量化CTA适合什么样的投资者,我们一直强调CTA的配置价值。我们知道,CTA策略也被称为危机策略,因为往往在大熊市的时候,这类策略可以取得非常好的收益。在08年次贷危机的时候,巴克莱CTA基金指数录得了14%的正收益。2018年A股市场低迷的时候,国内的CTA指数也有接近5个点的正收益。

CTA策略往往在市场大幅下跌时盈利

CTA策略与其他类型策略呈低相关性

数据来源:朝阳永续、中信证券 

所以,从配置的角度来说,CTA策略可以在一定程度上抵冲权益资产的下跌。另外,除了权益资产外,CTA和固收还有量化市场中性策略相关性都不是很高,因此配置CTA策略可以分散资产组合的风险


注:本文件非基金宣传推介材料,仅作为本公司旗下基金的客户服务事项之一。

本文件所提供之任何信息仅供阅读者参考,既不构成未来本公司管理之基金进行投资决策之必然依据,亦不构成对阅读者或投资者的任何实质性投资建议或承诺。本公司并不保证本文件所载文字及数据的准确性及完整性,也不对因此导致的任何第三方投资后果承担法律责任。