人工智能打败主观投资?量化投资如何保持竞争力?五大头部量化私募现身说法
何文奇:至少在投资领域,在可预见的未来,人工智能是不可能打败人类的。这个命题不是一个投资问题,是一个科学问题,还可能是一个哲学问题。人工智能是人做的,人工智能投资是人设计的投资方法,现在数据量那么大,光靠人的主观判断,难免受到个人能力的限制。使用人工智能技术,使用机器大量的统计和分析这样的大数据得出一定的结论,在中短期、中高频大量股票的投资上,人工智能是更有优势的。但是,人工智能还没有办法做一些大方向和大策略的判断。
郭学文:量化交易和主观交易各有优劣,量化交易像是检硬币,不断交易重复出现的“小机会”,机器处理数据快,在这方面有明显的优势。而越偏长期投资,就越像PE股权投资,数据量少,没办法通过数据分析找出规律,就更多要靠人为判断。
吴家麒:在我看来,人工智能也好,机器学习也好,只是量化交易的方法论之一,背后的核心还是看使用人的水平高低。我们做过一个统计,A股公募基金里有5年以上的历史 业绩 ,平均超额收益超过15%的基金经理,不到20人,相比量化指数增强策略超额显然低了很多。但是这个就能说明量化投资的投资水平就比做主观来得好?我看也不一定,这个有特定的时间背景,一个方法论好坏的背后还是要看使用方法的人。
叶展:量化投资和人工智能,在某些领域是比人更具有优势的,特别是在处理大量标准化数据方面,会比人更具有效率和优势。但是,在一些高维度的复杂度很高的事情上,还没有达到人类的水平。所以不管是做量化的还是做主观的,都还有很好的发展空间。
人力、算力是量化投资核心竞争力
叶展:随着大量资金涌入量化私募,市场竞争亦在不断加剧,尤其是头部私募之间的比拼,纷纷展开军备竞赛。量化私募如何长期保持竞争优势?
马志宇:在这个行业里,最重要的还是人。要想取得优势,需要加大对投研方面的投入,包括数据、算力的投入,最重要的还是人才的投入。一般会招募两大类人才:
何文奇:想在这样激烈变化的市场中持续保持竞争力,一是要对市场保持敬畏之心。有一本书叫《反原则》,里面提到唯一坚持的原则就是不停地改变,量化投资在国内处于快速发展阶段,有很多策略有效,也有很多策略失效,我们要有敬畏之心。二是要不停去研究,包括人力、算力。人力是很重要的,需要甄别和培训。在投资中,不停地在市场中改进自己的模型、策略和方法,才有可能持续获取收益、获取超额的回报。
郭学文:量化投资有一个特点,就是一个因子被发现时它就开始失效了,因子越好就失效越快,因为更多的资金会去按它来交易。因此,量化研究是没有止境的,必须对市场变化的节奏做出快速反应,也需要不断加大对团队的投入。实际上,与大家的感觉可能不同,量化交易是非常劳动密集型的产业,需要大量的研究员和IT技术投入,小团队是没有太多优势或生存能力的。
吴家麒:为什么要有这样巨大的人力投入?其实核心还是希望能够把整个策略不断去迭代,不断去优化,不断找到新的因子。主观投资更强调个人英雄主义,有非常牛的投资者。对于量化投资来说,则更多在强调集体主义,我们需要建一个非常好的团队,所以量化私募多集中在北京、上海、深圳等地方,因为这些地方最容易招到最优秀的人才。
坚定量化投资的信仰
叶展:最近几年量化发展很快,量化基金在私募基金里面占比达到15%。但是,去年开始,量化投资也遭遇了一些挑战,超额收益呈现增长乏力态势。对此,你们怎么看?
马志宇:尽管过去几年,量化投资规模在快速增长,但是,作为一种投资仍然有一定的周期性波动。美国市场也在2020年大幅波动、回撤明显。其次,量化投资的市场竞争在加剧,很多因子、信号逐渐在衰减,效率不断降低。在一个长期投资生涯里面,会不可避免的遭遇到大规模回撤。
何文奇:金融市场本身是不可预测的,即使对于神话一样的文艺复兴基金和巴菲特,仍然可能出现问题,量化也有类似的情况。
郭学文:去年上半年量化投资收益很好,导致大量市场 资金流 入,超出了市场整体策略水平的承载能力,不可避免地出现了后来的回撤。最近大家经常讲“抱团股”,其实量化策略不同的机构买的股票更接近,当一个基金出现赎回压力时,其它基金也都会出现净值下跌。这在一定程度上也会导致市场的优胜劣汰,使“投研能力与基金规模匹配”的管理人更有机会发展起来,形成长期的竞争优势。
吴家麒:对于量化交易来说,一个稳定的策略容纳的规模是比较小的,今年管理一两亿可以做的非常好,明年给了一二百亿,肯定有波动。其次要管理好投资人的预期,5%的回撤在主观投资里面可能都不算回撤,怎么到量化投资就认为是一个非常大的波动呢?
像以前一句明言所说,认识你自己。
散户的劣势第一点首先是数据的有限性。
那时候报社给我配备的数据终端大概有这些,一台彭博终端,一年的年费是20万。
所以差不多一年给我配的数据终端开销差不多30万,比我当时收入还高。这样的条件是我作为政券记者获得的数据条件,但是有多少散户能享受到这样的条件?可能很多散户甚至股票账户都未必有30万,更不用说一年可以亏30万或者是花30万的投研成本。
第二个限制是散户资金量有限。
对很多人来说已经是很难完成的任务,更不要说你真正进行沪深300指数的时候必须按照权重来做,对你整个资金量要求更高了。量化投资中很大的一块是因子选股策略,你可以看到他们某些金融工程分析师做的研报,他动不动让你一百个股票,买一百个股票对很多人来说也是一件资金量非常大的事情,这对散户来说也是非常大的限制。
但是作为一个散户你没有这样的优良的环境,所以在这样的前提下,很多复杂的模型不适合。在这样的前提下,我们需要做的是一些有散户特色的量化投资。
刚刚景顺长城也谈到他的沪深300模型市场容量的问题,他的模型可能会好一点,有比较大的市场容量。但是大家会注意到过去一段时间内,某些量化基金可能到了一百亿之后业绩快速出现了滑坡,因为对他们来说可能买的都是小盘股,一百亿下去很容易造成市场冲击。
在这样的前提下,有时候市场冲击真的可能是1%,所以的确很多模型会因为这个原因失效。但是对散户而言,其实整个A股整个投资市场对你来说近乎于一个理想化的无摩擦的状态,你不用考虑你买进去的股票对整个市场价格的波动。
一般情况下不要买那种一天成交只有一两百万的创业板股票,你很难感受到市场的摩擦。这样无摩擦的情况下你做投资,你先天比大多数机构投资者幸福很多。因为他们要考虑的是如何减少对市场的冲击,所以你会发现很多量化投资很重视算法,把一个大单分解,减少对市场的冲击。
什么局限是机构投资者会有的?
这是在海外非常流行的策略,在中国暂时你用不了。
技术分析哪个人没有玩过均线的交易系统,而且很多人以前玩的更溜,一根不够玩根,两根不够玩三根。其实一定程度上来说,动量投资和技术分析有很多相近之处,只不过在于会把它模型化、量化,可能在具体的操作层面上会有一些区别。
momentum effect,这个其实是被研究的非常多的,甚至是一个主流的显学,不是我们以为的江湖骗子研究的东西。其实很多大学里的教授也在研究这个问题,包括前两年刚刚得诺贝尔奖的尤金·法玛,他提出了三因子模型,包括了大小盘和价值成长这个模型,其实他的合作者肯尼思·弗兰奇(Kenneth French)依然在他的官网上持续发布三因子的数据,但同时他也在发布第四个动量因子的数据。
我觉得动量用一句老话来说核心是追涨杀跌,和普通追涨杀跌股民有什么区别?
动量模型前面讲的只是最简单的风格,为什么包括阿斯内斯在内的人可以写出上百篇论文?你会发现他把这个模型扩展化了。比如说我做三个月回测效果怎么样,6个月回测怎么样,12个月回测效果怎么样。
当然持有封基老师觉得这是不是一个运气,其实在相对动量中我们不认为是运气,其实模型就是这样判断的,在一定时间内债券比股票好的时候我们应该买债券。这其实是一个量化模型可以算出来,可重演的东西。
第二种思路是动量+价值,这也是阿斯内斯这两年新写的一篇论文中提出的,你部分仓位做动量,部分仓位做价值投资。
大多数我们在炒股票的时候关心的是上涨还是下跌。但是我们知道一个叫VIX的指数大家会知道,其实我们也有了,我们上证50有ETF期权,期权的波幅就可以算出A股的波动率。但是在中国只能通过A股交易期权本身,但是在美国期权的VIX已经是可以交易的品种了。
这样一个策略其实可能是在这两年缺乏动量的波动性的前提下,是一个很好的补充,我觉得这个策略第一知道的人少,第二个是交易起来的思维方式和传统做多做空完全不一样,我觉得这也是值得关注的交易品种或者是交易策略。
因为总体来说,西方的投资世界在对于一些投资理念上,或者是投资的实证上他们研究还是比我们领先的。虽然大家觉得他们可能在做象牙塔的研究。但是在量化投资学术界和产业界有千丝万缕的关系。甚至他们会合作发一些论文,像我前面讲到的阿斯内四很多论文会优先在这里发出来的。这要感谢互联网,在我念硕士的时候,我们要看一篇学术论文,必须用高校里花几百万买的学术论文引擎,这些引擎一旦你毕业后再也看不到了。
但这个模型对投资美股的散户来说先天就是非常好的模型,人家帮你测算完了,一分钱不要给你,就把模型公布给你了,只不过他觉得这个模型对机构没意义,对他做学术论文的意义也不算太大,你只要找到那篇论文就白捡那个模型。这样的东西在里面非常多。因为学术界和产业界很多研究会做的非常实在、非常细致。但是他对里面有些结果没有那么的重视。所以你经常愿意到SSRN里面找这些论文,你会发现有现成可用的论文。
如果是一个对量化投资有兴趣的人,我觉得要学这门编程语言有非常大的意义。一方面可以获得很多数据,像以前我最早做28轮动的回测的时候,我是把数据拉出来,拉到Excel表里面,然后算。
但是很多这种服务用Python就可以写一个程序,每次要做的就是到时间了把这个模型跑一遍,数据也出来了,图表也出来了,这是非常轻松的事情。
这样你用Python 、Pandas、Tushare,这三个加起来可以做一个非常简单的回测平台。我觉得对我们做量化投资的人来说,更幸福的在于国内现在好多的创业公司他们都从美国学了去开发了一些更简单易用的回测平台,包括优矿等等,这些平台可以用更简单的Python的语句,有点类似通达性的自定义公式做回测,甚至不需要写非常复杂的语句,就可以用专有语言完成一个统计。
量化投资监管大幕开启
记者多方了解到,目前欧美国家金融监管部门将高频量化投资策略分成三类,一是相对合法的高频交易行为,二是掠夺式高频交易(predatory high-frequency trading),即高频交易投资机构利用信息和技术优势,比其他投资群体提前获知交易信息并更快速交易以获取回报,三是涉嫌操纵市场的高频交易行为,主要是指高频交易投资机构利用技术优势虚假下单或发布具有误导性的交易指令,引诱其他投资者做出错误交易牟利。
“显然,后两种高频交易模式因涉嫌不公平交易与市场操纵,正被欧美金融监管部门从严限制。”前述外资对冲基金亚太区负责人指出。不如美国证监会曾建立市场信息数据分析系统(Market Information Data AnalyticsSystem),全面收集美国10多个交易所的股票交易数据,将每笔股票交易的报单、撤单、执行信息,交易信息时间精确到微秒,从而判断其中是否存在高频交易投资者利用掠夺式高频交易与操纵市场价格行为“获取”不公平交易利益。
01
常见量化产品及策略
侯磊,FMBA2020级
上海洛书投资 投资经理
第一种是按照持仓周期分类,主要有:低频,即持仓周期5天以上;中频是1到5天;日内是指持仓1天以内;高频则是从几秒钟到几分钟都有。越是高频,持仓时间越短,策略收益越稳定,策略容量越小。越是低频,策略收益波动越大,容量也越大。容量指交易策略能够承载最大资金的上限。
另一种是按照交易机会分类,主要包括:CTA(Commodity Trading Advisor),泛指交易商品或者金融期货的一类策略;股票选股策略,又称为股票Alpha策略、股票多空策略、统计套利和股票多因子模型;股票择时策略,以及股票T+0、ETF套利和自动化做市等其他策略。
任何成熟的量化交易,都具备三个核心要素:第一是预测未来,即通过获取的信息和数据推测,预估资产的价格走势;第二是风险管理,即在给定的目标收益率下,尽可能降低投资组合的风险水平;第三是交易执行,即用比较小的交易成本完成交易指令。
我个人从事的是股票多因子策略交易,可以通过下面的公式理解多因子的概念:个股收益=来自于大盘的收益(Beta收益)+行业收益+风格收益+个股特有收益(Alpha收益)。以茅台举例,茅台每天的股票收益可以拆解为: A股大盘收益+白酒行业收益(行业因子)+大盘股收益(规模因子)+“过去12个月一直涨的股票”的收益(动量因子)+茅台“特有收益”。
Alpha是市场稀缺资源,而且由于市场竞争的原因,Alpha的预测能力会随着时间的推移逐渐失效。因此Alpha和交易策略的迭代更新能力是各机构竞争的焦点,可持续的创新能力是一个量化机构最重要的能力。如果我们需要调研一个量化机构的持续竞争力,我们要关注该机构的策略的原创性,如果不是原创的策略,其策略迭代能力一般较弱;我们还要看团队成员的个人能力和团队整体的协作能力;最后我们要看团队是否重视研究,是否愿意在研究方面花资源和精力。
量化交易在国内发展很快,绝大多数机构都很年轻,如果考虑这方面的投资,不用太在乎机构是不是五年、十年老店,而是要充分了解产品的潜在风险。很多产品看上去很不错,但其中蕴含的波动率其实非常高,专业的销售会告诉你隐含波动率是什么,但从公开报表中只能看到业绩表现,其中隐藏的潜在风险并不直观。
02
CTA策略及后市预测
曹真琦
上海洛书投资 投资经理
在2000-2002年全球股票熊市及2007-2008年全球次贷危机时期,CTA指数不但没有出现下跌,还实现了正收益。CTA策略与其他策略都具有相对较低的相关性,加入CTA策略可显著改善组合的风险指标和风险调整收益指标,这个特点使得 CTA策略具有较好的风险分散的配置价值。
最经典的是趋势跟踪类策略,基本操作就是做多过去一段时间上涨的品种,做空过去一段时间下跌的品种,寄希望于走势在未来有一定的延续性。其特点是“赚大亏小”,盈利依赖于市场波动,长期持有总会盈利,盈利时间短但盈利能力强,波动大。
第二类,期限结构类策略。由于商品期货价格与现货价格之间存在基差,如果期货价格低于现货价格,处于“贴水状态”,反之则处于“升水状态”。期限结构策略的基本操作就是做多处于贴水状态的品种,做空处于升水状态的品种,充当期货市场套保者的交易对手方,赚取套保者为转移风险所交的保费。
第三类,量化基本面策略。股票基本面,大家可以理解为公司好不好,通过公司财报等其他维度可以判断。而商品基本面,需要思考商品价格的涨跌到底由什么因素驱动。驱动因素很多,包括消息面、政策面、资金面等,但我们认为商品的定价一定是在基本面手里。
量化基本面策略的基本操作是用量化的方法根据各类因子计算出品种的供需状况,供给大于需求,做空该品种;供给小于需求,做多该品种。量化基本面策略的收益特征在于,盈利来源稳定,长期持有盈利,大多数时间盈利,在市场供需不是主导因素时有可能亏钱。
整体来说,2020年无论股票还是商品期货,都是一个小牛市。今年大概率全球经济从疫情的低谷中复苏,对原材料需求持续旺盛,市场波动率维持高水平,利好CTA策略表现。目前国内CTA市场上升空间很大,市场健康发展,有重要意义的商品期货品种陆续上市,也引入了新的交易机会和新的对冲机会,有利于提升策略收益。经济的复苏,加上政策的利好,我们预期商品高波动和牛市还是有一定的持续性。
03
自学Python的560天
董鹏飞,FMBA2016级
光大控股资管部 副总裁
以美国股票市场为例,截至2019年底,通过量化方式进行交易的资产管理规模占比超过50%,通过量化方式进行交易的交易量占比超过70%。假如,未来中国股票市场也发展成美国的样子,既懂金融又懂编程的人才优势必将凸显;这种假如,就是未来十年的趋势。那时的人工智能会替代很多人的工作,我不想被替代掉。带着这样的思考,我决定开始学习编程,来驾驭深度学习人工智能。
Python能做什么?简单的可以用来做日常的微信自动群发、自动回复等,提升效率;还能用来爬虫,深度学习、模拟等等,比如模拟股票价格走势。更重要的是,Python语言相对简单,上手较快,开发方便,工具库丰富,科学计算方面的支持强大,目前在金融数据分析和量化领域的使用很广泛。
为什么自学Python?首先,学编程其实是一件非常容易的事,就像开车,是肌肉记忆,跟智商无关。其次,如果不是科班出身,或者已经拥有一定的编程经验,那么我建议你自学,不要报辅导班,因为第一,辅导班只教你正确的东西,但以我个人的经验,学习编程更多是在错误中学习,只有跟bug对抗,才能真正掌握它;要乐于接受bug,bug才是真正的老师,而不是敌人。第二,一些辅导班为了吸引学员,有很多炫技的东西,excel、数据的处理可能就是十几行代码的事儿,但是辅导班可能会给你看几百行代码,让你觉得“高大上”,实际上未必是那么回事。
有什么具体的“学习方法论”?第一,读书。现代社会,学习资源是无限的,要利用一切碎片化的时间来读书,快速推进学习进度。我的选书经验是善用“豆瓣”,9分以上是相当好的书,8分以上是可以看的书。这里推荐几本书,从易到难:第一本《Python编程快速上手》,100天时间看完;第二本《Python数据科学手册》,也是100天看完;第三本《Python与量化投资:从基础到实战》。此外建议大家学编程时,不要看电子书,用纸制书,方便哪个地方有问题,迅速查询。
第二,敲代码。每天至少抽出30分钟到1个小时老老实实敲代码,仔仔细细把每一个代码敲一遍,不偷懒,不复制,不用模板;并且注释每一段代码,注释就是学习。和读书不一样的是,敲代码和写注释,只能在电脑面前,并且需要整块的时间,还会出现bug,而解决bug需要更多的时间,所以进度较慢。
因此,如果你想学习编程,我的建议是:静得下心,宅得下去;坚定信心,敢战敢胜。我不止一次调侃:别逼中年人,逼急了,什么都能学会。未来,编程会进入小学课程,编程或编程模式会以更加深度的方式嵌入我们的生活,社会对跨界人才的需求会越来越大,如何应对?我们FMBA有一个学习Python的群,欢迎加入我们,一起学!