聚宽量化联合创始人李骁
和讯基金消息 由财视中国主办的“2017第四届对冲基金中国年会”于2017年10月28日在北京隆重举行,年会得到AIMA、CFA Insitute、康州对冲基金协会、CAIA协会、芝商所、Interactive Brokers、宜信财富、阿法金融、平安银行(000001,股吧)、衡力斯、聚宽量化、东英资管、广州九逸资产、Imagine Software、Campari、厚石天成投资的大力支持。本次年会汇聚来自对冲基金行业顶级投资人、投资机构、基金管理人共计300余人到会。
下午的日程分为A、B两个会场。在分会场B:量化投资与智能BETA策略中,聚宽量化联合创始人李骁发表了主题演讲。
李骁表示,狭义的量化可以理解为把事先定好的数学公式和逻辑判断程序用来投资。比如,在著名的多因子选股模型中,把情绪因子等考虑进去,写一个简单的回撤,在平台中,左边是代码区,右边是回撤引擎。如果直接使用这样的模型去做策略,是有难度的。广义的量化是说通过运用各行各业最先进的科学模型、数据,包括现在大数据和人工智能,以及计算机相结合的科学技术来开发买卖策略,实现收益。李骁从五大结构详细讲解了量化投资。
以下为发言实录:
主持人:各位嘉宾下午好,欢迎来到下午的分会场B量化投资与智能BETA策略的现场,非常感谢活动主办方的邀请来担任下午分会场B的主持人。话不多讲,经过上午的半天会议,相信我们也从上午各位大咖的介绍中有一定的受益,也希望在下午的论坛中大家依然能够有更多的领悟和感受。接下来我们迎来下午的第一场主题发言,内容是从聚宽看中国量化的过去、今天与未来,现在有请主题发言人聚宽量化联合创始人李骁,掌声欢迎!
李骁:谢谢主持人。非常感谢财视中国邀请我们来参加这个论坛,我是聚宽的联合创始人李骁,我想先做一个小调研,看看在座的各位有多少听过“聚宽”这个名词?方便的话举一个手看一下,看来我们的工作做得还可以,有多少位用过我们的聚宽呢?可能转化不是特别好,站在我做互联网的角度来看,提高一下转化率。可能我专门说量化不是特别专业,因为我们是科技行业出身,我可以简单介绍一下聚宽,聚宽是成立在2015年,是在股灾之前成立的,成立完之后大概一个月,股灾就来了。我们就觉得可能还是有点运气的成分,说明量化这个东西马上就回归到整个理性的市场上。今天回过头来看量化这几年的增长是非常快的,才会有最近这一段时间的话题。比如说我今天开始要讲的大概会分五个结构,第一个:前两天18号的时候看到有一个美股的智能ETF直接开始在使用了。它是跟IBMWatson一起做的,Watson这个认知平台不知道有没有了解,在科技圈里面是比较火热的人工智能的平台,大概是做商业认知的。在2012年的时候,Watson每秒能读取4000多份病例、二十多万医疗文献,十几万医疗诊断报告,所以在2012年的时候就通过了考试,直接使用在金融领域里面是这个ETF。不过我最近看了一下,这几天它的收益,大概连跌了6天,全面跑输了大盘。我们就觉得AI不能马上,这个观点我跟早上的Alpha的老大的想法是一样的,AI不能马上直接使用在金融另面,毕竟有一个过程,需要我们辅助去研究,人的影响、情绪的影响、市场的影响,你不能机器一下子全都学会。所以我们就讲一讲量化的起源
可能在座的各位都比较了解了,在1900年路易斯巴施里耶特别厉害,左右脑开发都特别厉害,艺术特别有天赋,物理、数学特别有天赋,他跟著名的物理学家旁巴莱一起合作做了一个研究,最后形成了一篇论文,这篇论文是他唯一发的《投机理论》,作为了现代金融的里程碑。后来著名的经济学家赛米尔森在这个理论基础上修改了以后发表得了诺贝尔奖。因为我们是做科技行业,所以我们回顾了量化的工具,他当时的研究工具大概是这几个:数学统计和物理,他通过这些判断了市场上的反馈情绪。设计到他的模型当中,得到了很好的结论。
过了50来年,时间来到20世纪70年代爱德华索普的成名是因为当时发现了非常有意思的21点这个东西的概率,他想做一个概率的计算,这个计算量特别大,在数学的基础上,压力很大。著名的IBM704,还有Fortran把21点算出来,一个一个赌场测试,最后上了赌场的黑名单。这个时候他写了一篇文章叫《战胜中甲》,他就再也去不了赌场了,就研究其他,就开始研究二级市场。研究二级市场,28年来的平均投资回报率是20%以上,基于这个研究,他所有的策略、他所有的模型,他写了一个文章叫《战胜市场》,也开启了整个量化的历史,后来的文艺复兴这些大的知名的公司都在这个基础上成立了。
量化为什么会有这样的一个基础?我们总结起来发现,第一,它的交易从最早的人工报价时代到了计算机报价,进入了一个全面的互联网跟PC的时代,蓬勃发展,信息能够沉淀在海量的数据库里,包括有国外的一些比较早的算法,交易平台,他设计了这样一个机制。总结起来就是这四个因素导致了今天量化会有一个大的变化,交易所自动报价,ITS,数据量每两年呈现10倍的变化,还有摩尔定律跟超算中心。我们知道在著名的几个超算中心的派排行榜当中,中国的超算是很强的,排在前几名,跨界的物理大师和数学大师很多,他们也加入金融这个行业做研究。前两天我接触一个用户,是上海的用户,大概四十多岁,在整个平台上的策略是排在前几名,他的用户、粉丝大概有两千多人,基于这个他又做了一个新的公司。所以我们看到这种跨界的人才不断加入量化研究当中是非常欣慰的。
我简单想说的一个东西是说我们现在去定义量化,折过来看,可能从原来狭义的量化要开始去扩大了,狭义的量化理解是说把事先定好的数学公式和逻辑判断程序用来投资。比如说我们知道的著名的多因子选股模型,把情绪因子等等都考虑进去,我们写了一个简单的回撤,这是我们平台,左边是代码区,右边是你的回撤引擎,如果你回撤完之后,可以看到这样一个结果。这是2007年10月22号到2017年10月23号的整个10年的多因子的回撤模型,收益率大概是15.63%,但是回撤的数字不是很好看。我们就觉得,如果直接使用这样的模型你去做策略的话,还是有难度的。广义的量化来讲,是说通过运用各行各业最先进的科学模型、数据,包括现在大数据和人工智能的发展,还有计算机相结合的科学技术来开发买卖策略,实现收益。
我这里可以举一个例子,MOMO这家公司是最近两年比较火的,因为它做了一个陌生人到直播的转型。在2016年的时候转型还比较模糊的时候,他又是一个低调的人,不会出来吹这样的东西,有一家公司去扒取了MOMO之前的打赏数据、月活数据、交易数据,把所有的数据扒下来做打包,还出售给了某一家著名的公募基金。他在我黄箭头标注的这个点进了一波仓,整个一年多的收益都是知道的。所以我们想说的是数据从现在来看,不仅仅是我们场内的一些数据可以直接拿来使用,大量的外部的特征数据、差异化数据、一类数据开始通过非结构的处理能够直接使用。
第四部分讲讲量化现在的样子。在美国是1.426万亿,前二十的对冲基金都跟量化有直接的关系。不止是前十,每年的增速也非常快。中国的市场相对就会小一些,100万亿的资管市场当中有3500多亿是量化基金的规模。但增速是非常可喜的,37%,虽然在2015年的时候创新不足受到的影响会有一些,但是今年看整个行业发展还是比较迅速的,跟我们交流合作的券商越来越多。语言的大量应用也比原来的技术好了很多。这是我们主要支持的一些语音。但是明年Pandas比较主流。以聚宽为例,现在可以自己找数据导入进来,可以用互联网的爬虫,进入第三方,包括我们做的事情,如果各位感兴趣的话可以跟我们合作,大家有什么想要的数据告诉我,我给你找市场上有没有这样的一级公司,一级市场上有没有这样的公司去创业,有没有二级公司主动提供这样的数据,跟他们合作。还有一些机器学习库,一些深度的学习库,都通过它开源出来之后,大家能够直接去使用。
这是我们的两个案例,都已经上线了,一个是跟广发证券(000776,股吧)合作的投研平台,另外是跟国君合作的平台,这两个会逐渐打通实盘,如果各位感兴趣也可以自己去体验一下。这是我们在语音上的应用,我们现在给券商和私募提供的是语音的直接方案,如果你希望部署到你的本地、你的云上我们可以直接帮你部署,提供整套的打包服务,而且我们有一个非常强大的优势别人应该是比不了的,我们所有的原代码开放,如果需要的话可以拿过去用,我们觉得是这样,你们写代码的能力永远没有我们强,因为我们现在差不多有60多个研发团队,基本上都是百度这样一线的公司过来的。
量化金融数据库,最优质量的数据已经放到我们线上的平台,你们可以看到十几年的市场数据,行情数据,还有我们最近上的一些多因子的数据,大概有几百个,多因子的数据都已经放在上面,大家可以直接使用。融资融券的数据,基本上每个月一更新,数据库更新是特别快的。这就是我刚刚说的我们最近上线的因子库的数据,有财务指标、海量共享因子。这些因子是这样的,我们用户目前的策略开发者大概是10万左右,每天他们去运行的回撤量应该是几十万到百万左右。目前策略总共平台超过100万策略,所以在这些策略调用这些数据的时候,他们都会去给它做标签划分因子,我们在这样的使用过程当中提取了一些关键的东西出来。这是我们的研究平台,这是我们用户做的一些案例,这些文章都在我们社区上,如果你们感兴趣可以去我们社区里面看。
这是我们上个月上线的一个金融客户端,金融客户端现在考虑到一些私募或者是一些公募基金,还有券商的一些没有合作的投研团队,它可能希望策略保密,我们就下载到本地上你去直接使用,数据调用云端的就好,策略写在你的本地。上个月开放以来到现在有800多家机构已经申请跟我们合作了。这个是向导式的策略生成器,刚才我听到一个老总说我们不会写代码,但是我们的同事对技术非常熟,我们对一些不会写代码的用户,又特别想使用策略的用户,我们做了一个向导式的策略生成器,你可以自己生成自己的策略模型。这就是目前我们主要提供的六大产品,基本上代表了现在量化所使用的科技服务,有投研平台、智能的投顾服务,比如方正政权的小方牛就是我们的智能投顾给他们做的,量化投研的客户端等等。
这是目前的主要合作伙伴,包括昨天刚刚签约的平安证券,他们整个的智能投顾也会给我们做。
再讲讲智能投顾。我们知道摩羯智投一下把智能投顾的市场给点燃了,从去年到现在为止,整个销售数据超过50亿,大概用了10个月的时间,虽然基金的规模还不错,但从回报上来讲,我们认为它回报做得是一般的,目前智能投顾只是它的一个噱头,可以这么讲。为什么这么说?因为我是它第一波最早期的用户,最近老是收到短信说要不要一键优化一下,说明策略可能不准,要我手动调整一下。我们看到这个池子里面的配比大部分是公募基金的产品,还有固收的产品,总的来讲是风险不大的,再加上今年的这波行情,正常的收益率是百分之十几,目前也就是这么多。我们能做什么?我们能做三点,第一点就是客户行为的分析,我们能帮助用户提升每一个客户行为分析的点,我们分析得更精准,第二个就是大类资产配置的优化,第三个就是我们可以有一道自己的算法,做基金产品的评价。这是我们专门的一个精工组的团队,大概是有两个数据天才,两三年读完数学本硕这样的,还有几个公募基金出来的同事一起做的整套的方案,目前方正证券(601901,股吧)用的就是小方牛。
最后畅想一下从现在到未来的这几年,量化科技会有一个怎样的变化。我想讲的大概是两点,第一个是大数据与量化的关系,这是2016年整个大数据,我们看到整个行业创新非常多。中国来讲,在2014、2015年,一级市场的传导,一级市场投了大量的数据类的创业公司,他们对标到美国,基本上每一类公司在中国都能找得到,好处就在于把很多IOT的行业级别的数据处理为了结构化的数据,我们可以通过我们的,比如说数据团队,我们现在有一个数据团队专门干这个事情,把他们一些非结构的数据或者不能直接量化做的数据转化成为量化可以处理的数据,这是一方面。IDC预测,2022年整个数据量全球信息量超过40ZB,ZB的概念就是万亿的GB,这个量是非常大的,是2012年的12倍,从现在的发展来看,是远远比这个多。我可以举一个例子,OFO的戴威我们俩一起创业,他在2016年的时候10月份的交易数据是40万,每天的交易数据是40万,小黄车每天打开也就是40万次。前两天他给我发了一个截图,大概是21号的时候,整个OFO的数据量是3200万,日打开次数是3200万次。我们可以想象,这样的定单数爆发式的增长,在IOT里面是非常多的。还有一个数据是滴滴的大数据团队告诉我的,滴滴的整个行业数据在今年的时候,每天处理的话,大概是2000TB,每天调用的定位信息是130亿次,我们可以想象一下中国人总共14亿,差不多每个人每天有10次的调用是在滴滴那儿,如果他的用户只有1亿的话,每人是100次的调用,这个定位信息记录下来是非常大量的,但是如果直接去处理的话是不行的,所以要通过一些结构化的转化,配合其他行业的数据,也许是一个非常好的量化策略的思想。
AI的发展对整个量化的影响也会比较大,右边这张图是我们国家从2015年开始的一个AI的规划。2015年7月份加入到“互联网+”的一部分,到这个月写到国家的十九大报告里面。毫无疑问,人工智能是国家战略。右边的这张图可能看不太清,是人工智能对现在市场上一些基金的收益率的影响。第一栏的列表在收益率当中,人工智能对它的收益率的影响达到7.58%,我没记错的话,后面那几个都没有超过3%,所以人工智能的辅助是非常有意义的。在我们这里面帮助我们数据处理,解决信息不对等,提高金融行业从业者的效率是非常重要的。
最后,我讲一个例子。异类数据,在跨界的数据关联上人工智能会有非常强的优势,通过知识图谱,我们可以发掘到很多没有关联的数据共享在一起。比如这个例子,这个数据公司是专门提供所有轮船、货运轮船定位的公司,全世界的船大概几十万艘,它都有十时的数据,我在上面找到一家做农产品(000061,股吧)的一艘船,它当时正好处在这个地方有一个风暴眼,当时这个地方有一个风暴的影响,再看另外一家数据,这家数据公司专门提供卫星大数据,卫星去分析中国市场上农产品的分布、农产品的产量、农产品的生产周期,把它格式化处理了、结构化处理了。再结合到这家公司,这家公司也是一家一级市场的公司,他们专门扒电商的数据做分析,大量的交易数据,日交易数据、分类交易数据,如果我们把三者结合起来,某一个玉米或者是大米的销售在电商平台上非常好,但是又受船运的影响,受台风的影响,某一个时间点要延期到港口,又通过卫星的数据分析到,今年中国产量是在下滑的,这个数据结合起来不知道有什么用,大家可以想一想这个策略能不能实现。我举这样的例子目的是告诉大家在这一波数据的浪潮和AI的浪潮当中会留下大量的投资机会的发掘。我们不能直接使用它,但是可能通过关联的方式去挖掘出投资机会。
最后再讲一点,就是我们最近在想做一个事情,就是我们平台上有大量的策略,在座的可能都是从业者,我们想做的这个事情非常简单,左边是MOM的一个量化,右边是成千家小的私募你们做的一些投研,一些自己的策略,但是你的代码,我们是不给任何用户看的,由于看不了,比如你想跟另外一家MOM基金合作,我们可以做成一个平台,你给他发过去,他看到这个东西,觉得你的策略还不错,跟我的想法很像,我配一点进去,你点“同意”,我们在做这样一个事情,不知道大家对这个事情感不感兴趣,感兴趣可以跟我聊。
这就是我今天的分享,如果大家想合作我们都是秉承着开放的态度,因为我们是一家互联网公司,去我们公司可以看到穿托鞋上班、拿各种零食的,感兴趣的可以找我聊聊,我们可以谈一谈之后有什么合作的机会,谢谢。