和讯基金消息 10月26-27日,由财视中国主办的“2018另类投资中国峰会”在北京召开。超对称科技CEO吴恒魁参加论坛并发表演讲。
以下为嘉宾发言全文:
今天听了不少嘉宾在聊AI对于ETF投资等不同AI应用于金融投资的方法和能力。那么我们理解接下来AI对金融的改革首先要发生在基础的层面。所谓基础层面,必须发生在数据层面。当我们尝试用机器去理解市场的变化的时候,我们的理解是针对于基金的公司股价的变化,基金的收益的变化,这个层面的数据。但是如果没有基于公司的、企业的更细颗粒度的基本面的数据,这样的机器对市场的理解是否能达到一定的准确度?这是我们做超对称以及超对称量化云基础的出发点。
我们现在提出一个目标和使命是我们希望能够成为未来的金融和商业智能社会的数据基础设施。今天我主要是想和大家聊,我们是如何建设一个能实时量化的感知市场变化的机器系统,基于实时的感知我们能够针对基本面投资和量化投资提供什么样的帮助?
从我们希望提出基础设施的产品结构来看,我们从不同层次去理解如何搭建基础的数据量化云平台。在数据层上,我们会针对不同的行业和不同领域,电商、娱乐、酒旅、OTA、房产、汽车、金融,我们针对金融和商业市场的衣食住行,用教育医疗形成一个底层的数据基础设施。这个底层不仅仅是公司的年报、公司的财报。我们现在针对于电商、针对于生产制造,我们大概每天采集了1个T的数据,阿里巴巴、京东、拼多多大概有30亿个商品的页面,也就是涉及到所有商品的品类,我们每天将这些商品的页面采集出来。
而针对于娱乐社交,我们将YY、陌陌、虎牙这些直播平台的大概100万个直播间每天所发生的打赏还有在线观众采集出来。比如针对于旅游、OTA、酒店、机票,这些数据我们也将对细颗粒度的数据采集出来。所以当我们谈到基础设施的时候,首先第一个环节是我们需要将每一个行业、每一个平台、最底层最细颗粒度的数据采集,整合成一个系统的平台。
在这个基础上,我们现在有中国在电商上5000万个店铺,5000万个商家,以及背后的生产制造商每天实时的销售数据,这些销售数据他们之间的关联关系,玻璃生产和手机销量之间的关联关系,我们怎么寻找到不同的关联关系,我们需要一个行业的知识图谱,所以在数据基础上我们需要构建一个图谱层,在这个基础上我们用机器学习等深度挖掘。只有当我们拥有了数据层,我们能够用数据实时去理解行业、公司、品牌的变化的时候,我们才可以做行业的模型,去分析每一家公司,美的和格力在某一天、某一个月、某个季度的销售变化产生什么样的变化?这些行业的洞察也可以用于基金的投资、基金的股票投资,可以进一步用于从基金投资再可以溯源到基金的表现,再可以进入到刚刚我们讲的一系列应用。
所以从建设一个新型的AI量化的基础设施这一基本的产品构想来看,我们从最底层入手已经构建出了一个系统。当然未来,这部分我会提到未来我们想做什么?我们希望能够建设一个机器的系统,基于最底层的数据变化,能够实时的感知市场的变化,我们将最底层的、最细颗粒度的数据和我们能拿到的包括企业的公告、财报、股价的数据变化输入到我们的系统,系统来理解市场变化、环境变化,进而来支撑我们的投资机构和投资人进行投资决策。这样投资决策给到系统正反馈和负反馈,再让整个系统进行演化,这是我们强调的我们想达到的一个类似于像阿尔法狗下围棋一样能够自动演化的系统,这是我们下一步要进行的工作。
下一步是我们现在的产品基于这个产品应用于投资是怎么使用的?目前我们现在主要是三个产品的模块,一个是我们针对A股500家消费类的公司,包含了八个大的行业,包括食品、酿酒、电器、服装、家居等八个行业,我们覆盖了A股上市公司500家。第二个板块,我们现在能够用这个机器系统实时的预测阿里、京东、拼多多、唯品会、YY、陌陌等30家中概股公司每一天这个平台的交易额和交易量以及活跃的用户。当然我们也覆盖了一系列的未上市的公司,像宝宝树马上上市,美丽说、小红书等这些电商平台类的公司。
那么在这个基础上,我们还有第二个产品的板块是我们将A股的3000家公司所有跟这些公司相关的文本的材料,比如社交媒体上用户的发言、留言,以及新闻的文本,通过NLP的模型来生成情绪指数,这部分指数就是专门服务于我们的量化基金应用新因子来做投资的。
从现在目前我们的用途来看,我们能够实时的理解每一家公司像老板电器(002508,股吧)每个月的销售变化、每天的销售变化,以及看到每一天厨房大电这个行业的行业格局,就是所有的同样类型的竞争对手公司他们的占比的变化是怎么样的。而在这个基础上,我们一个比较强大的能力是我们能基于整个机器所采集到的数据,再基于我们的计量模型来预测。比如说现在是10月份,我去预测老板电器到12月份这整家公司的收入是多少?这是一个完全基于数据和计量模型来进行预测的,这个功能就是跟现在我们一般的人工的分师,人工的研究员去做财务、做公司的收入预期预测PK。因为我们的券商每个季度都会发预期报告,未来会有一个超对称的机器人(300024,股吧)去跟这些分析师进行PK,我们在11月份就发四季度的预期报告去跟这些分析师进行PK。从整个机器系统的角度来看,我们看到机器预测的能力正越来越准确,所以最后肯定能把大部分的人工分析师PK下去。
我们整体来看在A股层面,我们现在覆盖的是这些行业,现在已经能覆盖不止是170家,覆盖在500家公司了。从针对于基本面投资的分析,从机器来替代人这件事情,我们基于线上的数据形成了一个计量模型去拟合我们公司的收入趋势,再来对财报进行预测,最后形成投资策略的制定。
当然使用这个产品的客户会进一步问,如果你只有线上的电商数据,像老板电器线下的门店销售你怎么判断?这个时候线上数据能完全反映出一家公司的收入吗?我们做了系统的计量经济的研究,我们能够反馈出来,60%的是有相关性的,40%的是相关性比较差。而相关性差,其实它是有一些基础原因的,比如说线上线下季节性波动的区别,线上线下节日性波动的区别,这些原因和规律我们也逐渐地找到。所以我们会看到比如说像飞科电器,我们基于我们的数据系统所得到的数据能反馈出来,准确地能反馈出来财报变化的趋势。比如说黑芝麻(000716,股吧)、会稽山(601579,股吧),完全基于我们机器的线上数据就能够去预测我下一个季度它的收入可能是涨还是跌,能不能达到预期?
其实我们已经做了系统的研究,比如说老板电器我们完全基于我们的数据+模型,预测出来了跟过往财报相比,它过去一个季度只差了6%,华帝只差了2.5%,实际上我们整个模型的预测能力在目前列出来的一共38家公司里面,已经比人工的分析师还要强。而我们现在先集中针对这38家上市公司,未来完全会扩展到可能整个500家、1000家A股的上市公司。所以在这个情况下我们就会发现,机器人研究员比人工、人类研究员还要强大。
以老板电器为例,简单地讲一下老板电器在2010年上市之后一直保持着25%以上的同比增长率。但是今年一季度的财报报出来,它过去6年最低的增长率只达到20%,导致了它有连续两天跌停。而这个信息当时大概有20家一流的券商都给了它可能能达到20%以上的券商,所有的那些券商在一季度的时候都错了。但是这个数据,老板已经连续下跌,它的线上增长连续下跌,已经发生了两个季度,从我们的系统来看。所以也就是说,这样的数据系统能够从最底层、最细颗粒度的层面去捕捉一个公司变化的系统,实际上将越来越强大,能够不断地辅助人的决策。
所以这是一个老板的典型案例,我在这部分就简单的过。接下来另一个层面,针对于今天的一些投资人也关心,比如说海外上市的市场。在海外的公司上,我们覆盖包括阿里、京东、拼多多、唯品会等,现在一共已经有20多家公司了。这部分数据就更加系统和准确,我们能够实时到比如说陌陌每10分钟,整个陌陌平台有多少主播打赏,每一个主播拿到多少钱,有多少人打赏,有多少在线观众,都是通过我们上几十个亿页面的扫描能够捕捉得到的。我们通过捕捉这么细颗粒度的数据,你就会发现我们每个季度对YY、陌陌、虎牙财报收入预测误差只小于3%。
所以超对称在今天构造了一个底层的为AI做量化投资和基本面投资决策提供赋能的AI量化云平台,这个体系我们也可以看得见,这是未来AI在金融体系里面不可或缺的一个底层的部分。
今天我的演讲就到这里,谢谢!