【亿邦动力讯】5月3日消息,亿邦动力获悉,“2018大数据产业峰会”明略数据、秒针系统创始人兼董事长吴明辉在会上表示:“面向AI的数据治理,是在传统数据治理基础上,利用知识工程相关技术,对信息按知识结构进行管理、分类和关联,将庞大无序的信息进一步治理为分类有序互相关联的知识,最终形成行业知识图谱。“
对于各行各业都在进行数字化转型,他认为这三点是落地的关键:
第一,要把行业的各种数据进行在线化,全部都连接到一起。
第二,要把数据连接后做数据挖掘,做人类自己可以力所能及做的分析与研判。
第三,当我们做好了面向AI的数据治理,做好了数据挖掘,并且真正形成完整的闭环,才能实现人工智能落地。
企业需要面对真正的人工智能时代的数据进行规划,进行数据的整合与融合。如果不面向人工智能的目标提供数据的整合规划,数据就有可能成为成本中心,没有办法真正的创造价值。
人工智能背后需要数据,但光有数据产生不了任何价值。只有把数据在产业里形成最终的智能,赋能于行业里的每一个从业者才会产生价值。数据没有价值,数据加上行业场景与认知最后变成人工智能产生最终的赋能,它才会创造出价值,才会有意义。
此外,他透露明略聚焦三个领域,安防、金融、工业与物联网,将数据知识化存储下来,通过很多规则与算法嫁接到人工智能的规则算法,形成人机同行时代的顶级知识体系,从而实现人工智能在企业的落地。
以下是演讲全文:
数据应该是企业的核心资产,而不是成本中心
各位来宾,大家下午好!很荣幸今天到现场与大家分享关于人工智能和大数据的思考。
我经营两家企业级服务公司,看到很多企业讲如何数字化转型,如何利用大数据与人工智能对企业做变革。路程非常坎坷。全世界处于经济转型之中,中国很多企业成长伴随着人口红利,包括移动互联网红利也有很好的成长。但今天人口红利不再,如何在新的时代迎接挑战?如何通过数字经济和数字化的方法优化企业内部效率?这是企业级服务帮助每一个客户要解决的问题。
数字化转型的过程并不顺利,全世界的优秀企业,通用电器、乐高、耐克都是我服务的客户,他们的领导人非常有远见。在很多年之前已经开始尝试建立自己的数字化转型策略,建立数据中心,存储数据。通用电器非常早建立了工业互联网云平台Predix,但是在发展过程中,他们也不得不对数字化部门进行裁员和架构调整,遇到很多挑战;LEGO早在2014年就推出了LEGO Digital Designer平台,后来由于种种原因不再继续,并重新调整了数字化战略,在之后的数字化转型中也遇到了销量下滑、裁员等挑战;耐克很早就通过智能手环采集消费者运动数据,与运动产品连接,但最后也难免以裁员、重新调整数字化战略收尾。数字化转型之路没那么容易,全球很多优秀的企业都是在探索和试错中不断前进的。企业做很多投入,但投资者和资本市场对它没有认可,公司的股价持续低迷。董事会会质疑这件事情有没有价值,为什么数字化转型没有给企业产生新的利润,而带来了如此大的成本。每个从事行业的从业者一定要思考这个问题。
秒针系统十几年前开始做数据挖掘,利用数据技术帮助企业做数字营销的转型。我们遇到很多问题,最大问题是如何把数据真正地利用起来?任何企业、任何组织,如果你把数据全部存下来需要巨大成本。如果没有把数据真正用起来就是巨大的成本中心,把数据真正用起来才有可能创造价值。
以安防行业为例,全国各地部署摄像头有很大成本,但成本能不能真正转化成生产力?这是安防行业IT人员需要思考的问题,如何把成本中心转化成利润中心,转化成真正对产业有价值的部分。人工智能背后需要数据,但光有数据产生不了任何价值。只有把数据在产业里形成最终的智能,赋能于行业里的每一个从业者才会产生价值。数据没有价值,数据加上行业场景与认知最后变成人工智能产生最终的赋能,它才会创造出价值,才会有意义。王坚博士说在他加入阿里时,阿里所有的交易数据都删掉了。但他加入阿里时说,马老师,数据无论如何都应该存下来不应该再删。不知道今天的数据有没有价值,但我认为有价值应该存下来。王坚博士在阿里被各种挑战,你为什么存那么多的数据,为什么建阿里云。今天大家看到他取得的成就,其实过去很多年在集团里备受挑战。
数字化转型没有捷径,需要一步步来,要不断地解决挑战,最终取得成功。今天各行各业都在进行数字化转型,但转型需要企业经营者和投资者有耐心。不能思考数据没有价值就不存。我们需要存,但如何规划是重要的课题,我们需要面对真正的人工智能时代的数据进行规划,进行数据的整合与融合。如果不面向人工智能的目标提供数据的整合规划,数据就有可能成为成本中心,没有办法真正的创造价值。
充分契合业务的前提下,企业数字化转型分为三步走:数据在线、数据分析与挖掘、人工智能
我在明略自己的年会讲过,人工智能在行业的落地需要三步走。第一步要把行业的各种数据进行在线化,全部都连接到一起。明略服务的公共安全行业,之前有各种各样的IT系统,每个派出所的每个民警手里有很多套系统。我去公安客户领导的电脑上,桌面有类似hao123页面的复杂效果,每一个图标、链接都是过去IT公司开发的系统。户籍管理系统、车辆管理系统、110报警系统,每个警察电脑都有上百个。数据散落在不同的系统里,他们每天做案情分析时在各个系统频繁切换,效率低。数据散落在不同的系统里,不可能产生最终的人工智能。人工智能要融合数据,当把数据连接在一起时很快要让它产生价值,否则客户也不允许投资这么多的钱。
人工智能真正形成之前,也就是三步走的第二步,要把数据连接后做数据挖掘,做人类自己可以力所能及做的分析与研判。这一步,行业里也叫做BI(商业智能)。明略数据帮助很多公安干警做到了,但在很多行业里第一步还没有做到。人工智能在行业落地的第二步很重要,第三步,当我们做好了面向AI的数据治理,做好了数据挖掘,并且真正形成完整的闭环,才能实现人工智能落地。人工智能跟传统的信息化最大的区别是可以形成最终的闭环,一旦形成闭环,所有迭代将自动加速,它将相比传统的IT系统更加智能,可以自我学习,最终形成真正意义上的人工智能。人工智能在每个行业落地没那么简单,需要三步走,每步都需要投入很多力量。
蒙牛做很多成功的尝试,蒙牛利用数字化手段几乎打通了质量控制和检测环节,每天蒙牛可以获得近40万条自动检验数据,但这些都是他们一步一步地规划而得来的。
我拜访重要的客户在湖南某一个城市的公安局,我跟公安局的领导聊时说要建立样本数据,他们就找了二三十个协警帮助我们做数据标注。有了标注才能给人工智能提供很好的系统支持,真正成功的企业或是政府部门是有耐心的。首先,就是要面对人工智能建立真正有意义的数据融合平台,这也是明略目前在服务这些大型B端企业、政府机构的独特之处。
面向业务智能的“在线化”的关键举措:面向AI的数据治理
数据是人工智能的基础,自我学习是人工智能相比传统IT系统重要标志。我们需要面向人工智能规划未来数据平台,规划未来的数据在线。面向人工智能的数据治理跟传统的数据治理有非常大的区别,先思考数据真正的价值是什么。一般的数据和人工智能时代需要的数据到底有什么本质的区别。
数据是人类特别重要的武器,帮助人类解决很多信息不对称问题。数据是观察者观察世界后,利用数学的方法或计算机的方法对客观世界发生的客观事实进行记录,这是数据本身的意义。数据本身的信息量很大,记录数据有成本。比如,明略服务轨道交通的客户,一个机车,不用说后面的环节,光车头上大概就有上千个传感器,每个传感器每秒钟都要发送很多信号,如果把这些数据都存下来的话,一辆车一天的数据已经能够达到几百GB的量级。
海量的数据全部存起来不可能,我们需要把真正有价值的数据提取出来。提取的过程称之为把数据知识化,信息知识化的过程。我们把这个过程做完以后,再结合行业领域的知识与行业专家,最后变成完整的人工智能智慧系统。
相比传统的数据治理,面向人工智能的数据治理最核心的是引入知识体系。为了面向人工智能,对比传统的数据治理,所有数据储备做的最核心工作要建立知识图谱的系统,我们需要对数据结构背后建立动态的本体和知识库。我们需要把传统的以表结构为单位的数据真正连接成为以结构化的数据,以行业的知识为基础的所有计算单元,在上面可以做逻辑推理,可以做很多的动态分析。它可以替代人做真正复杂的非统计类的工作,这需要建立知识体系,这是真正人工智能最大的价值。人工智能最大的价值不是替代简单的重复性劳动,更加重要的是替代人类甚至都可能做不到的事情。
因此,面向AI的数据治理,是在传统数据治理基础上,利用知识工程相关技术,对信息按知识结构进行管理、分类和关联,将庞大无序的信息进一步治理为分类有序互相关联的知识,最终形成行业知识图谱。
未来明略提供的人工智能警察,应该比中国优秀的警察还厉害,比福尔摩斯还厉害,这是未来产生真正价值的地方。人工智能背后最核心的是行业知识与领域知识。通用的知识平台不太可能存在,我们需要一个垂直领域一个垂直领域的做。明略聚焦三个领域,安防、金融、工业与物联网,我们把三个领域的数据知识化存储下来,把所有客户里的数据知识化存下来,在上面产生真正的人工智能应用。
明略不做简单的数据平台,而是引入行业知识体系
在公共安全领域, 明略通过面向AI的数据治理,将海量多源异构数据实时转化为“人、事、地、物、组织”等公安领域的实体,定义并挖掘各实体间的各种关系,并将这些数据全部融合到统一的大数据分析平台上,最后落地在客户不同的业务警种,在这个过程中我们不仅仅构建了一个大数据平台,而是引入了公安的知识体系,最终为公安客户大大提高破案效率。例如,最近明略禁毒大数据分析平台,在一个月内就彻底摧毁了分布在多省的制贩毒网络团伙。正是基于此前大量的面向AI的数据治理工作,我们才能为公安客户迅速完成数据挖掘和分析,从而迅速破案。
在金融行业,我们为全国某股份制银行搭建了全行级知识图谱平台,把银行所有业务板块的数据按照业务知识的逻辑融合在一起,这不是传统的数据治理,它是按照银行的知识体系把全部数据融合在一起。平台建立后,为银行实现海量数据和非结构化数据的分析,提升远程监控工作水平和能力,从多个维度为银行带来业务效率的提升。
轨道交通是制造业的重点领域,我们是国内首家把轨道交通领域散落在不同子系统的数据以行业知识的结构融合在一起的公司。例如轨道交通车头的数据和线网的数据结合,大家知道地铁站和高铁站轨道有信号系统,车有很多数据。之前的数据都分散割裂,今天把数据都连接到一起,而且连接的时候是有背后的知识图谱和背后的知识结构。当我们把这些数据全部连接到一起时,我们对故障的预测与维护等场景都产生很大的价值,可以节省计算资源与存储成本。原来数据量太大,很多不敢存,把数据融合在一起,更加知道哪一些数据应该存,哪一些数据不应该存。这是人工智能时代的数据治理需要做好的准备工作。
数字经济时代,明略的产业定位:助力企业数字化转型的“启动器”
明略数据是助力企业数字化转型的启动器,人工智能落地行业三步走当中,最基础的就是数据在线。“数据在线”不是搭建数据仓库把数据连起来,而是要把行业知识真正梳理清楚。明略与行业的顶级专家思考行业的本质、知识体系是什么,如何把数据真正地标注在行业知识体系中。只有这个工作做好,我们的人工智能才能真正地落地到各行业。
数据和知识分几个层面,数据、场景、业务。场景维度,思考到底数据会在哪一些环节被使用。具体业务会考虑具体问题,有很多数据和知识的维度。
我们在帮助行业梳理过去很多年的工作经验,很多规则与算法嫁接到人工智能的规则算法,形成人机同行时代的顶级知识体系。计算机未来也需要知识,它不能只靠暴力的挖掘与计算解决问题。人工智能在每个企业运行时要考虑效率,知识帮助计算机解决效率问题。小孩上二年级学简单的计算,从从1加到100有简单的公式,如果不知道的话需要花很多的脑力。计算机的计算需要知识,面向人工智能的数据治理需要把知识跟原始数据真正连接在一起,这是未来人工智能真正有价值的地方。
明略的目标是帮助企业不断提高效率,帮助政府各部门不断提高效率。我们希望踏踏实实地为客户做好面向AI的数据治理,帮助企业和客户做好人工智能落地的基础建设工作。我们让数据成为企业的核心资产,成为真正创造价值的IT服务,而不是成本中心。
(文/twinkle)