随着人工智能的兴起,使得市面上出现了一系列的具备AI的产品,为此也有分析人士表示,人工智能未来将成为我们不可缺少的生活方式之一。但对于企业来说,人工智能似乎难以驾驭,因为人工智能还没有做好处理“业务流程”的准备。
IBM(图片来自网络)
近日,IBM Watson和Almaden研究中心的科学家们在本周发表的一篇国际商业机器研究论文表示,关于企业如何数据人工智能数据,科学家提供了一些建议。IBM的研究人员的建议是,很多机器学习阶段需要考虑仔细,包括一个经理该如何“设定目标”的神经网络模型中,“数据管道”应该如何构建的示例作为神经网络的输入,以及如何不断“迭代”人工智能模型来改进它。
特别关注的是受监管行业所关心的问题,比如数据的“血统”:使用数据的“合法性”是什么?人工智能对企业的挑战在于机器学习编程和传统软件编程之间的本质区别,IBM表示:“尽管传统软件应用程序是确定性的,但机器学习模型是概率的。”此外,神经网络是使用“混乱的数据”开发的,这一事实并不十分适合企业。IBM还推出检测人工智能公平性、偏见和开放源代码的工具没有人对此做过任何事情,IBM说:“关于机器学习建模的学术文献未能解决如何让机器学习模型为企业工作的问题。”
为了达到一种更适合企业使用的成熟度,IBM的科学家们建议将机器学习引入“应用生命周期管理”之类的大量文献中,同时扩展这些术语的含义,以适应人工智能的新特性。具体来说,研究人员借鉴了沃茨・汉弗莱(Watts Humphrey)的工作,他在上世纪80年代为软件定义了“能力成熟度模型”。CMM是软件在组织中运行的各个阶段的一种映射。它从“不成熟”的阶段开始,当公司无法控制它在一个程序中做什么,并以一个组织能够不断“优化”一个程序的快乐阶段结束。
这项工作最原始的贡献是研究人员的建议,神经网络的开发应该着眼于特定行业的特殊性。他们写道,要找出人工智能的“业务用例”,可能需要一家公司“根据行业、领域和用例特定数据定制通用机器学习模型,以使它们在特定情况下更准确。”
IBM正冒险涉足这篇论文的棘手问题。机器学习有许多方面,特别是在其深度学习的化身中,这些方面很难与能力成熟度模型的简洁规范相协调。
例如,IBM提议在公司内部设立一个“人工智能服务数据主管”,在工作开始时,在反馈给机器的数据上附加什么样的“地面真相”标签。但在神经网络的设计中,很多“无监督”的机器学习都试图脱离基本事实。
在IBM看来,最令人畏惧的可能是企业应该负责确保神经网络没有偏见,这是整个人工智能领域都在绞尽脑汁解决的问题。负责开发神经网络的“产品经理”的职责之一是“确保模型不受不良偏见的影响,公平、透明”。