主流AI算法未充分考虑大数据复杂性想让人工智能更“聪明” 大数据还得深加工

来源：科技日报 2019-12-03 10:21:07

分享到：

当前，以深度学习为代表的人工智能技术已经应用到各个行业。驱动人工智能技术蓬勃发展的是各行各业积累的大数据。可以说，正是在大数据的“喂养”下，人工智能技术才真正茁壮成长。

然而，在近日召开的香山科学会议第667次学术讨论会上，与会专家指出，大数据的“红利”效应正在逐渐减弱，人工智能技术的单点突破难以持续支撑行业发展，亟须在数据科学和计算智能方面突破一些关键核心技术。

主流AI算法未充分考虑大数据复杂性

人们常常用海量性、多样性、高速以及价值密度低来描述大数据的特点。但真实的大数据往往更加复杂，比如具有不完全性、不确定性、动态性、关联性等特点。反观经典的人工智能算法，它们对数据的假设往往过于简单。比如，假设数据是静态的，产生于独立同分布的采样过程;训练数据是可靠的、数据所承载的信息是完全的等。

“数据的真实复杂性和算法的简单假设之间存在着巨大鸿沟，这使得经典智能算法在很多复杂任务上表现欠佳，亟待进一步的研究和探索。”会议执行主席之一、中国科学院院士梅宏强调，大数据是人工智能获得成功的物质基础，但目前主流的人工智能算法并未充分考虑大数据本身的复杂性。

从计算和通信领域看，大数据与人工智能技术在大规模工程化应用方面取得了长足进步。然而，大数据处理的技术进步主要体现在：以软硬件垂直优化和体系重构的极端化方式来适应数据规模、传输带宽和处理速度的提升，研究人员对大数据固有的非确定性和复杂性尚没有深刻认识;与此同时，人工智能技术也面临鲁棒性、可解释性和复杂系统认知瓶颈等挑战。

梅宏进一步指出，当前数据智能存在低效、不通用以及不透明三大问题。“现在的数据智能就像工业革命前的‘蒸汽机原型’一样，低效而昂贵;它只能针对不同应用定制不同模型，难以建立通用模型。”梅宏说，更重要的是，当前并没有对数据智能形成深刻认识，只是知其然，而不知其所以然。

人机融合或可弥补数据自动推理弱点

在中国科学院自动化研究所研究员陶建华看来，虽然当前人工智能在数据自动推理中依然面临很多技术难点，但是人机融合的推理方式可以有效地弥补这些弱点。人机融合推理着重于研究一种由人和机器相互协作下的新的推理模式，包含“机器懂人”和“人懂机器”两方面的含义。

对人的推理思维的理解是“机器懂人”的关键。其核心问题是如何构建能够反映人推理过程的思维形式化计算方法。该方法将人的推理思维形式化描述、概率推理、构建知识图谱，以及与现实场景的信息进行有机融合，从而可以将人的推理过程有效的输入到机器中，并与机器的推理网络进行结合。

此外，解决“人懂机器”问题将有助于人对机器智能辅助增强。机器推理过程的可解释性，对于构建人机融合的推理过程尤为关键。过程可解释的机器推理方法提供了解决问题的新方法，适当的扩展流程，并最大限度地减少人为错误的机会，可以帮助人类和机器协同做出更为准确和迅速的推理与判断。

微软亚洲研究院副院长刘铁岩结合他们的实际工作举例道：“我们在深度强化学习的基础上，利用‘完美教练’技术来处理信息的不完全和不确定性，从而很好地解决了麻将这一复杂的博弈问题。我们的算法在2019年3月登陆知名的竞技麻将平台，经过5000局的鏖战，成功晋级十段，其稳定段位显著超越人类顶级选手，成为首个超人麻将AI。”这是在处理数据不完全性和不确定性方面做出的有益尝试。

刘铁岩指出，大数据特性在不断演化，且愈发复杂。新型智能算法需要针对数据特点有的放矢地解决问题，这样才能填补数据与算法间的鸿沟，使人工智能绽放更多的价值。

关键词：人工智能大数据深加工