案例分享 | 杜小军:认知计算与大数据应用和数据流通

2017-12-05 08:55 来源: 国脉智慧城市网
浏览量: 收藏:0 分享

  11月23-24日,“2017互联网+智慧中国年会”在北京召开。本届年会以“智绘城市 数造未来”为主题,以数字政府、智慧城市互联网+政务服务、数据治理、信息社会等为主要议题。会议由中国社会科学院信息化研究中心、北京国脉互联信息顾问有限公司联合主办,国脉海洋信息发展有限公司、浙江蟠桃会信息技术有限公司协办,共有来自全国部委、省、市、区县电子政务、智慧城市、大数据主管领导、行业专家、企业代表、主流媒体千余人参会。

  在23日下午“数字经济与新型智慧城市发展”分论坛上,中润普达集团公司总经理杜小军以“认知计算与大数据应用和数据流通”为主题进行了演讲,系统阐释了中润普达在人工智能与大数据生态方面的探索与实践。

中润普达集团公司总经理杜小军

▲中润普达集团公司总经理杜小军

  近几年来,在政府数据开放以及数据助推新型智慧城市发展方面,中润普达做了一些尝试和探索,今天汇报的主题是“认知计算与大数据应用和数据流通”。

  一、人工智能、数据流通和产业大数据生态几个概念和关系

  1.大数据要实现交易必须向前打通价值增加的数据,数据要能够为传统产业升级改造服务。

  目前国内政府数据开放面向民生时会碰到一个问题,大数据要实现交易,必须向前打通价值增值的数据,因为大数据是描述“价值增加”或“价值赋予”的过程。数据开放,一定要为创新和创业服务,如果有驱动双创的能力,政府的数据开放才有价值。政府数据开放,面向产业化的交易和流通才更有价值。

  2、人工智能包括先进制造业如能大范围实现,必然释放巨大的能量,推动产业链的数字化整合,从而形成可持续的大数据大生态圈。

  工业数据要弄清楚,其他的大数据在产业升级改造之中起不到决定性的助推作用,这是我们面临的客观问题。人工智能发展的基础是拥有足够发达的工业大数据。

  3.基于大数据的深度学习(DL)与类脑智能(BI)是当代人工智能的核心技术

  最近中国人工智能产业又进入高峰期,非常火。国家四部委颁布了《“互联网+“人工智能三年实施方案》,在“核心技术研发与产业化工程”中提出开展类脑神经计算系统、类脑信息处理等类脑智能领域的前沿理论和技术研究,类脑智能和学习在整个人工智能中是关键。

  4.“认知计算”的核心是类脑计算。狭义的认知计算就是类脑计算。认知计算的终极目标,就是完全的类脑计算,也是人工智能的方向。

  由于类脑计算是人工智能的方向,整个深度学习和核心类脑的基础是极为重要的。

  5.以汉语言特别是汉字基因为基础的中文理解认知智能计算,才有可能真正实现人机智能交互和深度学习。大数据将为人工智能提供有效的补充和支撑。

  中国在过去全球互联网的发展过程中,唯一设立的技术门槛是什么?毫无疑问是去世的王选先生发明的造字技术。习近平总书记提出中国什么时候能在互联网和新型战略性产业技术中拥有在全球具有颠覆性的、决定性的垄断性技术。可能在单点突破上有这种技术,但是还没有产业化上的这种技术。如果不在产业化技术基础上实现创意,智慧城市创新就无从谈起。中润普达基于人工智能,尤其是类脑学习,核心就是汉语言学习或者是自然语言识别。

  语言与信息处理是大数据分析的基础。在滚滚而来的大数据洪流中,无论是政府开放数据,还是政府不可开放的数据,80%是非结构化的数据,包括办公文档、报表、音频、视频等,能够准确理解这类数据的目前只有人类。但是,人类已经不负重负,即使人类翻10倍、50倍也解决不了这种问题,真正服务民生,实现产业化,必然需要机器设备。

  6.中文语义识别技术的突破将推动人工智能产业化发展。

  第一块技术是图像识别,美国、以色列技术上非常领先,中国刚刚开始干,公安部十年前就开始利用,现在这个产业的临界点、起点出现了,资本快速进入到这个产业中。第二块技术是语音识别,过去十年,科大讯飞、中科院,包括很多大学都在构建语音识别库。第三块技术是语义识别,主要处理非结构化的数据,国家十个部委,还有一些特大型的央企以及200多家民营企业都在做,在语言语义识别方面我们一直保持领先。

  二、认知计算将是未来5-10年人工智能和大数据的关键技术

  1.认知计算技术的应用。

  现阶段的大数据都是布局在BI、商业流程上以及投资、保险等行业。过去几年,互联网快速启动市场,但是会发现大数据技术没有跟上,处于低潮期,现在又开始兴起,因为大数据技术已经实现突破,又进入传感器阶段,足够多的传感器造成数据喷发式增长,手机数据也呈现出爆发式增长,需要互联网来进行传输。

  再往前走又碰到难题——理解,这么多数据,如果只靠人理解会很难,微信每天都有大量数据,这些感知只有靠机器,也就是人工智能,要逐步培养机器人来理解。

  这些还不够,再往前看,有工业机器人和商业机器人,还有自动驾驶,在这两个场景里,机器人绝不是我们过去看到的硬件机器,要更多跟人交流互动,帮助我们解决问题。自动驾驶很重要,它是改变人类生活的一个非常重要的现实场景,人最终会落脚在自动驾驶和人工智能两个方面。我们探索、学习、模拟人脑,全球资本、技术、人才都在开始往这个方面聚集,这个地方不突破,其他的都是点的创新。

认知计算技术的应用场景

  ▲认知计算技术的应用场景

  2.中润普达:中文大数据认知计算应用服务机构。

  因此,我们的团队提出口号:把中文认知计算革命进行到底。从计算、领会到推导,训练机器人或者系统具备人类直接交互的能力,全面帮助政府、企业,在这个愿景之下中润普达也做了一些尝试。

  3.中文认知矩阵和动态平衡模型计算技术以及应用。

  我们有一些相关的汉字解码技术、中文语义分析技术、人机互动技术以及数据采集技术,基于这个领域在大数据和构建大数据生态方面进行创新。

  (1)中文文本识别与学习应用平台

  机器人如何理解单文本的内容?基于中文文本识别与学习应用平台来处理识别这些文本内容,就变得非常关键。

  (2)基于区块链版权的艺术贴图在线商业服务平台

  我们每个人未来最大的资产,一块是以现金形式存在银行的钱,包括黄金等等,另一块一定是个人的知识产权。现在个人的APP、微信、QQ等所有社交数据经常被大企业用去赚钱,未来每个人都应该逐步解决这些问题,个人的数据不能简单地被大企业取走,除非付费。在中国数据经常被滥用,每个人都是受害者。我希望通过这些创造,数据在未来是可以变现的,这些企业取不走,这是未来的方向。

  (3)产品集群:1个大数据认知计算平台孵化的N个应用

  我们从零开始,规范收集、采集、分析数据。去年7、8月份时,中国的个人信息滥用很明显,需要国家来进行规范,我们的数据必须是我们说了算,企业数据必须是企业说了算,不是谁都可以滥用的。在政府许可下,我们已经构建了政府局办的业务,重新规范构建大数据。

  应用一:非标资产的报价与评估系统

  提供基于中文认知矩阵计算的非标资产流通过程的定价和评估。案例有潍坊银行转型艺术品银行、林权综合金融生态服务平台。

  应用二:大数据交易与流通中心

  林权也是基于大数据,我们提供大数据交易中心来推动数据资产变现,在地下黑市上交易变现是不可持续性的。北京市经信委去年也成立了国际大数据交易中心,现在也一直没有开业,根本原因还是没有把这些事情摸清楚,摸不清楚开业也是有问题的。

  中润普达大数据交易与流通中心包括数据资产归集、流通模式创新、技术支撑平台,已经成为能够独立运营向前发展的业务模式。

  应用三:数据资源的场景设置和应用

  这里含有政府的场景,通过大数据把类数据结合起来,借助这些数据可以去创业创新,在地理位置、精准营销、用户画像等各个方面都起了一定的作用。社交数据、终端数据、位置数据等这些数据经过用户授权大部分是可以使用的,目前大部分的企业根据这些数据进行创新。

  我们有一个大数据平台是基于裂云的,裂云平台基于极其庞大的150TB的数据源建设的数据分析应用平台,核心是“整合”模式。

  应用四:智慧政务与商业智能可视化分析平台

  Runup冲霄平台是国内首款基于AI的产业大数据应用系统,一键连通政府和企业内外部数据,用科学智能的视角去探索城市综合治理和企业经营的新方式。长江政务云是中润普达建设的,实现政务融合。

  应用五:云上融媒中央厨房系统

  既有数据变现的模式,还有新媒体的模式,案例有九派全媒体产业综合解决方案、大数据+民宿(整合1万多家民宿)。

  应用六:大数据综合应用解决方案:智慧政府,智能商业的使能者

  有的数据重复,拥有几十个平台,我们基于原来的数据重新构建表图,形成新的大数据后,这些数据才能开放出来。案例有大数据+文明城市建设、大数据+公安、大数据+工会、大数据+智慧文化等。

  以上是简单的分享,非常感谢。

标签:

责任编辑:xuxiangnan