2014中关村大数据日于2014年12月11日在中关村举办,大会以大会以“聚合数据资产,推动产业创新”为主题,探讨数据资产管理和变现、大数据深度技术以及行业大数据应用创新和生态系统建设等等关键问题。大会还承载从政亚信府主管部门到各行各业的需求和实践中的疑问,探讨包括政府、金融、运营商等部门是如何通过数据资产管理和运营,实现转型发展和产业创新的路径。
大会现场,在论坛@Big Data环节,来自政府、产业界的领导与业界精英就《开放数据资源,聚合数据资产,创建产业生态》话题进行探讨。以下问论坛文字记录:
张灏:各位嘉宾各位观众上午好,我是亚信数据的张灏,今天非常高兴和大家主持数据资产圆桌论坛,今天我们的主题是开放数据资源,聚合数据资产,创建产业生态这样一个题目。我想这个中间的逻辑应该是说我们的资源只有开放,我们才有可能让大家从各行各业数据角度来讲能够得到充分的挖掘和聚合,下面请六位嘉宾一起上台进行圆桌对话,有请宣鸿先生,有请刘贤荣先生,黄文良先生,董云庭先生,糜万军先生,还有齐红威宪政。
我们首先是想把话筒交给每位嘉宾,由他们来做一些自我的介绍,在做介绍同时也请各位从大数据的任何角度,我想大家从事的行业都有非常大的差异,刚刚我们是坐在一起讨论生态,各个行业你们对大数据的理解,数据价值的理解,数据的理解都可以做几分钟的自我介绍,首先是请宣鸿,他是中关村管委会的副主任,也是我们今天这个大会的一个指导单位,先有请宣鸿主任给大家做一个介绍。
宣鸿:大家好我是中关村管委会副主任宣鸿,我在管委会负责产业促进和创业服务,大数据这项工作今天变成一个热门的话题,事实上在2012年那个时候大家对这个话题还不是很熟知,当时我们记着想跟中央电视台做这方面的节目,因为中关村有一个任务,中关村是自助国家创新示范区,我们有一个工作就是不断寻找新的产业发展的前沿方向,2012年当时田溯宁先生以及向我们建议了这样一个方向,很多专家,特别是经常往返于中美之间的这些科学家和投资人都已经注意到这个趋势了,当时我记得中央电视台当时他们还很犹豫,就说大数据是个什么东西?这样报道,现在报道合适吗?符不符合方向等等他们都不知道大数据是什么情况。但是大家看2014年的两会,3月份的两会,你看两会的报道都是以大数据为线索和分析来报道的,比如说两会开会当天人们都关心什么?就是全国人民都在关心什么?还有世界各地包括关心中国的两会,哪个地方关心中国的两会最多,都是大数据的方式来报道的。所以大数据迅速成为今天社会认知,产业发展和社会组成方向的一个重要的方向。大家都已经被认知了。
为此,刚才今天说到这个数据开放,事实上我们国家关于政务公开,在2007年2008年国家就有条例,但是在今天大数据成为重要发展趋势的今天,看看政府出台关于政府信息公开,我们现在咱们北京市政府信息公开的条例是今年5月份通过了市政府常务会议,这个条例是要求所有的政府部门,有一些信息是必须主动公开,其中有一部分信息是要申请公开,除了少量的特别的有一定的不能公开的之外,就要求是要全部公开。这个咱们北京市的条例是2015年1月份也就是马上不到一个月就实施了。所以在政府信息公开方面我觉得非常重要,就是如果我们把信息作为,今天看到的一个词,叫做可再生的矿产资源,这样一个词,我们首先要存在,这个信息要存在,特别是现在已经存在的政府的电子信息要首先带头向社会开放,我觉得这是非常重要的。然后就是我们的企业也要把一些有价值的,既然叫矿产,我想如果没有价值就不能叫矿产,可能叫一般性的资源,既然叫矿产,我想它一定是有价值的东西。所以政府带头把有价值的信息开放,另外政府从2012年底开始研究这个产业,到2012年底正式出台了一个发展意见,到今年很多资源配置到这个产业,比如说现代服务业有三支产业其中一个已经配置在大数据产业上了。昨天我还参加了北京市软件交易所昨天有一个叫信息交易服务平台。我们中关村现在已经成立了两个产业联盟,一个是大数据产业联盟,还有一个数据交易产业联盟,这样通过联盟把各行业内的资源组织起来,这样形成规则,形成行业自律,让政府带头,通过这些以企业为主体,通过产业联盟这些产业组织来推动这个产业的发展,我们希望这个信息,社会上的有价值的信息,要向全社会开放。
然后剩下的可能一会儿有同志会提到,有的是要加工,有的是要有工具,数据你不加工可能没有那么高的价值,就像矿产似的,大家知道中国现在最丰富的稀土,稀土我在长春碰到了一个故事,长春硬化所的人告诉我我们国家原来搞原子弹,提取技术的同时在后面顺便发现了稀土资产,我们国家的稀土现在产业量超过75%,所以我们去挖油技术有原料的时候把这种元素找出来,后来这种元素把它用在基础材料里,所以后来的稀土广泛地应用到各种各样的材料领域里头,所以应用和加工,提成技术都非常重要,这些话题由其他的同志来讲,我就代表中关村管委会讲一下我们的组织方式和我们对这件事情的认识,我们已经把大数据产业作为一个迁延性的产业来发展,希望大家都广泛参与到这件事情上来,谢谢。
主持人:非常感谢宣鸿总的发言,本来第二个重点话题关于数据开放,宣鸿总已经把谜底开放出来,开放是很重要的问题。
黄文良:大家好,我们来自于中国联通,我们从2001年开始讨论大数据,坦白说我们讲大数据的时候,一直到现在我们还再做。我们整个中国联通,因为有了大数据才使我们下决心基于很多IT平台走向集中化。举一个例子,我们第一大数据是移动用户上网积累,我们联通每天大概1500亿条记录,每天存储大概是30个T左右,整个数据存储量是非常大的,必须是很多要快速处理。这里面主要是解决了用户流量产生以后不知道这个流量去哪儿了,是后台什么应用在消耗流量还是等等投诉的问题,有了数据资源明明白白消费,我们是第一个传统用户流量提供的。
第二个,运营,既使是你拿手机没有打电话也没有上网,也有性能的消息,也很有价值,基于用户,基于地址啊也是海量的,我们大数据很多人会听到了大数据产业的方法,我这里跟大家分享一下会有很多误区,很多人都是想把大数据先存起来,再挖掘统计分析,这个管理在我们运营商行不通,我们先存起来我们几十个T的数据,怎么管理。一头是IN,一头是OUT,所以我们运作程度上一般是看到了OUT的时候,再去哪些东西该引进。一旦有价值的东西进来,如果还没有看到有价值的东西存起来。这就是第一个。
第二个就是大数据有很多困惑,大数据的安全。我给大家分享一下,大数据的安全,中国确实是没有国家层面的法规,但是我们基本上的做法就是看到欧美怎么做,他对用户隐私保护怎么做我们就学他怎么做,因为我相信欧美对隐私重视程度可能比中国更加重视,所以我们对所有大数据处理,涉及到用户个人隐私的地方,我们全部是匿名化,不可能提供手机号码,全部是二维码,我开放出来,你也不可能开放4亿用户上网的数据。这就是大数据安全层面。
第二个我们现在应用对外部应用主要是统计数据,而不是个人数据。统计数据比如说我们提供什么情况的智能手机受欢迎,政府规划的地方哪个地方人流最大,比如说商场哪个地方最有效。这个地方是没有个人的信息的。
第三个,即便是要涉及到用户隐私的信息,比如说自然环境发生灾难,比如说雪灾,地震,我们也是通过授权使用。比如说雅安地震时我们有时间可以找到哪些地方出了问题,比如说他是雅安人,但是没有在雅安,这时候我们可以通过公安部门把涉及到用户影响的给他们提供家人联系。这是我讲的作为电信大数据安全都是非常严格的保护措施。谢谢大家。
感谢黄院长的表达,因为确实是在资源价值上是丰富的丰厚。我想待会儿也会就今天这样的主题,围绕数据的开放,数据的聚合和数据生态这三个关键词请各位嘉宾继续论述,待会儿详细可以互相提问。下一个请建行的信息部副总经理刘总给大家做一个介绍。
刘贤荣:谢谢大家,我是中国建设银行信心中心的刘贤荣,我跟大家介绍一下我们关于大数据应用的看法,对于银行数据就是传统密集型的产业,银行所有业务,资金也好,交易也好,除了用户资料就是传统的数据,银行数据做了大量的工作,我们从2006年开始实现数据仓库,企业级的整个数据仓库里面我们把整个现在从大数据层面来讲叫结构化的数据,进行整合,形成了银行很多的整理,包括客户关系管理,风险管理,还有运营有效率。但是从过去来看,银行数据应用实际上很多方面都是限制于我们传统意义上的数据分析,尤其是大量的统计工作,银行面临的整个业界环境其实跟行业不太一样,最大的特点就是监管非常严格,就是在整个数据管理和数据应用方面从国外银行视角和国内银行视角,做了大量工作怎么样做到数据归类分析之类的。但是从2013年我们看到整个银行业发生最大的变化,现在很多银行都在谈很多转型,转型一方面是利益,我们发现银行经过十年改革红利的发展,我们经过十年的发展,对客户的认识,下一步盈利的发展方向受了限制。但是更大的是挑战,挑战就是这两年非常火的互联网金融,包括像支付宝,余额宝,甚至像互联网P2P的公司实际上给我们造成了很大的思想上的冲击,从整个银行体系我们反思银行怎么使用数据的限制。银行是一个数据驱动型,或者他们核心竞争力是大数据,但是从我们视角来看,我们认为如果我们要转型我们到底是用什么视角来看待这个问题。总的情况是两个方面的认知,第一个方面的认知我们认为数据对于未来的转型和发展是核心的工具,包括银行业投的比较多的数据战略也好,实际上这里面最根深蒂固的一点是我们怎么样利用数据来改进,或者是来整个挑战我们银行的整个传统业务,包括怎么样利用数据优化我们的流程,怎么样提高我们的管理,这是我们从资产质量来看。
第二个方面我们从整个银行内部管理或者提升银行精细化管理能力来看,上个世纪末比尔盖茨提过银行成为二十一世纪的恐龙,现在看来还没有这个迹象,但是未来几十年内这样的发展对银行发展到底挑战是什么样子。我们目前最大的挑战是两个方面,第一个方面我们银行和客户的关系到底有多疏远。很多互联网公司,包括我们很多电商,他们利用了他们和客户的紧密关系,来对银行传统业务的挑战,我们很多产品大家都感受到了。像京东的白条,阿里他们和用户最底层的连接比银行要紧密的多。
第二个是银行业金融传统的不对称,很多的银行不良贷款今年突然爆发,尤其是特定的区域和特定的行业实际上对银行风险很大,因为传统意义上构建很多数据风险模型,但是我们在风险来临的时候并没有起到对于预测的作用。这个时候我们进行了深入的反思,所以我们下一个方向是怎么样整合数据,怎么样和业界同仁一起,一方面是内部和外部数据整合,另外一方面怎么样数据方法和数据逻辑上找到一套新的思路,就是怎么样帮助更好的银行前瞻性的看待东西。这是我们看待银行的第二个视角。
因为后面还有讨论。总结起来我们今天走到银行战略转型里面,即视角来看,两个核心视角第一个视角是客户,第二个视角是数据,这也是我们为什么到今天谈大数据的原因。
主持人:谢谢刘贤荣非常清晰的视角。请糜万军先生来做介绍。
糜万军:像当年发现数据人才,真正希望凝聚把数据库和价值挖掘构成,和把这个价值挖掘出来,从学术上我们希望成为人才的平台。从产业上我们数据产业也是投资的,像能够有跟国际有影响力的大的创业公司,同时我自己也是创业者,我们公司是京奥伟数据,我们尝试是传统电信运营商的数据挖掘和行业变现。
主持人:谢谢糜总。
董云庭:主持人没介绍,我自我介绍一下,我是中国电子企业协会的会长,现在大数据已经成为了全球的一个共同的话题。美国国家情报委员会前一年年底发布的未来主导全球经济的十三项技术,讲到讲到IT是三层,大数据,网络数据,智慧城市。今年的头四项技术,大家认为未来主导全球技术的是哪个技术?第一个还是大数据,第二个是纳米技术,第三个是机器人,第四个是新能源,第五个是神经科学。
马云最近说全球社会已经开始从IT时代进入了集群时代,信息时代进入了数据时代。所以今天主题是应用,所以我觉得应用还是先讲这么几个事情,第一大数据必须具备了四个要素,一个是它的规模,第二是它的多样性,换句话说应用性。至于规模刚刚联通讲是最多多少P,根据你的需要来匹配。第三个是它的处理设备,像刚刚百度讲的一天处理30亿的数据。第一次它必须要应用设计应用价值。另外一个大数据具备八大特征,第一是它一定要开放的,这个信息必须公开透明,这样使得我们每个企业每个公民机会均等,权利公平,市场才有可能走向前面。第二个是共享,共享我们现在碰到最大的问题就是资源和欢迎,我们利用信息数据资源去取代环境资源。
第三个特征就是跨界。这个跨界我想大家都了解到了,今天你不跨界明天你肯定要跨界,摩托罗拉和诺基亚都是这样死。第四一定是融合,大家更多的讲了软件和硬件结合,我觉得我们必须是网络软件和硬件的合谋,最好能够给客户提供。还有一个大数据不能处理因果关系,但是今后都是相互关系。再一个大数据利用必须通过创新去应用,但是我讲大数据我觉得这个应用至少存在若干问题。第一中关村讲实际上我们现在第一大问题是数据结构。我搞智慧城市建设已经搞了两年多,现在全国有400多家城市在推进,但是这个数据问题没办法解决。比如说在西安,地震局的数据和公安局的数据结构不一样,不能同时对接。再就是杭州公安城管数据不能统一,中关村数据比较统一。所以这可能是第一大问题。
第二大问题是大数据的搜索引擎没有解决。第三个是实际上就是计算机的并行技术不能解决。我看中科院软件所所长说资深研究员,比如说百度20万的服务器是布局布局在几个领域,比如说像Google,他光在芝加哥的布局就是15万台服务器,一定是分布式,所以一定牵扯到大规模的可并行的计算方式。第四是信息安全,刚刚亚信讲的信息安全还停留在原来的信息安全。我我想我们信息安全考虑四个层面,第一是网络信息安全,现在网络设备交换机路由器80%控制在美国人那里,国家信息安全就是问题。第二个平台的安全问题,他的数据必须通过平台来预测。到目前为止,我们操作系统的97%点几,数据库的95%,中间件的90%,都是安全问题。第三个是数据安全,这个数据安全传输过程当中一定是人家那里,会不会解决,会不会拷贝,会不会传染。你现在的处理器全都是美国的,如何用在服务器操作系统是开源的,也没有安全的。有没有说WINDOWS,那也是没有安全的。里头有一个终端的安全,最后一个终端安全,现在智能终端用的85%都是用的安卓系统,完全是开放的,有100多万款的APP,每一款都可以窃取你个人用户信息,所以信息安全可能不是一般人能解决的,否则我们习近平同志也不会去建立网络安全与信息化领导小组。
再有一个问题,我们目前大数据基本上还是处在初级阶段,我前几天和IBM中国区负责人跑到我这里来,我说大数据、云计算、智慧城市都是你们忽悠起来的,我觉得大数据没有做更多的选择,特别是应用,讲到应用,未来企业应该有几个环境,第一智慧城市,日本人统计全球智慧城市投入的总量4000亿元,但我们统计,当然我代表住建部的发言,我们中国人智慧城市大概是600万亿,因为刚刚讲了,杭州,洛阳,泉州他第一期投入基本上保证5000亿,我们初步建成智慧城市可能需要200亿。我们大概有200、300个左右的地级智慧城市,但智慧城市还有一个问题需要解决,它的技术问题。到目前为止我评审过的50几个顶层设计也好,总体规划也好,基本上没有智慧城市,换句话说大家都停留在信息化阶段,稍微好一点停留在数字化,也就没有把信息化、数字化和智慧化这三个结合起来。这三个阶段是是我们企业可以考虑的的一个市场智慧。
第二个是工业4.0,工业4.0一定是大数据传感器为主。我估计工业4.0,我们中国人现在估计大概是2.0,现在中国的市场规模到2020年可以达到6万亿。第三个市场机会是信息消费,我想国家32号文件里面讲,但是32号文件里面把我们信息消费总量估计的低了,当时说要2015年3.2个万亿,我们去年信息产品是2.76万亿,信息消费是1.5万亿,所以两者加起来一定超过4万亿。所以我估计到2020年我们全国信息消费总量大概是6万亿。
第四个是传感器,因为你大数据应用如果不跟传感器放在一起,我觉得你是用不了。就像2009年温家宝去看了国家的物联网以后,财政部也说5个亿,他讲物联网,依我看基本上是物联网一定要是以大数据作为后台,要以传感器作为中间。在去年传感器市场规模1万亿,美国佬估计到2020年全球传感器量是100万亿,今年Google在今年上半年花了300多个亿收购了12家企业,他正准备在全球布局智慧家庭。我们估计你一个智慧家庭大概至少需要100个传感器。我们现在正在推汽车电子,汽车电子大概也需要100个传感器,医疗电子可能会更多。
事实上还有一个市场机会,我觉得是企业界对行业界的解决方案。亚信第一个领域讲到企业界的解决方案。这个在大数据或者是在移动互联网,原来像用友,已经不再前瞻。我们必须更快地研发属于移动互联时代的企业解决方案和行业解决方案。这是我想讲的第一个。
第二个主题生态系统。我是这么理解,这个生态系统从信息,物质,能源,资金,以及到供应商,生产商,物流商,用途,以及废旧产品的回收,环境资源,这样才叫一个生态系统。我觉得生态系统至少有两大特征,第一它必须运用这个大系统。这个是1977年获得诺贝尔物理学将的普利巴金提出来的。现在至关重要的一个环境的问题,或者是一个子系统。比如现在智慧城市提出来的方案,说现在不提子系统。你们软件园评估方案我提出了三次。第二个一定是共赢的,跟目前中国讲,对于以后像一切领域对于生态系统的建设完全渗透一直持续不了,因为时间关系我就讲这些,谢谢大家。
主持人:非常感谢董老先生的精彩演讲,已经不讲自己,把中国的方方面面都介绍了,非常多的干货。董云庭他是住建部智慧城市的兼职专家。
董云庭:同时我是产业信息化的顾问。
主持人:非常多的名头,至少我们看这是资深的产业经济学者、专家。最后我们把话筒递给齐红威,因为他是真正的中国数据交易的先行者,他也是数据终端的博士数据堂的CEO。
齐红威:我是数据堂创始人齐红威,为什么站起来讲,可能在不远的将来,我们可能在座的大部分人有移动合作关系。今天的主题是聚合数据资产,我觉得这句话特别像我们企业的SLOGN,我们过去三年半时间内已经聚合了IT,交通,医疗,健康,5000万的数据积累,这是由我们独立完成的数据。刚刚从新三板挂牌,这是我们国内第一批真正自助交易的。再分享一个观点,在座的大家可能都关心我们一直在谈大数据大数据,但是数据到底怎么来,数据是飘着的,怎么落下来,我们能够把数据拿过来。我们过去有这么几种操作方式是可以把数据拿过来的,有这么几种感觉。第一个是互联网领域都在纷纷往线下映射,这个过程中大家非常需要一种数据叫线下数据,包括我们衣食住行的数据。这个数据有很大的问题就是现时很大有数据放在那里,都是分散在每个人身上。通过众包的方式来去获取,在我们平台上获取提供衣食住行的各种各样的数据。这种数据目前来讲就是线上往线下映射。
还有一种就是我们各个行业的数据,包含我们传统的医疗、健康,交通,电力,这些行业在服务过程之中产生了大量的数据服务的子产品,这种数据好多人没有意识到这个数据的价值,有的人意识到但是不知道这个数据发挥得价值。这个我们传统链里面有各个相关的数据,这个大家可以到行业里看这类数据。
还有一类数据像刚刚提到的政府数据,像电信的,金融的,这种数据是掌握在特殊的服务部门或者是特殊的厂商里面,这个数据大势所趋数据慢慢都看来了,政府数据开放非常快,这也是非常好的趋势。最后一个小广告,用数据方式聚合数据,如果在座的各位有数据可以找到我们,如果大家有数据可以找到我们。谢谢各位。
主持人:因为他站着讲,讲一句广告词也可以接受。下面进入一个环节大家刚刚都做了很好的分享和介绍,刚刚大家对于大数据存在的问题,我想大家围绕今天这样一个主题,汇聚和创建数据生态关键词来展开,今天数据交易,我想问黄院长一个问题,对于集成商数据来讲,他拿的到了数据。从运营商来讲,你认为对于数据交易大家很热点的词汇来看,运营商怎么看,什么是运营商数据愿意开放平台化交易的所谓开放的前提?
黄文良:坦白说,其实我们现在,包括匿名化的手段,数据的安全是做的非常好。比如说我这个数据给你的时候,就像淘宝上的定单一样,买家的信息你是没的,他可以开放给你今天早上有交易,但是不会告诉你哪个买的。但是我们整个社会很敏感,一听到运营商数据交易以后,我们管理层,可能来自误解的压力接受不了。所以现阶段我们的数据基本上是围绕着怎么样改善我们的网络,优化我们的网络,提供我们更好的服务,提供更精准的业务推荐,包括改善我们的服务水平,主要是以内部使用为主。
主持人:我想还是请宣鸿主任也回答这个问题,对于开放来讲,因为政府的数据开放也讲了2015年1月份政府相关政策推进,而且中关村管委会也在推进数据交易,您怎么看待数数据交易未来三年以后会是什么样一个场景,未来是不是永远不能被开放不能被社会所用的价值?
宣鸿:应该说中关村这个地方的产业发展速度很难估计,比如说三年之后数据产业到了什么样一个状态是比较难估计的。我想那个时候可能随着应用刚几位同事都提到应用很重要,这个产业发展成什么样子,刚刚联通研究院院长说什么东西进来什么东西出去,关键是怎么样通过出去挖掘它的价值我觉得这是非常重要。我觉得很可能应用它决定了未来数据产业发展到什么样子,所以在座的各位企业家和专家们,我们希望在这方面可能要多做一些工作。
另外一个关于政府数据的开放这个事儿,我想是这样,因为政府是一个公共政策的制定者,也是公共政策的执行者,所以应该说能开放尽开放。我觉得这件事情不仅仅是因为关系到数据产业的问题,可能关系到另一个问题,可能关系到国家政府行政工作如何进一步地用开放的形态去为公众服务,我觉得这是可能不仅仅是一个产业命题,可能也是一个社会管理,也是国家治理的问题。我们党的十八大最重要的一个话题就是治理现代化,我想随着我们国家,这是一个长期的任务,随着我们国家治理现代化我们的行政方式和社会组织方式有影响,我想我们国家尽量的做到能开放既开放的这么一个局面。
主持人:谢谢,我相信宣鸿主任和黄院长讲的话应该既是开放和数据需求的资源,应该说管理运营商的发展,也是一个需求资源,刘总应该更是数据需求者,金融行业完全需要跨界来做很多的金融风险,贷款风险等等。如果说有一天运营商数据政府数据能够流动,并且聚合到银行以后,您怎么看待这样一个聚合对银行业的价值会是怎么样?
刘贤荣:谢谢,这是我们梦寐以求的目标,刚刚我谈到银行业务来看真正的目标就是客户,我们从数据整合到数据分析里面关系到几个方面,一个是真正的银行需要什么,现在我们提出为客户创造更多价值,这是我们怎么样利用数据来帮助我们的客户,同时帮助银行共同实现价值的方向。
第二个是风险,银行本身是接近风险的企业,我们说我们理解客户的越多,我们把握的风险越透彻,我们希望一个是它未来得方向是什么样子我们预测出来,现在讲大数据,最重要的是预测,这也是梦寐以求所要达到的目标。但是刚刚谈到了开放和聚合,其实站在银行的经营者和管理者来讲,我们当然希望数据越多越好,对银行把控风险更好,因为对数据更准确。但是还有一点就是数据聚合过程中最重要的是隐私和数据风险,大数据开放,开放过程中如果往深一点谈,我们希望我们在座的多数都是生态链中的链条,不管是上下游还是供应链,但是我们希望这个生态能够更健康一些,这个健康因为有两个最重要的就是我们知道自然的生态,我们需要水,需要氧气。我们在整个数据里头,在共享和开放过程中我们需要有一些标准,其实还需要有一些底线或者是一些规则。这里面最终的规则是要定义好哪些数据它的拥有权是谁,这点我们将来数据库开放和整个数据库聚合里面,作为一个数据从业者我是最关心的问题。大家知道数据里面最有价值的部分是身份识别的部分,我们一旦能够识别到一个客户,实际上他后面的数据信息能够把他串起来,但是所有的信息理论上来讲它的所有权应该是我们用户自己,我们允许数据开放,能够允许数据授权给谁来用,这样才是后续数据开放的基准,但是这个需要在座的方方面面从政府到企业到各个方面的监管者我们不同的努力,这是我最为关心的这一点。第二点在聚合过程中我想实际上刚刚也提到了一个标准的问题,在整个做数据的同志都知道,在数据里面很核心的有很多方面,但是如果挑出两个最重要的第一个是数据质量,第二个是数据标准。以后开放,包括企业数据,包括以后用户能够授权开放的数据,这个需要更高层面的,国家部委开放层面的,从一个高层次方面的视角来整个的统计整个全国的大数据,这样对大家都是好事情,以后对数据创造都是更好的环境。
主持人:谢谢,作为需求来讲既很卷心隐私,开放的数据,也是有一个诚信的关系,有一个对用户隐私保护的责任。我想我们为什么聚合数据,是因为数据聚合在一起,比如说银行和运营商,很容易产生化学反应,比如说身份识别。我想请齐总回答一个问题,你在三年产生数据,不同的数据产生过哪些化学反应,你为用户带来最好的价值。这个价值不是单一数据所提供的。
刘贤荣:张总这个问题非常的到位,我举一个案例,我们其实数据底层的全国人口大数据,还有全国人口出租车的位置信息,还有公交的刷卡数据,这几套数据单独看价值不高,或者是价值没有聚合之后那么高,这个聚合之后的价值出来了。好多药店、麦当劳选址是很大的问题,都是通过全国普查数据,可能是2010年的数据,但是如果我们把出租车的数据加进来,代表了人口的流动,公交卡的数据加进来,也是大量的人口数据,这个适合开麦当劳店还是开水店,这个案例非常好。
主持人:我想其实这个只是一个很小的例子,我们可以想象的空间其实很有限,将来只有把大量的数据集合以后才有可能实现数据的经验,这些经验产生一定会带来我们真正构建大数据生态的结果,我想对于创建生态来讲,糜总在大数据也做过很多的研究,一直在创建这样一个生态的推动者吧,请您也看一看我们离构建成功这个生态体系还有多长的路要走,还哪些困难要克服?
糜万军:我们讲产业生态,生产服务业是理论研究提出来的,目前这个产业生态向生产型服务业转型升级,数据挖掘价值变现是一个大趋势也是必然的推动力,在这个过程中很多产业走在前面,我觉得这个一个是靠企业的资力,还是从企业的经验。从这个方面来讲,数据开放也牵扯到两个,一个是原始数据开放,一个是数据信息的开放,本身是两个层面的问题。数据开放以后是说看欧美数据还是国内数据,也不是全部开放,也是定向授权开放。这个要国家信息安全。所以不同的细分领域有很多的不同共享开放的方式。
主持人:好的。也请董云庭专家来帮我们去解读一下这个问题,我们创建生态的话,您是站在国家的产业高度刚才也谈了很多有意的话题,您认为这个创建生态,需要我们在座的各位企业家能够做哪些工作,而且这些工作不管是以前做生态做运营都有很大的差异,但是心态上工作方法上都不一样,您这块有什么好的建议?
董云庭:这个产业链和价值链,打造产业链的时候他们公司在考虑怎么样产生价值链的问题,比如是联想,哪个环节都在考虑价值链。跨国公司也是考虑,必须要打造和建造一个产业链。建设产业生态系统,现在第一个是企业的社会责任感,第二我特别想讲一下,前一段时间我到废旧电子产品回收企业,我们现在应该开始提倡公民的社会责任感。这句话什么意思呢?比如说你这个废旧电子产品你不要卖给他们,你应该送到统一的收购点。第二个我的意见,我们在这个生态系统当中,因为只有大数据才能实现这个供应商、生产商、营销商以及用户四者之间无缝衔接。所以一定是要合作共赢,不能私底下打小算盘。但是从目前中国社会来看,这一举措很难。
还有一个我特别想说,大数据我们以前有个信息公务员,如果你按照公务员完全服务,我建议政府部门能不能参与上海自贸区的负面情况,采取禁止原则,现在肯定是允许原则,什么能公开什么不能公开。我未来希望中央政府或者是国务院政策,你什么不能开放,这样大数据才是在比较正常健康的生态系统。这个健康的生态系统,打造共赢生态链,是谁来创造共赢?比如说中关村打造一个智能终端,这个产业生态系统,做出来非常难,我觉得是非常有意义的。
主持人:周主任给您提一个建议是不是建立轻运营商的建议?
宣鸿:这个建议非常有价值,将来是这样。中关村政府这块政府是很特殊的政府,是政府派出机构,往往透明度是很高的。所以我们的一些工作,比如说我们的产业数据工作已经在开始了,跟龙庆数据我们已经建立了一个开放数据平台,已经在开始做了。
董云庭:亚信也好,云基地也好,非结构化的数据怎么存?逻辑上来说非结构化的数据比结构化的数据更有用。
宣鸿:非常同意您的观点,产业前沿,社会最需要什么样的东西,我们通过大数据公司来提供。其实大数据就是相关性的寻找,其实不是很准确,但是具体的寻找非常有优势。我就延伸把产业生态这个话题说一说,事实上中关村的搞法和其他的高新区的搞法可能不完全一样,中关村应该说取得今天这样的成就就是创新和创业生态的建设,抓好创新创业的生态建设这是中关村这些年最根本的经验。所以关于大数据的产业生态,我想可能放在一个区域内大的产业生态讲,比如说是在金融人才各个方面我们都有很好的构建,另外在未来中关村提出了一个叫做战略新兴产业集群,我们未来已经成链了,价值链连接起来有竞争力的产业链,在未来的几年里头结合习近平总书记3月22号到北京视察工作提出来的高精尖的经济结构,这里面包括高精尖的产业结构,我们会在一定时候内围绕产业结构,我们围绕产业方式把资源做到有所为有所不为,集中到重点的产业区域,尤其是像大数据产业。另外重点工作就是创新创业生态里面有很多的要素,政府只是促进这些要素的一环,使他们发生关系。比如前一段时间信息局的局长到我们中关村来,他实际来进一步优化工程,我们想这个对中关村生态有用,那天提到大数据,他说可以让百度先试,让马云在浙江先试,不知道今天是不是有百度的同志在,我们说起这件事情就是要推进,就是把事情赶紧抓紧推进。咱们统计局我们做一些形式的分析和预测,咱们数海公司已经在合作了,政府为这些新兴的产业,特别是刚露头的这些大数据公司,在这一两年政府要和他们结合互动,这是一个方式。一部分不是直接方式,通过产业联盟通过产业协会来推动这个生态要素,我觉得这是我们的方式。
中关村既然把大数据已经选为我们前沿领域,就会在这个生态建设上会把我们有限的资源会集中在这样重点的产业领域。谢谢!
主持人:非常感谢,有中关村管委会这样国家级的创新基地来推动,我相信我们对于搭建大数据产业生态一定会起到非常好的作用。过去大数据领域过去三年里面很多企业在大数据方面得到了非常好的进步和发展,今天和各行各业各位嘉宾一起做了关于建议生态大数据的探讨,我想我们在座的各位还有很多的企业家也希望一起来加入到我们这样一个共建生态体系的联盟合作中,亚信来讲不仅是今天发布的产品,我相信会有2.0、3.0一定把大家所关注的问题继续更好的解决,但是我们作为一个企业能够希望以开放合作,有利于别人的出发点来去做事情,这样的话,我们的生态体系一定会早日搭建,推进国家的大数据治理。我想今天我们上午的论坛就到此为止,也非常感谢各位嘉宾的精彩分享,下午有三个分论坛,分别是电信,金融和智库的分论坛,下午再见,谢谢各位!