众企业高管激辩:大数据时代,如何抓住机遇迎接挑战?

侯宇涛:英伟达作为大数据产业链里面的技术以及相关支撑产品的供应商,致力于能够降低大数据计算及处理的计算时间。我们目前面临的最大压力是来自于客户的期望,而且GPU可以加速变形计算的处理,目前加速的速度相对以前已经很高。香港大学的两位老师以前在做人脸识别的计算,一个简单追踪的过程需要20天,用了GPU以后,由20天变成了6小时,有很大的提升。他说,你能不能再快一点?80倍的提升仍远远达不到大型数据采样的需求。英伟达力图优化内存采用3D的构架,并使单卡的内存可以突破24G或者更高,这样可以使更大规模的数据同时得到处理。

王井东:我在微软的主要工作集中在大规模的相似度搜索,有一些技术应用在微软必应搜索这样的产品里面。现在已经有大数据环境,其实直接能够用来帮助去做研究的数据还很少。刚才余凯老师提到,大数据已经很大,但是学术领域里面最大的数据比如ImageNet,也有1000类,fine-grained classes也只有22000多,在实际应用里面还是远远不够的。我们希望将来对大的数据都会有标注。我总结起来就是数据问题,怎么样能够做到更好,更reliable(有用的)的帮助研究开发。

■人脸识别尚不成熟但大有可为

王涛(主持人):刚才说人脸识别是一个很重要的发展方向。前面在特定的数据之上,达到百分之九十几,但在实际的视频监控上差距比较。从商务的角度上来讲,这个差距在哪个地方?未来有什么样的发展方向?

赵世范:在很多应用情境下,多人脸识别的准确率是很高的,比如说安检通道,或者是固定的出入口。但是从别的行业应用来看,人脸识别还有较大局限。第二个,在室外的话,拍摄的角度一般都是由上往下的,如果要真正做到人脸识别,架设高度只能接近两米左右,而现在大多数摄像机的架设高度是3米以上的。另外,人在走路的时候会有摆动,拍摄下来人脸的照片不会是正向的。目前来看,室外环境下,识别准确率能达到50%已经很不错。

余凯:我对人脸识别的话,持一个比较谨慎的观点,考虑这件事情的话,至少要分三个维度:

第一个维度是场景;另外一个维度是应用的任务。通常大家会混淆两件事情,一个是人脸识别,一个是叫人脸验证。人脸识别对应的情景是,不知道这个人是谁,也没有人告诉你这个人是谁。人脸验证问题要简单的多,近期内有可能成为成熟的实用技术。而人脸识别技术在绝大部分场景都不实用。另外还有一个维度,我觉得是商业模式的问题,一项技术是整个产品里面的feature(特色、功能),还是说它本身就是一个产品?

王涛(主持人):解释的非常清楚。刷脸技术,很多情况是把验证与识别混淆在一起,非常感谢余院长给我们的解释。

赵世范:我再补充一点。不管有怎样的验证方式,它最终都有一个数据是存在计算机里面的,这个东西总有办法能够偷走,总有办法能够去欺骗通机器。人脸,可以做3D打印的面具;指纹,可以做指膜。而生物识别它是不可撤销的,比如我们没有办法换自己的DNA,但数据本身是可以偷走的。生物特征是辅助识别,但是作为唯一的主识别的话,风险是很大的。比如指纹失效的话,还可以按密码。

■开放大数据,构建生态圈

王涛(主持人):大数据时代首先的核心是数据,大数据在未来是否会变成一个商品?甚至它的价值可以与石油来媲美?未来数据将开放、分享,而是建立大数据联盟,怎么能够高效的在数据分享平台上进行工作,想请各位嘉宾谈一谈你们的看法。

赵世范:实际上,海康并没有数据,海康为业主提供大量监控的设备,但是这些数据都是属于业主的。第二个,用户已经有大量的数据,会提供一些技术手段帮助用户进行数据的分析,但到底是提供数据还是提供服务是有商量余地的。数据共享最大的障碍是隐私的问题。如果别人拿数据用来犯罪,威胁到了当事人的人身安全,这件事情怎么办?大量的数据是坚决不允许拿走的。如果有少量的样本数据,拿过去之前,也要经过脱敏的处理过程,像今天这种大数据分析的时候,脱敏的作用都不大,脱敏之后照样可以窥探到用户的隐私。

王涛(主持人):给出了非常有价值的观点。谷女士来自于腾讯的微信,从腾讯来说,对于大数据的方向,你们对于这个方向有什么样的看法?

谷沉沉:腾讯这几年一直的观点就是开放,我们希望把数据开放出来,但一定是保证安全的前提之下,保护用户隐私的前提之下。我们可以把一些东西开放出来,给广大的创业团队,或者说其他的一些企业,构建一个互联网、全方位的生态圈的,这有利于整个生态圈的发展。腾讯不会去拿大数据卖钱,腾讯公司肯定不会差这个钱。主要在于怎么去利用大数据帮助我们去改善产品体验,如果有一些想法,我们是非常开放的,欢迎大家一起来利用数据去改善业务。