众企业高管激辩:大数据时代,如何抓住机遇迎接挑战?

□王涛(王涛(主持人),爱奇艺首席科学家):视频大数据助力影视、动漫、游戏行业,云服务终将实现

□王井东(微软亚洲研究院主管研究员):数据库的建设、标注与数据联盟的建立十分必要

□侯宇涛(英伟达CUDA应用市场总监):GPU和高性能硬件加速深度学习发展

□赵世范(海康威视大数据开发总监):人脸识别尚不成熟,人脸验证已具备实用条件

□谷沉沉(腾讯微信事业群高级工程师):大数据改善用户体验,腾讯不靠卖数据赚钱

□王田(华为研究院媒体研究室首席科学家):5G网络将在2020年左右进一步联连通世界

□谭晓生(奇虎360科技副总裁):大数据开启网络安全与隐私新格局

大数据

(上图从左至右)

■大数据已经很“大”,但远远无法满足现实需求

王涛(主持人):最近几年来,由于互联网、移动互联网的高速发展,手机、摄像机、各种传感器数据采集的设备,并且能传输到云端的数据中心?大数据的增长非常快,在未来的10年要增长八位数字,比现有的数据还要多8倍。诸位从自己所在行业的角度出发,你们感觉到最大的需求和问题是什么?大家是如何看待大数据时代的机会与挑战的?

谭晓生:我在360主要负责大数据计算和信息安全。2010年,360做了一个基于大数据恶意文件的鉴别引擎——QVM,今年第一季度QVM在全球一次评测中与卡巴斯基全球并列第一,满分。我们的做法就是基于80亿的大数据样本,颠覆了过去特征码利用扫描的方法。除此之外,在两年多之前,我们开始做基于网络的全流量的监听的供给检测,采用了有监控的学习方法,现在进入到了无监督的学习阶段,最基本的成果就是帮助国家抓住了进行API攻击的犯罪分子。我们用大数据的方法在这方面取得了非常丰硕的果实。我们知道大数据技术的效果很好,存储也已经非常强了,但是怎么样去做更大规模的数据计算呢?这是我现在觉得非常值得关注的一个点。

王田:在大数据方面,华为主要提供通讯设备和网络服务。网络在将来一定会比现在好,会有更高的要求,但具体是什么?比如说对连接数有什么要求?网络响应有什么要求?带宽需要有什么样的要求?我们的通信实验室会根据不同指标和情景做大数据研究。我们考虑更多的是网络的关系,未来大数据里面网络到底应该起到什么样的作用?2020年网络可能是5G,5G业务对网络有一个更高的要求,不仅是带宽还有延迟,还有一些年际数。

谷沉沉:我在主要工作是做微信上面的视频分发,腾讯一直在做一些海量用户的行为的大数据搜集和分析,研究对现在的产品做哪些改进?同时还要对现在的产品质量在海量用户中做一个评价?腾讯的用户量非常庞大,微信现在有5亿用户,视频通话产品的日发起量也是千万起,这样一个海量用户的产品,如何让更多的用户对我们的服务感到满意?就现在来看,无论我们怎么努力,每天我们去看用户反馈,总是有用户在骂我们的产品,说视频通话不清晰、不流畅,现在也在做这一些的尝试,搜集大量丰富的数据,针对一些用户细分场景,比如中国网民是4G网络还是2G、是20兆带宽还是2兆带宽?这样网络的差异和手机性能差异都影响着产品的体验度。

赵世范:海康威视在今年成立了研究院,主要有两部分:智能视频和大数据。大数据组的主要工作,是将智能视频识别以后的对象进行分析,比较成熟的是车牌识别记录下的车辆过车信息。目前的主要工作是协助公安系统做一些案件的侦破,之后也会做一些城市交通疏导方面的工作。海康威视意识到,视频监控的车牌识别还是一个比较成熟的应用,有一些过车记录数据产生;而另外一方面,针对场景的视频识别,还有一些基于人的视频识别,技术难度较大,是我们现在需要解决的问题,比如:第一个,从一个场景里面把人提取出来,同时能够提取场景里面的一些物品;另外一个,实现多个场景人的关联。

王涛(主持人):你们这个是什么级别的量体?需要知道视频这一时刻有人、有物品?还是说需要知道这个物体、人在什么位置?是哪个人?是哪个物体?

赵世范:监控视频领域已经从标清到高清,但实际上高清目前也就是200万到300万像素,而真正能够让给机器达到人眼相似的识别度,像素要到1200万左右,清晰度还需极大提升。目前视频里对移动对象的识别是非常成熟的,可以知道这个视频里面有什么对象?这个东西是人还是车?或者里面有多少人?但这个人和另外一个镜头里面的人是不是同一个人?目前在判断上是非常困难的。计算机对人脸的识别技术有一定的发展,特别是在深度学习应用以后,在互联网应用中有一些突破,但跟安防领域比还是有很大差异。第一个,它的色彩度不太好;第二个,它有很多的形变;第三个,受清晰度和光照等因素影响,会变模糊。判断是不是同一个对象现在非常困难。