数据孤岛现象又开始严峻 大数据创业进入迷茫期

从《网络安全法》来看,“顺丰把数据给阿里巴巴,按照法律规定,这是违法的,里面有公民隐私数据。”龚才春分析道。但是,紧接着,6月初,国家邮政局又出面称,顺丰要和阿里巴巴打通数据,否则在淘宝上一天很多用户看不到自己物流的状况。“产生冲突了,公安部和邮政局在打架。”龚才春说。

管理有待理顺

大数据随着人工智能的风口而更加火热,但是,具体到大数据采集、分析、流通、交易环节,国内许多未理顺的环节让人不得不生出疑问,人工智能就执行层面而言,在中国还是非常遥远之事。

《网络安全法》实施,掀起整治风暴之前,数据交易以一种粗犷、地下方式存在着,有很多不规范之处。数据产生于公安、法院、银行、证券和运营商等等。国内大数据交易中心所交易的数据都是上述机构所产生数据。这次被官方查处一些数据公司,主要问题是私下交易上述数据而没有得到当事人的授权。

操作手法并不复杂。一般是数据公司找到数据接口提供方,开通数据接口API服务,可能每条花费两毛钱,转手加一毛售出。据业内人士称,“有些公司一年能赚几十个亿。”

一方面,来自于公共服务部门的数据占据主体。这些数据通过一些官方认可、拥有资质的公司,比如国政通进行售卖,属合法合规,如果有人接过数据再加工处理售卖,是否违法解释权规主管部门。

另一方面,一些民营企业和互联网公司自身拥有的数据,都很好地保护起来,成为公司核心资产,很少流出来。比如招聘网站上面的简历,很难成批收集。

这两种原因导致上游数据资源相对匮乏,进而影响到中间交易环节中数据交易中心形同虚设。国内“呼声最大的,雷打得最响”的贵阳大数据交易中心,业务并不活跃。国内其它数据中心,遍布广东、福建、湖北、山东、浙江等地,收费模式不外乎吸收会员收取会员费,或者是靠撮合交易提成佣金,都活得很艰苦。有些数据中心干脆做些培训业务。“真正掌握很多数据的是大公司,像电信运营商、大银行和互联网巨头们,它们之间是很难合作。”龚才春判断,原因是容易在某个领域产生竞争。

以美国来说,用于公共事务的数据和个人隐私数据分开。大规模的数据治理起源于20世纪以来的政府信息化管理。比如1929年由胡佛倡导,在美国建立的非电子化犯罪信息记录系统。20世纪60年代,美国开始建立全国统一的犯罪信息系统,这些数据的用途超出了犯罪记录查询,对劳动力市场甄选工作、福利计划执行都有巨大帮助,从面成为政府治理手段的基石。

龚才春认为国内的遗憾在于数据管理远远未跟上时代发展步伐。“国外有一些大的机构和政府现在会设置一个岗位叫首席隐私官。”首席隐私官会从数据产生的源头,数据流通的各个环节,包括最后数据形成的报告或者是形成的产品,从各个环节把控数据隐私,保障各个环节泄露出去都不会定位到个人,保护个人隐私。做到了这些,“反而加速数据流动”。

现实问题是,如果数据没有流畅的通道流通,畸形发展的结果是最终变成信息孤岛。

如果有数据的流通,很多行业会发展的更健康。眼下一个实例是直播,经过去年的热火之后,行业萎靡非常快。去年代表性公司映客,已经到了与公关公司合并发展的地步。表面上看,直播走向萎靡,是失宠于资本,真正原因是2015年至今,直播行业限入同质化竞争,未能拿到有效的大数据进行耕细化运作。

直播概念兴起,捧红了一部分主播,但是后来跟进者众多,如何进行个性化精细运作就成为关键。以往的客户导流,在经历过最初的大水漫灌之后,“没有大数据支撑,用户没有根据年龄、地域、性别和爱好等区分,就是一个粗犷数据导量。”

但是,美国的Facebook和谷歌并不是这么做的。这两家公司把直播和用户数据匹配,力争让用户接触到自己喜欢的内容。

作为创业型公司,宁芙科技应对之策是通过一些激励手段吸引C端用户,授权允许宁芙获得数据后进行加工处理。另一方面,宁芙科技将数据挖掘和整理朝汽车行业深耕,想通过数据方面的服务解决汽车厂商的问题。

龚才春则认为,从人力资源领域切入大数据非常有价值,一个人的职场数据是其最重要的也最有价值的数据,对于个人征信、金融风控、企业招聘都有非常重要的参考价值。为了保证数据的安全,防止隐私数据泄露,龚才春还购买了若干服务器放在办公室,让隐私数据实现与外网的物理隔离。