大数据交易的关键是对数据质量的要求,包括数据的准确性、真实性、完整性、一致性等。关于交易数据合法性、及时性、可用性、安全性等问题,都是现阶段我国家数据交易所面临的问题。
政府的数据不存在提供给中介方交易的问题,当然,中介方可以收集政府的数据,进行加工。运营商收集的用户数据原则上所有权是用户,BAT收集的数据原则上所有权是用户,但是运营商和BAT拥有对数据脱敏及挖掘分析后加工数据的所有权。
有数据的公司通过数据挖掘向政府和企业提供咨询报告,这类公司虽然没有数据所有权,但是有数据挖掘能力;而那些没有数据,但是有数据挖掘能力的公司,可以受委托完成数据挖掘。是否允许前者在保护隐私和国家安全的情况下提供数据,是否允许后者受委托进行数据挖掘后利用数据为非委托方服务,这些问题现在还没有明确规定。
此外,没有数据也没有挖掘能力的公司,可以作为中介平台,但是是否可以允许其截留数据呢?中介方收集了政府开放的数据据为己有并且出售是不是合法?因此,关于在数据源的稳定性、更新频率和数据扩散等方面,也需要相关规定给出明确的界限。
精加工的数据、可视化的数据怎么定价,怎么衡量数据挖掘的工作量,一次性买断的数据和可以重复多次出售的数据怎么定价,数据的价值与时效性有什么关系,是不是需要有对数据评估的第三方机构,都是现阶段国内的数据流通和交易存在的问题。
政府和企业组织没有充分认识到用外部数据可以对自身工作和业务起到巨大的提升作用,所以,一般来讲,都很少利用外部数据。很多数据拥有者对数据蕴含的价值缺乏足够的洞察,不放心让自己的数据进入流通环节,担心企业隐私机密泄露。所以,流通也不够,交易也不够,利用更不够。
三、大数据利用和保护
首先,和国家安全有关的数据、和企业商业秘密有关的数据以及涉及公民隐私的数据需要保护。目前,欧盟制定了严格的数据保护法案,中国虽然有宏观上的数据保护要求,但是没有全面的数据保护法规。
关于欧盟的数据保护,2016年4月,欧洲议会通过了《一般数据保护条例》(GDPR)。这个法案在2018年5月25日生效。这个数据保护法案涉及欧盟单位对多元数据的处理,不管在欧盟内部处理,还是在欧盟外部处理,都要受这个法规管。要注意的是,处理者在不在欧盟里不重要,但是欧盟消费者都要受这个管理。如果中国企业把微信支付宝用到了欧洲,那么,一样也要受这个法案管理。
多元数据是跟个人隐私、专业、公共生活有关的任何信息,包括姓名、照片、电子邮件地址、工作表现、经济状况、健康状况、个人偏好、兴趣、IP地址等。针对个人信息的收集、记录、组织、建构、存储、修改、咨询、使用、传播和其他应用,包括排列组合,都可以通过人工处理或自动化处理。
个人具有管理自己个人数据的权益,具有自己的数据被泄露能够获得及时通知的权利以及被遗忘权。对个人数据处理,要合法公正透明,必须有规有法。只有为了公共利益或历史研究,个人数据才能长时间存储,其他目的个人数据不能长时间存储。同时,还要保证收集的个人数据有技术措施保证,不能受非法授权、非法处理、遗失丢失和损毁。
并不是说个人数据不能处理,符合规定的可以处理,例如本人同意可以作为一个或多个特定目的的数据。个人数据处理是为了保护自己,保护一个自然人的切身利益;为了公共利益,为了追求合法利益的必要,允许商业利用。商业部门、企业处理个人数据,首先是为了合法利益,当然不能侵犯提供个人信息数据的消费者的利益,尤其是儿童。现在手机的几乎所有APP都收集个人信息,如果是为了合法利益的,是被允许的。
有个社会调研,关于是否愿意为了将来应用资费上的优惠牺牲隐私,全球有27%的人表示可以牺牲隐私,中国有38%的人表示可以牺牲隐私,更多中国人认为隐私不重要,反而优惠更重要。
数据的传输存储和开发要有要求。所有的软件,包括移动应用的APP,在开发阶段和运行数据处理阶段要保护个人数据的隐私。数据控制也含APP,要有充分的技术和措施,确保数据和移动应用的完整性,必须应对数据处理面临的风险。
欧盟提出,如果一个政府在云里存储了数据,就是管理者,应该对数据所有的保密、安全负责。所以,云平台有云平台的责任,存数据者也有他们的责任。该法规不受限于公司国籍,不受限于云服务的地理位置,如果在中国存了关于欧洲公民的个人数据,这个法规也适用,所以,在中国的云平台也不是什么数据都存进去。目前,80%的云服务不会在合同终止的时候立即删除客户的数据,58%的云服务不能提供IT所有权的保证。