2016年8月,山东考生徐玉玉因为隐私泄露导致被诈骗后身亡;同年12月,“京东用户数据泄漏”事件,包括用户名、密码、邮箱、QQ号、电话号码、身份证等多个维度、数千万条数据被倒卖,引发社会对信息安全的紧张情绪剧增。
如何对流通的数据构建监管、追溯、标识体系,建立行业秩序和标准化行为模式,打击非法数据流通,保护企业、个人利益,维护行业健康发展,已经迫在眉睫。
盲从:用“巨量”掩盖个性化
在大数据时代,个人的信息更多的是以数据为载体来进行互动的。海量的数据在为研究和分析社会现象带来便利的同时,实际上也掩盖了许多具有个性特征的数据的意义,许多本身具有个性特征的数据已经变得无足轻重了。
大数据简化了人们对数据差异性的认知。大数据的复杂性不仅在于其数据样本巨量,更在于其多源异构、多实体和多空间之间的交互动态性。当前,只有少数人掌握处理这种复杂的巨量化大数据的技术,这很容易导致“数据暴力”。
所有数据说到底,都是关于个体的呈现。因此,其中所蕴含着各异的社会文化价值,是更加需要我们了解和掌握的内容。数据来源于社会又作用于社会。无论是可以数字化的数据还是不可数字化的数据,其比较、分析和归纳,其实反映的都是人在符号层面上的一种互动。
如果脱离了人及其所在社会的价值本性,无限放大巨量大数据的效应及其影响力,而忽视人性的本质,就可能本末倒置,最终产生许多难以预期的后果。
分歧:在“因果性”和“相关性”中走极端
数据的本质,是快速让大家知道发生了什么事,只有降低成本,把简单数据简单化或者复杂化分析,快速变成结果去变现,大数据公司才能活下去。
在一场变革或者技术的初期,需要找到最简单、甚至看起来很粗糙的方式发挥出它的效能。当然,这也还跟现在数据量、数据化和数据保存以及剖析工具等错综复杂的因素有关,利用这样的相关性关系研究,把数据里面的金子挖出来,或者利用相关性,预防或促成某些结果的发生。我们需要一定的速度,应对信息社会“数据爆炸”和诸多涌现出来的“复杂性”很高的问题,然后才是对其过程和背后原由的探询。
对因果性的执着,强调更多是个体甚至人类整体的记忆,或者经验、规律性等条件,必须从“人”的态度才能理解的,因果是“自然的人化”。而做大数据的,最怕听到去解释“为什么”,因为大数据能做到最真实情况的还原,就已经很难了,数据噪音太大,现实市场状况往往是混乱的,尝试去找出项目成败的因果关系,实际上是没有必要的。大数据的作用是趋势判断,而不是找出因果。
草率:数据共享陷阱难以跨越
当前,国内大数据行业的应用市场呈现政府牵头的明显趋势,各级政府部门、公安、交通、铁路、金融等各行业龙头机构对数据开放、共享、应用的日益重视,逐渐形成了中国特色的大数据应用市场。
众所周知,由于政府各部门各自主导的信息系统设计上,先天开放共享的条件就不足,加上部门管理体制原因,信息孤岛、数据壁垒现象普遍。然而,大数据、信息化项目普遍存在涉及部门多、推进难度大、“一把手工程”现象,同时项目周期长、投资规模大、直接经济效益不显著,使得政府部门更倾向于追求短期效果而非长期利益,使得大数据项目建设如火如荼,核心政府数据资源的汇聚却没有真正实现。
此外,在有些政府企业PPP(Public-Private Partnership)合作模式中,由于没有约定合理的数据资产归属权和政府资本退出机制,导致政府重要数据资源过早变现或廉价变现,国有资产流失到社会,公共数据资源没有经过高技术、高附加值的处理而野蛮开放。
政府及行业客户对大数据需求不断增长,但数据资源的封闭与过度开发现象并存,一方面使得部分机构陷入大数据项目没有真正有效利用数据的“数据共享陷阱”;另一方面,为了筹措项目资金,政府高融资、高负债、高担保现象严重,一旦项目实际应用效果不佳,容易诱发政府债务危机等问题。
主观:数据人才缺失严重
国家十三五规划纲要中明确提出:“实施国家大数据战略,推进数据资源开放共享”,在这样的契机下,大数据领域必将迎来建设高峰和投资良机。而推动大数据发展不仅依靠国家战略与相关政策的支持,更需要大数据相关人才的支撑。而当前制约大数据发展的瓶颈之一,也在于大数据人才的极度紧缺。