“数据背后是网络,网络背后是人,研究网络数据实际上是研究人组成的社会网络。”在2012年5月召开的第424次香山科学会议上,李国杰提出建立一门大数据研究的“网络数据科学”,重点研究数据背后的社会网络。
就在他提出建立这门新型交叉学科之前的两个月,美国联邦政府宣布了“大数据研究和发展倡议”计划,拟用2亿美元提高从大量数字数据中访问、组织、收集发现信息的工具和技术水平。
《大数据时代》一书的中文译者周涛认为,大数据分析和利用与提升国家竞争力及国民幸福程度密切相关,数据储备和数据分析能力将成为未来新型国家最重要的核心战略能力。
周涛称:“包括与国家安全、社会稳定相关的尖端武器制造与性能模拟实验,群体事件以及谣言的预警和干预;与国家科技能力相关的等离子即高能粒子实验分析,纳米材料及生物基因工程;与国民经济繁荣相关的经济金融态势感知与失稳预测,精准营销与智能物流仓储等。”
面向2020年,中国也将在战略高度上将信息科技发展作为主战场之一,在新科技革命进程中,加速人、机、物三元世界的融合发展。
挑战信息安全
通过立法和各种有效手段保护个人隐私刻不容缓
回到文章开头,被大数据应用猜到购物喜好的尴尬大概源于对个人隐私泄露的不安。的确,目前大数据应用面临的挑战之一便是对个人隐私信息的担忧。
张敏回忆起前些年看过的一个科幻故事,描写的是当时的作者畅想的现代生活:主人公早晨醒来打开一部类似手机的机器,机器自动弹出了主人公将要前往地点的路线及相关信息,不仅如此,主人公最喜欢的餐厅和电影也被自动推送出来。
“你能相信吗,有一台机器比你自己还了解你。”张敏感叹。不过在她看来,这样美好的未来对于个人隐私也是相当危险的。
“棱镜计划”是谈论大数据时不得不提的事件。根据美国中情局前职员爱德华·斯诺登提供的信息,美国情报机构在2007年开始的“棱镜”窃听计划中,对美国9家互联网公司的数据进行挖掘工作,从音频、视频、图片、邮件、文档以及连接信息中分析个人的联系方式与行动。该计划一经曝光,便受到国际社会的谴责。
然而,《大数据时代》作者舍恩·伯格在评论斯诺登事件时曾表示,令他惊奇的并不是“棱镜计划”本身,而是大家对这个计划如此惊奇,大多数人竟然仍以小数据的经验和视野来看待它。
从大数据应用创新的角度来看,“棱镜计划”无疑是一个非常出色的案例,同样暴露了大数据应用对个人隐私的威胁。
大数据时代如何保护个人隐私是一个共同关心的问题。在前不久召开的中国计算机学会青年计算机科技论坛上,南京大学计算机系教授仲盛介绍,传统互联网对个人信息保护的方式之一便是“去识别”,即去掉姓名等关键信息。那么,大数据时代,“去识别”还能保护隐私吗?
例如,一家医院在提供医疗服务时发现张家村有两名45岁的男性患有某种疾病,其中一名未婚。在这条信息里,病人的个人信息虽然被去除了,但只要知道张家村有谁满足45岁和未婚两个条件,依然能知道究竟是谁患病。
仲盛指出,正是数据集成暴露了个人隐私。“即使每一个机构发布的数据都是安全的,但把它们结合在一起便什么都知道了。”他说。
从技术而言,科学家至今还没有最有效的办法为个人隐私“上保险”。大数据时代的信息安全恐怕需要新的社会规则来规范使用数据的行为。
2013年年初,世界经济论坛发表《解除个人信息的价值:从收集到使用》的报告,甚至建议所有数据收集都应当使用密码,以达到“限制使用数据”的目的。
大数据的应用对公众信息安全来说无疑增加了一个新的维度。李国杰在接受媒体采访时曾表示:“如何通过立法和各种手段真正保护个人的隐私,这是国家需要高度重视的一个新的安全问题。”