唱衰声音:大数据需要证明自己不是“老大哥”?

我们仍不知道这种新的数据分析以及人工智能技术意味着什么。
——————————-

自从爱德华·斯诺登曝光美国国家安全局是如何从科技公司获得人们的电话记录和各种数据,乔治·奥威尔的《1984》销量开始上升。到目前为止,即使人们确实不喜欢“老大哥”,他们也已经准备接受以自己的某些隐私被入侵为代价来换取安全。
 
那“大数据”呢?那些掌握数量速增的个人信息数据的公司正在使用新的数据分析与人工智能技术,塑造产品和服务,甚至预测顾客将会需要什么。谷歌的首席执行官拉里·佩奇是这样形容他理想中的科技的:“作为一个为你服务的助手,它非常聪明,以至于你不必去考虑。”
 
想象一下你的生活就如唐顿庄园里的贵族,有电脑为你安排日程,为你提供最好的旅行路线,你可能会想看的电影和最合适的航班——甚至还帮你预定了机票,这样的想象多么诱人啊。我们都受时间所迫,却又想活得轻松。与其被信息轰炸而又被迫作出选择,还不如有个性化的服务来得好。
 
但正如美国国家安全局的事情曝光使人们吃惊一样,虽然它已经存在了60年,我仍然怀疑无论是人们每天制造的数据规模还是允许特定的大数据公司去利用的科技进步。科技是如此的日新月异,以至于两年前不可想象的事在今天已是司空见惯。
 
“这是一个既美好又恐怖的未来。那些拥有大量数据的公司会比你自己更了解你。他们将可以预测你下一步要干什么。”北京投资人,前任谷歌中国负责人李开复这样说。
 
在上周的专栏中我将谷歌与19世纪后期的通用电气进行对比——他们都是乘着新技术的浪潮前进的创新工业企业。另外,像谷歌,亚马逊,微软等的其他技术巨人正在累积着需要被小心控制的力量。
 
美国国家安全局和那些大数据公司将他们拥有的数据和计算机能力用于不同的用途——前者是要识别出间谍和恐怖分子,后者则是为用户匹配服务。他们的共同点是都拥有大型数据库和诸如模式识别、网络分析等技术。
 
在先进的一面,这会逐渐形成一种人工智能,它可以凭直觉知道你正在搜索什么,即使你拼错了关键词;可以对演讲进行同声传译(正如微软去年在中国展示的那样);或者通过观察上千张图片来学习识别一张猫的照片。
 
计算机的这种像人一样学习的能力被称为“深度学习”,值得关注的是谷歌已经聘请了这个领域里的一些先锋,包括科学家兼作家雷蒙德·库茨魏尔。在美国国家安全局转让给美国私人公司的技术里就包括这种“尖端机器学习技术”。
 
这种软件可以从许多信息碎片里作出推断,证明它已经对其进行充分利用,就像美国国家安全局为分析来自威瑞森无线通讯(或其他经营者)的电话通讯元数据作出的努力。总统奥巴马向美国人担保“没有人在窃听你的电话”。但仅这一项已是大发现。
 
哈佛大学教授拉塔尼·斯威尼的一项研究表明,通过公共数据库的交叉检查,只需要知道年龄、性别和邮政编码就可以确定87%的人的身份。这就是社交网络和互联网公司采集数据的典型。
 
大数据公司的这个超凡能力来源于它们可以结合顾客的个人信息以及对其的观察,包括买了哪些产品,处于什么位置(通过手机的全球定位卫星数据测出)。然后就可以产生出一整套顾客所需的“推断数据”。
 
如果我在印度用安卓手机搜索“泰姬陵”,谷歌会优先显示在北方邦的神社的结果。但如果我同样搜索“泰姬陵”,不过是在东伦敦的砖块街,它就会显示本地的一个孟加拉餐厅。当我傍晚在一个外国城市里漫步时,网络可以通过我对餐厅的估价提供预订餐厅的服务,这样会需要多长时间?
 
在某个层面上讲,我会为这种服务而高兴(只要它是一个好服务),因为这可以给我省下不少功夫。另外,正如一个世界经济论坛的一个关于个人信息的报告指出,“推断数据就像一个盯着监控摄像机的全知的老大哥”。
 
由此而生的一个担忧是,拥有这种软件的大数据公司,其他公司难以与之抗衡。我和其他用户为他们提供越多数据,他们就可以更好地推断出我们所需。机器大脑越用越灵光。

更多详细信息,请您微信关注“计算网”公众号: