BigData非万能!揭秘大数据四大弊端

大数据与用户隐私难以兼顾

阿里巴巴创始人马云说:“用户没搞清PC时代的时候,移动互联网来了;没搞清移动互联网的时候,大数据时代来了。”他的话很好地佐证了2013年以来“大数据”一词在业界的热度。

不可否认的是,一直被宣扬的大数据时代似乎真的到来了。在众星捧月的光环下,“大数据”如同一个香饽饽,人人都想分一杯羹。那么,大数据真如我们想象的那么美好?

笔者以为,在信息时代的今天,对浩瀚繁杂的数据进行整理判断是有必要的,数据中也确实存在大量的宝藏。但是,这就好比在垃圾场拾宝贝一样,垃圾永远都比宝贝多。

很多时候,我们无法判断数据的真实有效性,这对最终的判断是一种莫大的伤害。当数据来源不当时,这又是对用户隐私的一种伤害。企业需要在利用数据盈利的同时注意不窥探用户隐私,很多时候,很难掌握那样一个平衡点。

在生活中,“脏数据”无处不在,举一个例子,网络水军的存在就极大影响了互联网信息的真实。一款产品,他的价值和品质是成型的,就摆放在那里,但是对它的评价却可以千差万别。按照统计学原理来讲,评论的基数越大,最终得到的结果就越接近于真实,但是它的前提必须是用户真实客观的反馈。但是在网络水军存在的情况下,这个条件是不被允许的。

比如,一部低品质的电影被推上市场,因为营销手段的成功,上座率也很高,在电影网站的评分也很高。但是这并不是真实的数据,大量的水军淹没了信息的真实性。如果对数据不加分析评判而直接使用,无论计算精度多么高,结果都是无意义的,因为数据本身就存在问题。

类似的例子还有,淘宝卖家刷钻,微博僵尸粉丝,贴吧论坛营销贴等等。脏数据在网络中无处不在,在大数据还不成气候的今天,其实还没有十分有效的方法对“脏数据”加以鉴别。

大数据的四大缺点总结

大数据只能发现过去,不能左右未来

在信息时代,每一个Byte中都藏有不可思议的数据信息,对这些信息加以归纳整理,提炼出有效的信息,来帮助公司或企业做出更好的决定,正是“大数据”的意义和目的所在。但是问题也随之而来,除了上文笔者提到的“数据真实性”以及“脏数据”的问题之外,还有一个很重要的问题就是,市场是变化无常并且不可预期的,决策者的创造性思维并不能通过数据得以体现,相反,数据在压制创新。

最显而易见的例子,就是手机厂商摩托罗拉和诺基亚。在新世纪初,摩托罗拉V3系列手机大获成功,号称销售达1亿部,一度傲视群雄。摩托从大量的数据和反馈中得到了利好消息,认为应该就需在V3机型上下文章。但是千篇一律、缺乏变化的东西只会让消费者厌倦。诺基亚在2007——2010年得业绩可以说是如日中天,塞班系统可以说是一统天下,无论数据上还是场面上,都大占上风。但问题是,一般消费者其实对自己的需求也不太清楚,只有当真的产品出来时,他们才会发出惊讶的赞叹,转头就把旧产品扔在一边。所以不久之后,塞班就被ios和安卓这些“新势力”攻城略地,打得溃不成军。如今,摩托罗拉和诺基亚已经分别被谷歌和微软收购。

在一个新的领域内,摆在第一个开拓者面前的其实是一马平川,没有什么数据可循,也没有什么经验好参考,一切都在摸索中起步。在这样的场景下,大数据完全没有作用,甚至有可能发挥反作用。一个明显的例子,Facebook大获成功之前,互联网巨头们的数据分析结果统统认为社交网络没有大的机遇,Facebook成功后,巨头们的想法和原先完全相反。为此,谷歌公司CEO施密特前几日在采访中还谈到:“我在Google犯的最大错误,就是没有(让Google)在网络社交兴起的时候参加进来。”

综合以上,笔者认为大数据主要有以下几点弊端:

1.数据转化率低

2.存在隐私安全问题

3.数据真实性有待检验

4.数据对创新没有参考价值

总结:大数据的价值应该被认同,而不是夸大。现阶段的大数据只是一张画上的饼,离能吃还很遥远。大数据不是万能的,不要迷恋大数据。