10月24日消息,今天,“中国TMT国际商会月度英雄汇”在北京召开。知名IT评论人、前雅虎中国总经理谢文在会上表示,现在人们对于大数据的认识有很多误区,今年甚至是接下来的两三年,大数据将会卷入一种混战。
谢文认为,现在业内针对大数据的概念主要有三种看法:一种认为大数据是过去时,因为大数据古已有之,在物理学、生物学、医药业等领域已经搞了几十年了;第二种是完成时,因为有些公司已经声称,能够提供从硬件到软件再到方法的完整大数据解决方案;第三种是进行时,因为也有很多互联网公司正在加大投入,在数据获取、存储、整合、挖掘等方面发奋努力。谢文则把大数据定义成为未知,作为努力的方向,作为未来讨论的一种概念。
谢文表示,人们在大数据的认识上有几个误区。第一,只是从量上说,光看到数据的增长,没法说清楚普通数据和大数据的区别。数据大绝对不等于大数据。现有的设备、技术方法所能处理的多数是数据大,不是大数据。数据挖掘、精细化运营、精准广告、个性化服务、推广这些不是未来大数据服务商业模式的主要部分。第二,脱离产业发展和社会进步的大背景,单纯地鼓励讨论大数据无法说明其重要性。把大数据这个事情作为技术问题来探讨,很难证明他有投资价值。
谢文称,实现数据的标准化、开放化和通用化,关键在于如何冲破个人隐私、商业利益、行业垄断的限制,实现数据的低成本、高效率、大规模的聚集和整合,而像中国电信、中国联通这个级别的公司,必须要扮演相当的角色才有机会。
谢文最后表示,2013年是大数据时代元年。2015年左右大数据必有大创新出现,2020年前后必有大成功公司上市。
以下是知名IT评论人、前雅虎中国总经理谢文演讲实录:
感谢大家,我从大概过去半年左右时间写了十篇关于大数据的文章,杂志上也有,这只是出于我的嗜好,关于互联网,关于大数据的发展。没想到这次的反响远远高于以往的经历,2005年开始我推Web2.0的概念,后来一理就大发了,就乱套了。后来我卷入关于什么是新媒体的争论,最后我得罪了大量传统媒体的朋友。应该说大数据这个概念开始出来,但是从我最近这一段常常被各种机构、各种部门、企业叫去参加会,参加演讲,最重要的困惑就是大家对大数据有兴趣。一张嘴,南辕北辙,完全不在一个兴趣点,完全不在一个点上。所以我想站在互联网发展的历史,和投资的角度向各位介绍一下我想理解的真的大数据,或者半真半假,或者是大数据的环节,或者是假的大数据。
在互联网在中国开始初期,1999年到2010年我管它叫做互联网争论,1999年参加券商和投资金融的会,当时有人能一口数出中国有80个是互联网概念股,非常吓人,其结果不言自鸣。2003年到2005年是互联网真正见真钱的时候,靠电信公司的宽大政策,我们大家都活下来了。但是当时ISP这个概念下,鱼龙混杂,最终混了这个行当,也是概念上的混乱。2007年到2009年是WEB2.0,最后尘埃落定,中国竟然没有一家像Facebook的公司能够脱颖而出。我早期做的校内,现在流量排第12,其实后面还有关于真假新媒体,真假电子商务,去年、今年、现在余震未平,大概上万个团购投了前后二三十亿,现在一地鸡毛,所以我觉得今年,包括下面两三年大数据会卷入一种混战。
因为我们无论从投资者、创业者、经营者还是媒体推波助澜,大家喜欢看宏观、微观、局部,这是好事,怕的是你摸着石头过河,一路摸下去,越摸越惨。讨论大数据用的“时”还是不一样的。
一种认为大数据是过去时,大数据古已有之,在物理学、生物学、医药业等领域已经搞了几十年了。这个概念本身听着就悬乎,大数据,形容词,不是严格的定义,喜欢说过去时的多数是学术界的人,知识界、学术界,他们有纯粹的讨论数据大的怎么办?
另一种认为大数据是完成时,“我们能够提供从硬件到软件再到方法的完整大数据解决方案”,他说随便来,我早准备好了,你提供钱就是。我不是说这个路就错了。或者我讨论问题也是这么讨论,我从来不把创新和技术障碍作为前提放在前面,我假定技术条件是具备的,我们回想几次互联网大创新,技术条件都在那。那么多互联网公司只有你有好主意,他们一定能跟上。
还有一种认为是进行时的。“我们正在加大投入,在数据获取、存储、整合、挖掘等方面发奋努力”,说这种话的都是互联网公司,或者电信公司,他的意思是这点事尽在囊中。这些都是互联网公司的,但是这三种我个人都是不同意的,我使用的是将来时代,大数据不仅是网络业的未来,而且是整个社会和经济发展的未来,现在应该开始讨论、研究、尝试这个方向的问题了。
我就把它作为未知,作为努力的方向,作为未来来讨论的。我不敢绝对的说我是对的其他三位是错的,但是相互之间有关系,我个人认为至少过去是完成时肯定是错的。我们TMT商会不会考古为兴趣,不是以研究历史为兴趣,我们是研究未来的。