大数据还处于不断被人们重新定义的阶段,现在又多了一个属于自己的Hype Cycle技术生命周期。Gartner近期发布了首个专门针对大数据话题的报告——《2012年大数据Hype Cycle》(Hype Cycle for Big Data, 2012)。
Hype Cycle技术生命周期指的是企业用来评估新科技的可见度,利用时间轴与市面上的可见度(媒体曝光度)决定要不要采用新技术的一种工具。它的定义本身就不太好理解,而报告中列出的大数据技术和专业术语更多达47个,数据科学家、基于云的网格计算、预测分析、开放政府数据,无一不缺。Gartner的Hype Cycle类别中遍布了这些技术,记录了大数据从炒作到成熟并进入主流的过程。
Gartner研究副总裁Hung LeHong在近期的一次网络研讨会上提到:“大数据不是一项单一的技术,而是一个概念,是一套技术。”
这一成套的技术在生命周期的早期阶段汇集到一起,逐渐变得越来越复杂。业务分析师希望从数据中获得更多的见解,厂商希望将“大数据解决方案”融入到更多的产品之中。从报告中可以看出,今年Gartner决定用文字把这一现象记录下来。如今,企业已经有能力利用低价的服务器、开源技术和云计算来进行开销不大的大数据实验。
尽管Hype Cycle报告通常较多利用图表的方式展现,但是本次报告同样辅以了更多的文字内容,每种技术都用一至两页进行了分析。
Hype Cycle生命周期的意义
Gartner调研副总裁兼大数据专家Mark Beyer说:“大数据的概念同样包含两个方面,它真实存在在我们的世界中,但其作用有时被夸大了。”
大数据之所以真实是因为科技的进步和恰当的时间点。2009年,影响科技发展的四大要素——内存、存储性能、处理能力、网速——在规模与速度方面成倍增长。这些要素的突飞猛进并不奇怪,但各有各的周期,达到顶峰的时间点也就各不相同。因此,在大数据中它们同时爆发就不太寻常了。
除此之外,IT人士也变得越来越能够接受新鲜的技术。Beyer认为,在IT技术部门中产生了两种极端的情形:一种是技术发展促使性能大幅度提高;另一种是原有设备无法继续满足数据需求。2010年,用户开始对数据有了更多的需求,IT系统压力陡增,市场中必须发展出缓解该压力的方式。
更多数据的需求以及技术支持的发展结合得恰到好处,市场的需求越来越大。于是一场技术革命风暴演变为炒作,席卷整个行业。
然而Beyer说:“即使是炒作,那又如何?”
虽然所有这些因素凑到一块儿相当少见,但也不是完全没有过。在20世纪70年代末80年代初互联网刚刚诞生的时候,业界就曾经遇到过这样的情况;在未来的15-18年里,这样的情况还会重现,而这次将属于大数据时代。在这段时间里,大数据的发展将不断挑战业内技术的革新,并构建出全新的收集、存储和分析数据的方式。
一些分析师认为现有的大数据技术会在未来几年之内变得无处不在,Beyer却不认同,他认为这些技术不会独立发展,而是会完全融入到传统IT环境中去。
Hype Cycle生命周期的阶段
今年8月中旬,也是大数据火起来的第二年,大数据还出现在了Gartner的《新兴技术Hype Cycle》(Hype Cycle for Emerging Technologies)报告中。去年,Gartner将大数据列为“科技诞生的促动期”(Technology Trigger),即Hype Cycle生命周期五个阶段中的第一个阶段。今年,大数据进化到了第二阶段,即“膨胀期望的高峰期”(plateau of inflated expectations),其中包括了生命周期的至高点和由胜走向衰的转折点。
Gartner对大数据所作的评估遭到了部分专家的异议。
《驾驭大数据浪潮》(Taming the Big Data Tidal Wave)一书的作者兼Teradata的首席分析官(CAO)Bill Franks说:“虽说大数据在市场中确实存在炒作现象,但我认为它离明显的衰败还差得远呢。”