IDC:大数据在炒作中走向成熟

【中云网 译文】分析师认为:大数据是用于战略决策的工具,而非一项仅用于技术性搜索的普通技术。

很少有技术行业的俏皮话能像“大数据”这般频繁见诸于众,但是尽管大数据炒作依然蓬勃不息,它依然稳步迈向现实的成功之路上,传统企业也能发展大数据战略。一些IDC分析师坚持此观点。

“我们当前所处的时代确实存在太多的炒作泡沫,太多不切实际的许诺”,IDC分析师Dan Vesset在3月13日波士顿举办的2013研究机构指导会议中的圆桌讨论环节承认,“问题是何为真实?短期内企业又该且必须做些什么?”

大数据

根据Vesset的介绍,IDG新闻服务中心的母公司国际数据集团所属的IDC公司,将大数据定义为“以各种各样的信息源中存有的庞大数据量为来源,能产生新经济价值的信息驱动型战略决策制定工具”。

第一点非常关键,Vesset强调。

“我们可以安装所有的技术但事情的关键在于如何提高决策水平”Vesset指出,“我们可以部署全球最卓越的Hadoop系统,但问题不会就此解决”,在谈到当前流行的大数据运动的代名词--开源数据进程架构时,他补充道。

根据某网站内容,司机插入到汽车诊断端口上的设备驱动程序可以阶段性地获取数据。该程序可以追踪司机猛踩刹车的频率、深夜开车及其他可能的危险驾驶习惯。如果数据显示司机正在安全驾驶,他们可以享受显著的保费折扣优惠。

同时,根据Vesset的观点,企业想成功实施他们的大数据计划依然面临着一连串的挑战,如面临哪些数据该存储、哪些数据又该抛弃的两难境地,掌握所需技术的成本,以及具备关必要技能的IT专业人才的空缺等。

最后一个挑战很有可能在可预见的一段时间内成为最严重的问题,Versace预计,“基因池现在越来越浅。”

伴随大数据而来的还有一些错误的观念,Vesset坦承。比如“不是什么大数据都跟社交媒体相关”,他表示,“这对大数据而言是一个很大的谬论,大数据是有关点击流分析的工具。”

鉴于Hadoop面向大批量分批处理,也不针对实时监控,就像当火车运载货物时,铁路公司会追踪某些特定零部件的性能那样,因而不能视作唯一的解决方案。

Vesset表示,IDC估计10%~12%的北美机构已经在以某种形式“使用”Hadoop系统。

该分析公司已为大数据制定了一个“成熟度模型”,Vesset和Versace在演讲中这样描述。模型横跨五大目标领域:数据、人群、流程、技术和内容;同时也设定了部署大数据的五个阶段:临时性部署,机遇性部署,可重复性部署,可管理性部署,已优化的部署。

分析师介绍,企业开始大数据的第一步是确认用新方法来充分利用现有技术和数据的机会,评估公共云与开源选项,并开始尝试实验概念型训练和原型操作。

他们认为,在接下来的一至两年,这些企业应当着眼于利用大数据项目的早期成果来证明更大努力所需的资金。在同一时期,向那些已经在大数据项目中胜出的商业部门寻求赞助也是明智的选择。

那些被视作大数据的80%的数据都是非结构化或半结构化信息,IDC分析师David Schubmehl本周三(3月13日)在另一个演讲中指出,这些数据的来源广泛,从来自点击流的任意数据,到专利记录、研究成果甚至视频等等。

这种多样性将导致新技术的产生,它被IDC称作是统一的信息访问技术,证明产品就是Oracle公司的Endeca与IBM推出的Vivisimo,也有专门的生产厂商如Attivio。

在同一个演讲中,IDC分析师Carl Olofson警告,随着如图片和内存数据库平台等技术的日益突出,大数据的挑战也会持续影响到数据库行业。

随着性能的拓展,传统的关联数据库也会有所改变。当提到关联模型之父时,Olofson调侃“到那时候Ted Codd也许会认不出这些”。

来源:www.techworld.com

作者:Chris Kanaracus