就在您认为大数据不可能再变大时,它还在不断变大。无论其实际大小,大数据正在显示价值。各个地方的组织都有各种形态与大小的大数据。这些组织意识到其重要性、机遇以及给予关注的迫切需要。很显然,无论忽略与否,大数据都会不断发展。
已掌控大数据(在明了其价值前储存的多结构混乱数据)的组织正在提升组织效率、提高收益,并发展新的业务模式。他们是怎样做到的?这些机构成功的方法可以总结为七条建议。
1、以短期考虑促进长期考虑
担心能否跟上大数据的潮流的人,不止您一个。一切都瞬息万变,因此无从知道今年或明年哪些工具、平台或方法是最好的。
放宽心。这种快速演变的形势可以为您服务。
每年,供应商都在大数据使用方面不断提高。关系与在线交易系统(OLTP)会越来越高效、越来越智能,无论是在内部还是云中运行。技术的发展将会缓和Hadoop及数据仓库之间的关系。而且,始终会有产品上市,更精准地满足您的具体需求。
因此,敬请宽心。对采纳新产品保持开放心态,只要这些产品能提供足够价值,就能名正言顺地融入您的现有环境。保持能够直连多种格式的商业智能平台。您现已准备好应对市场变化。
2、看清错误选择
贵机构需要什么,Hadoop还是数据仓库?别说,这还真是个有陷阱的问题。不光是Hadoop与数据仓库能够很好地协同工作,机构实际上还能从两者的协作获益。数据仓库用来压缩重要结构化数据再适合不过,还能把数据存储在商业智能工具和仪表板能够轻松找到的地方。但其弱势是,分析过程与某些类型的转换较弱且慢。
这一点正好由Hadoop补充。此外,尽管Hadoop在交互式查询与数据管理方面较为弱势,但其善于快速容纳原始、未结构化的复杂数据。这两者合而构成共生关系。例如,想象一下高层管理用来预测下一年库存需求的数据。数据集可能很大,几乎没有时间给数据建模、重新结构化,也没有时间以其他方式预处理好数据,供数据仓库使用。
高层管理人员用完以后,可能仅一周时间,就会丢弃。这就是Hadoop该出来发挥作用,细化数据并把样本发送到数据仓库的时候。“大数据并不是数据仓库的替代品,”ThirdNatureCEOMarkMadsen在其“大数据的真实含义”一文中写道,“也不是单独维护的孤岛。大数据是新IT环境的一部分。”
不要在选择Hadoop还是数据仓库这个问题上不知所从。您可以,也应该使用两者。
3、浓缩大数据,使之一目了然
结构出色、考虑周全的可视化平台让其他系统都黯然失色。这是电子表格无法带来的。
大数据可视化之后,浓缩到一目了然的程度。AberdeenGroup的一份报告发现:“在使用可视化发现工具的机构中,48%的商业智能用户,无需IT人员的帮助,即可找到需要的信息。”如果没有可视化发现工具,这个比例降到了23%。
此外,根据这份研究,使用可视化数据发现的经理较之没有可视化数据的经理找到及时信息的可能性,要高出28%。
或许,最为重要的是,在涉及到大数据的情况下,报告发现可视化还能促进与大数据的互动。较之其他经理,使用可视化数据的经理与数据广泛互动的可能性要高出一倍多(33%比15%)。另外,这些经理还更有可能即兴提问,往往是受到前一刻洞见启发的问题。以可视化的方式探索数据,使得数据生动呈现,让大脑能够瞬间理解。富国银行战略规划副总裁达纳·朱伯称:“会有一些萌生的想法,这是电子表格无法带来的。”