作者为甲骨文公司副总裁兼大中华区技术总经理 喻思成
大数据的应用前景之广大已经毋庸置疑。企业CEO、CIO在讨论商业策略、IT模式创新时几乎言必谈大数据。Gartner发布的《Big Data Drives Rapid Changes in Infrastructure and $232 Billion in IT Spending Through 2016》(《大数据驱动基础架构的快速变化,2016年相关IT支出将达2320亿美元》)报告指出,2013年大数据带动的IT支出有望达到340亿美元;到2016年,全球在大数据方面的总支出将达到2320亿美元。Gartner强调,大数据分析工具在2014年将被视为一种必要投资。
如何充分利用大数据,挖掘大数据的商业价值,从而提升企业的竞争力,已经成为企业关注的一个焦点。这也是甲骨文公司努力的方向。
全面解决方案才能奏效
当前,越来越多企业将大数据的分析结果作为其判断未来发展的依据。同时,传统的商业预测逻辑正日益被新的大数据预测所取代。但是,我们要谨慎管理大家对大数据的期望值,因为海量数据只有在得到有效治理的前提下才能进一步发展其业务价值。
最广为人知的大数据定义是Gartner给出的大数据的3V特性:巨大的数据量(Volume)、数据的快速处理(Velocity)、多变的数据结构和类型(Variety)。根据这一定义,大家首先想到的是IT系统中一直难以处理却又不容忽视的非结构化数据。也就是说,大数据不仅要处理好交易型数据的分析,还把社交媒体、电子商务、决策支持等信息都融入进来。现在,分布式处理技术Hadoop和NoSQL已经能对非结构化数据进行存储、处理、分析和挖掘,但未能为满足客户的大数据需求提供一个全面的解决方案。
事实上,普遍意义上的大数据范围更加广泛,任何涉及海量数据及多数据源的复杂计算,均属大数据范畴,而不仅局限于非结构化数据。因此,诸如电信运营商所拥有的巨量用户的各类详细数据、手机开关机信息、手机在网注册信息、手机通话计费信息、手机上网详细日志信息、用户漫游信息、用户订阅服务信息和用户基础服务信息等,均可划归为大数据。
与几年前兴起的云计算相比,大数据实现其业务价值所要走的路或许更为长远。但是企业用户已经迫不及待,越来越多企业高层倾向于将大数据分析结果作为其商业决策的重要依据。在这种背景下,我们必须找到一种全面的大数据解决方案,不仅要解决非结构化数据的处理问题,还要将功能扩展到海量数据的存储、大数据的分布式采集和交换、海量数据的实时快速访问、统计分析与挖掘和商务智能分析等。
典型的大数据解决方案应该是具有多种能力的平台化解决方案,这些能力包括结构化数据的存储、计算、分析和挖掘,多结构化数据的存储、加工和处理,以及大数据的商务智能分析。这种解决方案在技术应具有以下四个特性:软硬集成化的大数据处理、全结构化数据处理的能力、大规模内存计算的能力、超高网络速度的访问。
软硬件集成是必然选择
我们认为,大数据解决方案的关键在于如何处理好大规模数据计算。过去,传统的前端数据库服务器、后端大存储的架构难以有效存储大规模数据并保持高性能数据处理。这时候,我们让软件和硬件更有效地集成起来进行更紧密的协作。也就是说,我们需要软硬一体化的专门设备来应对大数据的挑战。
一直以来,甲骨文公司在传统的关系型数据库领域占有绝对优势,但并未因此固步自封。面对大数据热潮,甲骨文公司根据用户的需求不断推陈出新,将在数据领域的优势从传统的关系型数据库扩展到全面的大数据解决方案,成为业界首个通过全面的、软硬件集成的产品来满足企业关键大数据需求的公司。
甲骨文公司以软硬件集成的方式提供大数据的捕获、组织、分析和决策的所有能力,为企业提供完整的集成化大数据解决方案,其中的核心产品包括Oracle大数据机、Exalytics商务智能云服务器和Oracle Exadata数据库云服务器。
Oracle大数据机用于多结构化大数据处理,旨在简化大数据项目的实施与管理,其数据加工结果可以通过超高带宽的InfiniBand网络连接到Oracle Exadata数据库云服务器中。Oracle Exadata可提供高效数据存储和计算能力,配备超大容量的内存和快速闪存,配合特有的软硬件优化技术,可对大数据进行高效的加工、分析和挖掘。同时,甲骨文公司在Oracle Exadata以及数据库软件层面提供了非常高效和便捷的高级数据分析软件,使数据能够更快、更高效地得到分析、挖掘和处理。