让我们突破管理数量之庞大这一点,考察一下大数据基础设施方面仍存在着某些不足,其是否是基于Hadoop的、或者是基于ADBMS,又或者是两者的组合。企业寻求最大限度地提高大数据的商业价值必须有效地解决这些问题。
如下三个建议,帮助您的企业最大限度地提高大数据的商业价值:
第一、缩小商业用户和大数据之间存在的差距
目前的实现需要许多相同的组件,传统数据仓库/商务智能(DW/BI)系统,包括建立必要的数据模式和SQL查询。这些通常是不能直接访问的大规模并行处理(产量)的分布式文件系统,如Hadoop,路线数据批处理模式。连同正常的延时与数据仓库相关的,这可能会导致影响实时决策的盲点。
第二、在同一时间管理多个源
数据管理系统通常在同一时间管理一个来源的数据。因此,复杂关系数据类型之间往往错过。信息管理和分析隔离作为一种(非常大的)仓可以产生只有一个子集,并存在潜在产生的问题多于答案的可能。一个完整的信息图片将结合企业其他相关记录的大数据实现。企业必须重新考虑他们的孤立大数据,重构他们获取和分析与解决问题所使用的分析方法,以便可以让统一的数据通过。
第三、发展语境业务
非结构化内容,如文档、电子邮件、网页内容、流畅的文字、SharePoint,通话记录和调查,既不分类也不进行分析,结合上下文理解。大多数大型数据系统断言他们“处理”的数据是非结构化的,但他们不执行文本分析或真正结合语境进行非结构化的内容分析。语境业务的理解,有助于发现新的商业洞察力,必须开发。
审查现有的大型数据基础设施的这些问题证实了企业所面临的挑战远远超出IT领导人们的理解和想象。使用上述的技巧,而不只是管理大数据作为自己单独的筒仓,可以帮助您获得新的见解和系统数据。