数据分级和设置主键
分级大数据需要额外的硬件,软件,存储媒介。存储前为了执行任何转换或清洁,作为临时区域分级是必要的。此外, 数据仓库, 现在加上大数据, 随着时间而积累数据。这样的数据必然是由日期或时间为主键。人们也普遍在数据仓库获取业务数据, 并将它按日期分区存储在DB2表中。如果这些表中的数据以日期为主键,这些主键也必须被添加到大数据。
另一个问题是纯粹的数据量。为了帮助解决这一问题,多数大型数据分析解决方案都包括某种形式的数据压缩的或专有的数据存储机制。
数据访问和分析
最后我们将数据整合到数据仓库。此时,用户可以对合并后的大数据和当前数据仓库执行分析软件。这就是你最后感觉该实施是否值得投资的时候。
数据归档
最后我们考虑数据档案。随着大量的数据被分析,庞大数据量可能会占用宝贵的存储媒体并让一些流程运行缓慢。IT和业务合作伙伴必须决定旧的或失效的大数据如何以及何时需要归档,以及是否必须保留下来供以后使用。这是另一个要考虑的成本因素。
总结
分析大数据增加业务价值的概念听起来美妙。然而, 实现过程中有几个步骤,他们会影响企业数据仓库流程的方方面面。看看你的整个的企业级数据仓库流程、硬件和软件来确定您的实施将影响的每一个区域。只有这样,你才能准备好过渡到大数据。
还想了解更多的BI商业智能软件知识?那就快快加入我们的“绿色BI社区”,与我们共同学习成长!
更多详细信息,请您微信关注“计算网”公众号: