目前大数据的处理最大的问题在于投入产出比,也就是对数据分析投入更大的力度是否能够带来更高的回报,然而随着SNS等新型互联网使用形式的到来,数据类型越来越丰富,数据存储和处理也变得多样化,数据管理遇到了前所未有的压力。
数据分类的科学性
传统的基于计算机原理的数据分类中,将数据划分为计算机可直接处理的结构化数据和无法衡量信息量的非结构化数据,但是这样的分类只是根据数据处理的难易程度,却忽略了一个关键问题:是否将更有价值的数据从海量数据中筛选了出来?针对这个问题,目前的大数据管理领域已经逐步开始细分,而主数据的概念也在细分领域中被提了出来。
与传统的依据数据处理难易程度划分不同,大数据管理方案供应商Informatica将数据划分成为互动性数据、交易数据以及主数据三种类型,而其中最引人注意的就是主数据。
Informatica的划分规则依据的是数据的用途,主数据指的是指系统间共享数据(例如客户、产品、供应商、账户和组织部门相关数据)。因此主数据是企业的核心数据,在企业运营中担当着关键角色的数据实体,企业的许多经营活动都围绕着主数据进行。主数据处理的价值在于数据的真实性,而主数据的管理的主要任务就是对数据进行匹配,寻找真实、有用的数据。
专注于一类数据处理
抓住了主数据这个关键的概念,大数据处理的理念也需要有对应的改变。传统大数据对数据的保存和分析缺乏目的性,数据类型和内容分散,信息量难以衡量,因此投入产出比很低,数据究竟带来什么样的价值也很难衡量。而如果只锁定主数据,那么大数据的存储和处理成本就会全面降低,并且数据类型和信息量趋于统一,便于提升投入产出比。
从一类数据开始、从小数据量开始,根据需求不断增加数据量处理,这就是Informatica产品引导用户要做的事情。简单来说,就是将大数据处理转到更注重数据质量的思路上来。这样做的另一个好处就是让数据量不是很大、发展空间很大的企业也参与到大数据的处理中来。
作为实际行动,Informatica在推出的产品中有不同预定义的Package针对小企业、中型企业或大型企业,用户可以根据自己的实际情况进行选择。同时Informatica主数据管理针对存储数据、社交数据、移动数据等不同类型的数据进行管理,以适应不同类型数据。另外,Informatica还通过与合作伙伴建立生态系统的方式,针对多个垂直行业构建主数据管理技术,比如零售业、金融服务、制造业、生命科学、医疗、能源等。
生态环境
搭建生态系统也让Informatica具备了灵活的定制能力,可以针对更多垂直行业进行量身定制。当环境变化需要生成新的数据处理系统时,Informatica MDM并不用进行编程生成代码,而是通过元数据来处理,不用停机测试,灵活的适应能力对客户来讲非常重要。
同样,越来越多样化的数据对于主数据管理也带来了巨大挑战,对于这种情况,Informatica专门推出了有针对性的管理方案,比如针对云计算的Cloud MDM,针对社交媒体的Facebook MDM等等,而针对数据库终端多样化的问题,则在软件中逐步提供了对SQL Server、SAP HANA等的支持,以确保能够快速对主数据进行识别和处理。
Informatica非常关注中国市场,并保持着不断学习的心态,会随着市场趋势调整自己的发展战略。针对中国市场,Informatica在业务运作模式等方面做了很大调整,之前五、六年是通过自己与客户面对面的沟通来拓展业务,通过几年的积累,Informatica已经有了一定客户基础和品牌形象。现在,Informatica希望与行业中、市场中最顶级的合作伙伴结盟,他们能够帮助Informatca完成从初期积累到中国市场无论是行业还是区域市场迅速覆盖的深入推动,借助大数据的这样一个机遇在中国市场做一个大的飞跃。