大数据产品能力认证2016年第一批测试结果综述

中国IDC圈4月27日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。在27日下午的大数据技术与产品创新分论坛上,中国信息通信研究院、移动互联网与大数据部的姜春宇为大家详细汇报大数据产品能力认证2016年第一批测试结果的综述。

500-333文章照片-大数据技术与产品创新-姜春宇

中国信息通信研究院、移动互联网与大数据部姜春宇

以下是姜春宇演讲实录:

姜春宇:感谢大家参与我们今天的论坛,我今天主要是就上午我们的颁奖和我们发出的认证来详细的讲述一下我们整个在认证过程中所做的一些事情和每个厂家的测试情况和认证情况的细节。熟悉我们的朋友知道,去年也是在同样的时间,同样的地点,我们讲了2015年整个测试的情况,因为我们做这件事情已经不是第一年了,这是我们第二年,2015年我们已经对国内的一些厂家进行过类似的评估了。但是今年我们在去年的基础上又有了新的一些共享和新的升级,具体我通过PPT来告诉大家。

我是来自中国信息通信研究院移动互联网大数据部的姜春宇,我们也在数据中心联盟有一个大数据工作组,我在里面是副组长。我今天的演讲题目是2016年第一批大数据产品能力认证测试结果综述》。演讲的整个内容分为两部分,第一部分是整个认证的情况,第二部分是我们的一些总结和下一步计划。

第一部分大家可以看到我们今年的一个测试标准演变,去年我们测试的组件集中在Hadoop平台上,主要是HBase、Hive、Mehcut等等,大家可以看到,我们主要是性能,加了容错性、安全和运维,是两个功能的混杂。我们今年通过去年一年的积累,我们整个思路更加清晰了一些,我们提出了整个Hadoop平台的标准体系,就是把功能和性能分离了。技术能力我们从以下七个维度来衡量,就是功能、运维、可用性、安全、兼容性、多租户和扩展性来衡量整个大数据产品的一些全面的能力。性能专项我们是专门只考察性能这一部分,这是我们去年到今年一个大的变化。

2016年我们做了这样一套标准出来以后,很多企业踊跃的去报名,经过我们的评审和认证,我们的测试企业主要针对的是商用Hadoop平台,包括Hadoop和Spark生态的所有组件。本次大数据产品能力认证包括这七项,38项测试用例,有28个必测,选侧10个,必测项全部通过才能通过我们的认证。测试环境这次是由企业来提供,规定是10台左右的物理机。测试时间是从3月底到4月20日,有一个月的时间把各个厂家的产品测试了一遍,在25日的时候我们组织了专家评审会,把测试结果通过企业互评和专家评审这两套方式最后给予确认。

大家可以看到我们整个用例的体系架构,就是从用户出发,全面客观的一个评价指标体系。分为运维、可用性、功能、兼容性、安全、多租户和扩展性。标黄的部分是选测项,其他的非黄区域是必测项,也就是说你这些能力都必须具备,才能通过我们的认证。我们整个的过程是自愿参加的,就是企业来自己通过报名参加,我们整个过程比较科学严谨、公开公正,是这样一个流程。大家可以看到我们左边是一个认证的流程,右边是一个评审的流程。认证是从报名提交材料,准备测试环境,专家现场审核,给出一个测试的结论。我们再组织企业互评,再组织客户专家和学术专家的评审,达到对于测试结论的认可,达到一个评审结论。对于我们通过评审的各家企业,颁发我们的证书。通过评审可以看出来,由测试专家来汇报整个测试的总体情况,每家企业就他的测试报告和测试情况进行答辩,每一项用例怎么描述。每家企业的竞争对手都在里面,去互评他们。再就是有一些学术专家和企业专家以及客户专家,一起来给出一个评审结论。