品高云行业架构师陈春华:品高云在自主可控和大数据支撑方面的研究和分享

我们从2013年、2014年就开始说我们想要做自主可控,那个时候其实我们最开始只是做自主,因为我们最开始从,包括操作系统,我们开始跟中标、麒麟、普华,再到我们的中间件,像一些国产的数据库,像(人大经仓、达梦)这些,一起做,把整个软件层做到全国产化,全自主研发的。这个层其实做完还只能算自主,还没有做到可控。这个是为什么呢,因为我们整个云平台的环境还是搭建在X86的服务器,还是国外的一些技术,那真正想从自主变成自主可控,我们是在2014年开始研发,然后2015年真正落地,包括跟龙芯,然后像飞腾深微这些国产的服务器,从硬件到云平台到操作系统到软件、中间件再到上层的应用,一个全国产化自主研发的一个平台,就是这么一套云平台才可以称为,我们是构建了一个完全的自主可控平台,就是说从我们开始自主研发,再到我们整个云平台自主可控,这个层是我们做的。这个是我们实际环境简化的TOP图,这个图里面可以看到,可能刚才聊到我们的服务器构建在国产化上头是完全OK的,但是这里面有一个过程就是说,我们有X86的服务器,有国产CPU的服务器,为什么我们会做这么一件要支持X86,又要支持国产CPU的易购平台呢?

其实这里面有一个很简单的例子,其实我们已经有太多的应用,有太多的系统都是部署在传统的X86架构下面,这种环境下,我们想做到你颠覆式的,全部推倒原来的换成现在是很难的。这个过程中一定是有一个渐进式的过程,于是我们要做一件事情,要把传统的X86加国产CPU的易购能力做出来,这个其实已经在(航连客供的轻六所)那边就已经包括落地,包括有试验的基地是可以参观的。究竟我们的云平台,就是我们把国产CPU构建一个自主可控的云平台,最终的形态会是什么样子这里有一个实际运行环境的Demo,给大家演示一下。

(播放视频)

刚才可以看到,完全构建在龙芯3D的服务器上面,这个是去年我自己在我们公司弄的一个小的测试环境,在这个环境里面,我们可以看到,我们可以像跟公有云一样,在界面上面,自助式的获取你想要的一个基于龙芯成果展化的一台服务器上面的一个计算资源。这里面可能有一点大家细心的朋友可以注意到。最后我运行的一个(Ubent)的一个性能测试,性能测试里面可以看到,我们的基于龙芯的云平台里面,构建的实例,他运行出来的结果,跟我们的物理级的性能,几乎是没损耗的,这个里面做的另外一件事情,我们其实是从自主可控来做一件事情,我们一直是想突破,因为其实当我们把整个国产服务器做到上云这么一个阶段,解决的问题是我解决了大规模的资源调度,和资源交付的问题,但是真正要落地到生产,那其实你的性能是会成为一个瓶颈。

于是我们一直要突破的就是性能的问题。那在性能问题里面,我们看到传统的虚拟化架构里面,很明显是有一层虚拟化的损耗的,我们是利用龙芯的技术,在利用龙芯技术,可以看到我们在架构上面,明显的是减少这一层,这一层,因为目前业界的一般的虚拟化手段的一般会在5%到20%不等在这一层,我们用龙芯的技术实现之后会发现,我们提供出来的实例,我们不叫虚拟机,因为这个是龙芯实例,龙芯的实例的性能,是跟我们物理机,几乎是无损耗的,这样的话,我们是真正可以在生产中去应用的。我们的这个龙芯实例,是在我们的合作伙伴,包括也是我们的客户,科大讯飞的一个实际的一个测试的结果,因为大家都知道科大讯飞是做语音云的。但语音云引擎对性能的要求是非常严苛的的他们以前是用OpenStack,开源的OpenStack的环境,会发现,性能始终上不去,这种情况下,我们的容器,我们云平台提供的容器技术,当时是最后测试的结果,包括CPU的计算能力,以及对于GPU加速的能力,这个是真实是能够解决到他们的一个云引擎的性能的这个能力的,那做完这个,可以看到,我们在虚机,容器,以及GPU加速上面,这里分享一点,我们其实他插型显卡我们在2012年的时候,就开始去做这方面的工作了,那其实落地的时候,是在2014年的时候才落地的,像英特尔的协助引擎,(Fair),英特尔本身是2015年的时候,出来的。

他2015年出来的时候,到现在,我其实已经适配完成,但其实还没有在客户落地,因为每一个新的东西出来的时候,他一定是被市场接受是有一个过程的,在被接受的过程之前。作为厂商一定是要在市场之间,要先做很好的技术的研究,以及实践,这样的话,你到后面,真正是到市场,到客户的现场,你才会遇到的坑少,碰到的问题才能少。这个我们一直在做的,是我们技术驱动型,而不是说市场驱动性,这个我们做完,他是安全看,当时是做一在有一个很典型的应用场景,是在中山大学那边,因为他们那边会做机器人,机器人学习,机器人出去比赛的时候,所有的指令的都是智能的,那这个工作是在哪里完成的,其实在实验室里面。