12月12日,全球首个探讨产业互联网的大型会议,2014 CVW﹒产业互联网大会在北京亦庄召开,并通过纽约时代广场大屏幕同步呈现。大会由亚信集团、云基地和亦庄经济技术开发区联合举办,汇聚超过5000名关注互联网和传统产业发展的全球IT和传统行业领袖和精英,探讨“互联网进入传统行业”、“传统行业互联网化”的演进以及产业互联网的技术模式和业务创新。
在下午的云平台@互联网论坛上,来自IBM的蒋军华先生带来《软件定义基础架构》主题演讲,介绍了IBM的软件定义基础架构产品及应用案例。
以下是他的演讲全文:
蒋军华:感谢主办方的邀请,今天来的时候一路狂堵,所以挪到最后了。我演讲的题目叫软件定义基础架构,里面有两个主要的动词,一个是加速时间,降低成本,其实我觉得这也是云计算的本质。
云计算发展到今天应该说有很多年了,炒的非常的火热,但是在圈里的人都应该知道,盈利的公司非常少,或者说今天靠着云计算,无论是它这种模式,还是说它的概念,最终得到飞速发展的不是特别多。即使像Google、亚马逊,我想也都没有得到太多的好处。当然这不是我今天演讲的主题,我今天的演讲题目之所以叫软件定义基础架构,无论是云计算或者是大数据,或者今天谈到的任何一个概念,其实软件在里面应该是一个主打。
今天大家用互联网用的这么high,但是你并不知道你所用到的服务在什么地方,是在北京、在上海,还是在美国,你也不用关心,但是你依然用的很High。回到移动互联网也是这样,这是我们今天面临的一个趋势。来看一下我这边报告的具体内容。
第一,从趋势上来谈,我们的组织或者企业,今天的主题叫产业互联网,我们这个产业其实面临着很多新的机会。这个新的机会其实就是云计算或者说大数据,和今天的移动互联APP。虽然说大家没有在云计算领域挣到太多钱,但是它创造了一种新的经济模式,我们的消费模式。你用计算资源的消费模式已经彻底的改变了。过去2000年的时候大家都会跑到中关村撺一台机器,一是在家玩游戏,二是当时的互联网也是一个新生事物,大家还想上网得到一些新闻,但是你的载体还是依赖于你那台机器,而且机器配置越高越好。但是今天不是这样,今天游戏可以是在线的,你不需要买太好的电脑,这个好的后台由基础服务提供商来提供。而且你可以按需去获得你需要用的资源。比如说云存储,在网上提供了很多在线的云空间,包括360、百度提供的都是10个T以上的。这在以前是不可想象的,过去买一个1000个G的硬盘是不可想象的,现在所有的东西都可以放在网上。这是一种消费模式的改变。
第二是大数据。大数据可以帮助我们更快的得到你想要的答案,但这些数据的制造者是我们在座的和很多很多的移动终端。这些数据本身拿过来是没有价值的,数据只有去做分析才有价值,今天国内的BAT,和像国外Google这样的公司,已经变成了数据公司。当然我们跟前面这几家互联网公司不一样的地方是我们做的是企业级的大数据,无论是ERP还是CRM有很多很多的数据,这些数据不是普通的,怎么用这些数据来辅助企业做决策,这才是大数据要做的事情。这就是大数据分享。
第三,社交媒体。社交媒体和移动互联带来的最主要的变化就是互动,我们现在可以实时的去跟海内外的好友沟通,也不需要花钱。今天电信公司,移动也好,联动也好,都在担心将来怎么办,微信已经可以免费的打电话、免费的视频了,短信没有了,电信公司还靠什么活,所以这是他们要去思考的问题。
IBM提出软件定义基础架构,它是未来企业无论去做自己的私有云,还是混合云的基础。
从三个层面去考虑,一是优化。优化是从应用层,刚才上来谈到无论是从大数据的分析层面去优化我得到的一些数据,还是从移动端产生的数据再去优化,使得我的应用周期能够更加的有效,能够更有效的来支撑我的企业的发展。
二是自动化。今天的基础架构其实越来越庞大,技术更新换代也非常的快,我们看到了CPU马上18核单处理器的就要出来了,18核在过去来讲就是18台机器,怎么样让你的应用在这10台机器里面跑。而我们的云计算环境可能有一百个或者上千个18核这样的机器,怎么让它像一台机器一样自主在那跑,这也是依赖于很好的标准化的软件去做这件事情。
三是怎么样更好的抽取你的资源,让你的资源的交互更加的方便。我们可能有很多的服务器、很多的存储,甚至有不同的应用,什么样的资源交给什么样的人用,以什么样的维度。比如我有100台机器,是给100万的人用还是100人用,这在于你的资源划分的力度,就是由软件来定义。
基础架构有三个理念,第一个是池的形成,我怎么来更好的整合在不同时间段购买的不同基础架构的资源池。整合好了之后怎么来让更多的应用,不管是什么样的应用,不论你是数据库,还是非结构化的视频或者图片或者文字文本等等,这些应用不同平台怎么样来互联到里面。另外是管理,这个管理是动态的。怎么借助比较好的管理工具或者软件把前面的资源池和这些应用互联起来,这是我们的软件定义基础架构,也是我们为企业做云或做分析设计的一个框架。基于这样一个软件定义基础架构,你不做基础架构的优化也可以得到大概4到100倍的提升。同时降低你的IT的成本,因为电费、带宽费都是非常高的。
这是我们基于可扩展的应用,多应用如何在数据中心里面运营,这是今天应用的一个现状,有高性能计算的,有高性能分析的。比如说金融行业的股票市场,指数变化非常快,这就是用到典型的高性能分析软件。二是基于Hadoop大数据分布式计算的框架。三是过去一直高大上的,叫高性能计算,我们的天气预报,汽车、飞机制造都来自于高性能计算的模拟仿真。高性能计算经历了很多的阶段,最早的时候高性能计算是一台很大的主机,机器非常大,后来发展成分布式计算,到今天更加的宽泛了,但是它能承载很多分布式应用。四是分布式运算框架,很多互联网创业公司都在用不同的数据库,这些未来在大数据的平台上应该会成为主要的方向。
像我们今天拿的智能手机,你的智能手机无论APPS是哪家公司开发的,都会有一个iOS平台来承载你的应用,能够很好的互联起来。我们传统的企业数据中心或也希望能做到,怎么来做?因为你要做到这些,有两点特别关键,一是基础架构,基础架构就是服务器,比如每一种不同的应用特点是什么,我把什么样的应用放在服务器上。X86里面也分我是分布式的来运行,还是在一台大内存的机器上运行,这里面就需要有一个很好的调度。通过调度来加速基础架构的运行。
二是也要有一些工作流的引擎。工作流的引擎相当于是一个中间件,后面的硬件大家能够统一行动之后,我就需要承载上面的一些应用中间件,由它来启动,我把某一个应用放到架构上去,当然它跟后台的资源管理的软件要有很好的沟通。
左边第一个是IBM公司基于15年的经验开发的高性能分析低延迟的中间件,它能够支持很多像金融行业股票交易的测算。银行每天存取款、放贷、收贷的工作量非常大,十几年前中国银行政府免了好几万亿的不良资产,国外的银行为什么很少有这种不良资产,关键是他们经常做这种流动性风险分析。比如说我预期明天有300个亿贷款还回来,我先放贷400个亿出去,当然不行。如果不做这种流动性风险分析或者做的周期特别长,以前我们有一个国内的客户,一个月做一次,这个周期显然太长了,后来采用了我们的架构以后,现在差不多一天做一次,关键是可以提高资金的使用率。我知道有多少可以放贷的资产,我就可以很好的运营,同时减少坏账。我们有这样的中间件来支撑这些应用。我们保留了一个很好的接口,你在开源Hadoop上做的事情可以很好的兼容。
三是高性能计算引擎。我想这也是分布式计算的一个老祖宗。我们国家很多大的超算中心,像深圳、北京、上海超算中心,他们都是面向公共服务的,其实就是类似于我们的互联网公司,但是他对外提供计算资源的服务。比如制药公司需要做药的筛选,中间需要大规模的计算,我就可以在超算中心租设备,租100台设备用两个月。超算中心有1000台机器,每天来申请的人很多,怎么来协调,怎么来分布。它可以做到以一敌十。
我们有一个做手机芯片的客户,做测试,终端服务器设备从2002年的200台到2012年的6000台,涨了30倍,还需要涨,因为不停的有人找到他们。这就容易造成资源的浪费,其实我们软件定义基础架构核心就是怎么提高资源的使用。针对这种情况2012年他采用了我们的工作流引擎,每天处理的任务数由过去的一天大概不到100万增加到300万,他们企业没有再买过任何服务器,就可以把6000台充分的利用起来。通过工作流引擎,结合资源共享中间件,很好的把后面的资源使用率提升了。这是我们之所以做云或者做分布式计算的一个初衷,把资源共享的效率提升。
四是针对现在新的应用,现在我们应用越来越复杂,开源的技术、开源的平台也层出不穷,分布事实上数据库等等,怎么样来定义这些应用在我资源上的优先级,怎么来控制它。我不可能总是依赖于虚拟机,有的应用是不需要做虚拟化,做虚拟化反而会降低它的使用效率。这种新的应用框架也是一样的,怎么提高资源共享的效率,我们做了一个应用服务控制器。除了可以保证或者控制应用的安装顺序和启动顺序之外,同时还可以做迁移,一旦我发现你有10台其中有2台坏了,我可以找到新的2台迁移过去。
我们把前面的计算解决以后,接下来产生的这些数据怎么办?把资源共享起来,不管你是谁的设备,或者什么架构的设备,也不管你是什么操作系统,我的中间件就可以很好的来调度和分配。
把服务器层面,计算资源前面的工作流整合完了之后,接下来就会产生数据管理问题。前面的应用对资源的需求有物理机的,也有虚拟机的,今天很多单位也都在做自己的云,有私有云,同时也有一些数据放在公有云上。这些不同的架构之间怎么来整合,通过底下的三个工具,一是做物理机的管理,二是结合刚才提到的中间件,像高性能计算提供大数据分析的服务,大家可以直接把应用部署上去。如果你要做一个私有云,怎么借助软件?我们有一个基于Openstack的软件,特色在于我们可以结合前面讲到的资源中间件,包括调度的核心策略帮你构建混合云。把你家里的私有云和公有云,不管它是IBM的,还是亚马逊的,给它做成一个可以共享的资源池。我们在IaaS层之上又做了一个PaaS上,帮你做不同形式的云。
云做完之后回到刚才谈到的数据管理问题。后台的存储和数据关系我们做了弹性存储,可以通过计算文件去划分存储资源。刚才说到百度提供了那么多的空间,实际上他知道这些空间肯定是用不完的,但一旦有人突破了,他们也会采取一定的措施,实际上就是弹性存储。这是数据管理或者存储管理的层面。
我们把基础架构做完了,后面的服务器层面做完了之后就做存储,在这之上承载个人应用或者商业应用。
这是我们的一个世纪案例,花旗银行在全球有将近5万个CPU在运行特定的业务,包括风险投资。他的全球资源的管理和共享就是借助IBM的一个组件去做的,他们的系统提升了100倍,运算的效率和资源的使用率都得到提高。
还有一些其他的案例,第一个是英菲尼迪红牛赛车,连续三届的世界冠军,他用的就是我们的高性能计算中间件,后期又用到了我们的大数据分析,来分析在赛车运行过程当中采集的一些数据,从而更好的优化轮胎等汽车方面的设计。
第二个是一家做手机芯片的公司,用到了我们的弹性存储技术,能够提升10倍的使用率。把他的整个存储空间使用效率提升。
第三个是美国德州的一家治疗癌症的公司,借助我们的弹性存储这样一个平台,给全球的7000多个科学家提供决策支持,进行诊断。他们治疗癌症的方法不太一样,用的是分子图谱。
下面这个是电信运营商,电信运营商也在做很多今天互联网公司做的事情,也在转型。利用我们的分布式计算技术,帮助他做一些很好的扩展。
软件定义基础架构主要的目的还是为了平衡企业里面不同用户不同层面的需求,我们IT的经理公司对他的要求是降低成本,不要买那么多服务器。当然终端用户或者各个业务部门也有自己的一些考虑,希望当我需要用的时候资源能够快速的得到,我希望我研发的芯片能够比别人早两个月上市。总的来说,借助软件把你的资源使用率提升,把基础架构的共享工作做好,管理工作做好,从而满足不同层面的需求。这是我们软件定义基础架构的核心。
谢谢大家!