云计算自己也在不断演进中,不管是大表方式,还是其他技术,它也在不断改进发展。但是机制上的前天不足,让它和传统数据库毕竟不是一个量级。IT技术的演进从磁带、文件到DBMS,云计算实际是回归到文件,而这是有前提的,即必须业务操作简单才行。这是云计算的一个局限点。
这并不是说云计算对网络运营商就没有用。经过详细分析,我们发现,对于电信运营商,很多数据的存储,以及部分数据操作可以放到云计算平台上运行,而这将大大降低在IT方面的投资。对于通信领域,大家知道,一方面IT投资大,另一方面议价能力却有限,数据库、服务器就那么几家国外产品。云计算则可以大大削弱运营商在这方面的依赖。
我们做过比较,在云计算平台上1个TB数据的成本,相较于数据库上1个TB的成本,便宜达一个数量级。因此,云计算平台在电信运营商的IT环境下是有价值的。云计算给我们的另一个启发是,原来的很多操作都在数据库这样昂贵的平台上操作,其实其中的很多运算完全可以放在廉价的平台上操作,并不是所有的计算都要放在昂贵的平台上操作。
作为电信运营商业务,不论是计费还是经分,很多处理过程是可以分阶段、分步骤实现,在此过程中,云计算平台可以用于完成一些“粗加工”。因此,不是说绝对地这个业务适合云计算,那个业务不适合云计算,而是业务的某些部分可以适合云计算平台。
举个例子,运营商现在进行的汇总计算,比如多少的用户,今年花费多少话费,通话时间多长等,这类操作是可以分解出来,在云计算平台上去完成的。而云计算的提高性能体现在并行计算上,经过测试,数据挖掘类算法借助云计算确实能提高效率、缩短时间;但是对于递归操作,并行计算就起不到作用了。因此,回到最开始:是业务选择了技术。
应用从非敏感业务开始
记者:对于云计算供应商的选择,以及不同技术路线的判断,您是如何看的?
丰博士:云计算中的MapReduce等都是开源的。因此,对于这个问题,站在一个企业的角度,面临着两个难题。第一,在开源软件环境下,如何保证服务质量?代码是开源的,但非产品化的软件,不能像供应商提供的产品,出现问题可以找到厂商提供技术支撑。开源的问题是出了问题找不到人。第二,后续维护成本如何控制?成本分为两部分,上面所说的是硬件成本,没有涉及管理成本或维护成本。云计算环境中要担心的恰恰是这个问题。谁来提供云环境下的管理软件,如何保证云平台的可监控?以前供应商的服务成本是固定的,大家心里都有底,但是在开源的环境下,谁心里都没底。一年花多少钱才够?没人知道。Google是有自己的专业团队在维护,像电信运营商这样的企业是否愿意维持这样一个庞大的维护队伍?这都是问题。
而对于目前厂商所提供的私有云解决方案,个人认为更多的是偷换概念。什么是云?Google云的最本质特征是使用了PC Server和MapReduce等开源软件。个人认为,这两个特征正是云计算最主要的特征。现在,一提到云,所有厂商马上就说自己都是云,确实现在服务器、数据库,哪里里面没有并行计算。但此云非彼云,和用PC Server的云比起来,他们的成本可高得太多了。真正的云就应该是便宜的云。不是说现在的产品,换个马甲都叫云。并行计算是云的特征之一,但并非是并行计算就叫云。
记者:是否有一些云计算相关的应用经验与大家分享?
丰博士:目前,我们在数据分析的ETL部分做了一些尝试,效果不错。还有一些数据挖掘类的应用,比如客户离网分析,也看到了其价值,特别是速度相对更快,成本当然也降下来。我们发现,大部分数据挖掘算法都是可以通过云平台实现,虽然性能不一定都能提升。同时,问题也比较明显:云计算的操作对人的要求更高,它需要把算法进行并行化改写,这些都对操作人员提出更高要求。
目前,我们还是以数据分析的试点为主,计费等敏感业务毕竟涉及用户更广,目前还需要时间和论据来证明。我们也还在摸索哪些业务运算能够移植到云平台上来,这样能够让我们大大地节省成本。一切都还有待时间的证明,特别是核心系统更需要时间和阶段。目前,国内的云计算应用也不多,除了互联网,还没有看到一家大型企业的IT应用是使用云计算。但有一点是可以肯定的,任何一家企业的业务计算都是可以拆分到云平台上的。这是我们最大的经验。