对于利用Hadoop计算的商务应用来说,采用功能和性能都很强大的CPU并不是一个好主意。很多采用SeaMicro的Atom-smasher微型服务器的用户都支持这一观点。
SeaMicro推出的SM10000-64微型服务器目前已经开始了销售,这款服务器在一个10U架构中安装了256个英特尔双核64bit N570 Atom处理器。
由于安装了数量众多的CPU,所以这款微型服务器在内部集成了一个负载均衡器,而服务器中的内部网络交换机也将其中的节点打造成了一个3D环面(与超级计算机相同)网络,这款微型服务器与外部的信息传输则通过千兆或万兆上行链路来完成;另外,SeaMicro还为这款服务器的众多节点配备了64个硬盘来存储计算数据。与其说这款SM10000-64是一台微型服务器倒不如说他是一个为松耦合并行计算而设计的低功耗数据中心。这种设计对于Hadoop(分布式计算的一种)、Memcached(分布式缓存)以及web服务器等应用来说非常适合。
对于美国在线交友网站eHarmony(类似于中国的世纪佳缘)来说,采用SeaMicro微型服务器来构建自己的数据中心是个非常不错的选择。而之前,eHarmony的工作负载都是通过云服务来完成的。eHarmony并没有透露公司之前采用的是哪个供应商提供的云服务,不过SeaMicro公司联合创始人兼CEO Andrew Feldman表示,eHarmony拥有3300万注册用户,而要把这些用户相互匹配起来则需要通过29种不同的算法来进行(eHarmony注册用户需要完成众多由专家设计的心理测试题目,网站也由此得知用户的性格和心理情况并建立对应的各方面数据)。对于这些仍然单身且渴求真爱的用户来说,通过云计算来匹配的方法实在是太慢了。
如果将eHarmony的Hadoop计算放在云服务器上的话,那么完成一个匹配通常需要3-5小时,这取决于当时云服务的繁忙情况。由于时间冗长且充满不确定性,eHarmony的其他应用经常出现反应慢等情况,因为这些应用通常都需要预先得到匹配计算的结果。Feldman虽然并没有透露eHarmony在采用SM10000-64微型服务器之后能够节省时间的具体数字,但他在描述这一问题时确实用了“显著减少”这个字眼。另外,与通过云计算来完成匹配计算相比,eHarmony在购买了SeaMicro的微型服务器之后,运营成本减少了74%。
由于在eHarmony项目上的成功,Feldman笑谈已经有三个字母组成缩写的美国政府部门开始与其进行有关微型服务器采购的接洽。
在另一个Hadoop项目中,SeaMicro同样赢得了订单,不过受限于合同,SeaMicro并不能透露用户的名称,但SeaMicro可以透露其产品在用户测试中的结果。
在客户的网站项目上,SeaMicro Atom-smasher微型服务器用10分50秒或更短时间完成了测试项目,其对手是采用至强处理器的机架式产品。两套产品都采用红帽Enterprise Linux CentOS 5.4操作系统和Cloudera Hadoop计算(准确的说是CDH3计算)。
测试使用Hadoop算法并用实际客户数据来进行并且参与测试的服务器需要在规定的时间内完成,时限为1分50秒。而功耗部分则采用美国国家仪器公司LabView 7.1图形化工具来测量,测量标准为Xitron 2801。测试以采用服务器的多少、功耗以及体积等因素来判断胜负。
为了在规定的1分50秒内完成Hadoop运算,SeaMicro采用了两台SM10000-64微型服务器,每台包含了64块SATA硬盘、256个频率为1.66GHz的双核Atom处理器。事实上,两台SM10000-64微型服务器还可以提前10秒完成任务。两套系统占用了20U的空间,也就是不到半个机柜,功率为880W。每套系统的售价为14万美元,两套系统共需28万美元。
而如果采用至强机架服务器来完成这套Hadoop运算的话,则需要76台1U机架服务器。每台服务器包括两个四核心至强L5630低电压处理器,运行频率为2.13GHz。每台服务器拥有4个SATA硬盘。76台服务器一共提供了304块硬盘,比两台SeaMicro SM10000-64所能提供的128块硬盘多了不少。
客户的要求是每台Hadoop服务器需要有6块硬盘,以避免I/O冲突,而这一需求还有增长的趋势。除此之外,使用至强处理器的76台服务器在规定的1分50秒完成了测试,不过这76台服务器几乎占用了两个机柜的空间。如果以1分50秒完成任务来计算,76台服务器的功率为3387W。