这预示着管理与供应差异化的IT基础设施的来临,哈佛下一步将彻底摆脱Boston数据中心,同其他四所大学一道步入“社区云计算”,这就是位于90英里外的麻萨诸塞州绿色高性能计算中心项目。项目会在2014年完成,这或许会是哈佛构建的最后一个数据中心,据哈佛计算中心主任兼CTO的James Cuff透露。
“如今不必再与硬件打交道了,”在艺术与科学学院(FAS)计算办公室的一次访谈中,他谈到;早前哈佛的回旋加速器实验室已在2002年关闭。那栋建筑进行Cuff的高科技运维再合适不过了。
在他的办公室内,硕大的监视器被安装在墙壁上,并与笔记本相连,通过少数命令,Cuff就可以列出活动中的计算项目和资源。他可以立刻显示出所有东西,小到几个CPU和少数文件存储,大到参与当前项目的数百TB和虚拟化服务器,这些统统通过‘所有者’(被供应资源的对象)的ID列出。
Cuff负责这些,当然,这不是Amazon Web Services。事实上,他管理的资源是有限的,但正因如此他才能完全控制自己的云计算。“我们时刻都有4千名的订阅者以及将近1千个活动,”他说。
对于团队如何控制基础设施,如何针对不同类型基础设施进行新模型、新技术的不断研究,他已退居二线。他常说,任何一名会写“类似Perl脚本”的大学生就能接管他的整个运维,这也是他最初的动机,在掌握基础设施状态问题上,要拥有敏锐的洞察力和控制力。
从IT角度来看,结果是相当惊人的。通过哈佛艺术与科学学院(FAS)几年来在整合方面的努力,Cuff与来自各个学科的经营者们,不仅在计算科学,管理数百台服务器、数PB存储、以及数千台虚拟机,都只用花费最小的精力,就可通过一条供应通道向所有人提供使用。Cuff说,他可以通过在折扣零售商Newegg那里订购部件来进行运维(实际上,有不少经销商会给予哈佛学校折扣),他将运维丢给科研人员,甚至是在他忙着带走他们现有机房的同时。
只要他们愿意,他们可以用拨款购置自己的设备,Cuff说,但在他的运维范围内,他可以在几分钟内提供他们更多的需求。相比花费数周乃至数月构建集群,这可是很轻松的买卖。Cuff表示,云式运维的核心在于网络。
对科研人员从事云计算最大的障碍就是带宽,Cuff认为。网格计算和超级计算一直就在我们身边,但时至今日,你也必须利用带宽才能触及它们,就好比你必须坐在有电脑的屋子里。这个问题要在二元问题中找条出路,这样Cuff才可以同时利用规模和现代高密度数据中心的优势。
答案就是一条每秒40GB链接Boston商业中心设备的光纤。底层属于Macy,建筑的其余楼层才有趣。
它是Markley Group运作的数据中心,Cuff使用第七层的角落进行高密度计算,运行所有的设备,从跑在无线带宽(InfiniBand)上的刀片服务器到576TB的SATA硬盘阵列,再到跑在每秒40GB以太网上的商业服务器,以及他所谓的“商业云计算”。每每游览数据中心,Cuff都感慨到,真得很惊奇这么一个小小的地方会有多少活动发生。
“我喜欢展示恒星模拟,简直就是我的最爱,”他面带微笑地说。此时的他站在一组机架中间用手比划着,“这就是它!整个银河都在这里。”他所说的就是哈佛最近的一个项目,模拟银河系的螺旋形成,该实验需要假设,计算并推导出数十亿个恒星的时刻运动。