2007年,宝德科技协助华大基因绘制了全球第一张黄种人基因图谱,引起全世界的关注;2008年,宝德再次投入熊猫基因项目的运算和应用,助力华大基因取得了又一创举。近期,宝德与华大基因再次牵手,宝德高性能计算集群在天津华大基因科技有限公司成功应用,助力华大基因在全球基因测序的竞技场上释放越来越大的能量。此次合作,宝德HPC方案既为天津华大基因打造了高效的计算基础平台,又为其信息安全提供了可靠的保障。
华大基因是基因组测序能力及生物信息分析能力位居亚洲第一、世界第三的基因组研究中心。天津华大基因科技有限公司于2011年4月顺利落户天津空港商务园,从事面向中国北方的包含但不限于生命健康(包括胎儿、心脑血管、肿瘤、老年病等基因检测、诊断技术及干细胞、克隆技术)、生物育种(包括抗干旱、耐寒、耐碱等农作物育种)研发、运营业务。目前,天津华大基因成为华大基因在华北区乃至北方区的中心,且国家基因库北方库已于2012年6月在天津华大基因建设并投入使用。
为支撑天津华大基因各重大科研项目和各个产业体系的发展,天津华大基因信息生产中心不断地在高性能计算领域内开发可以解决生物信息产生的海量数据方面的硬件和分析软件。本次宝德高性能计算集群支撑的在线生产系统,正服务于国家基因库北方库。
就本套高性能计算集群而言,其主要目的在于解决大规模生物信息计算的处理问题,计算能力毋容置疑是首要选择指标;同时,其存储能力指标同样不容小觑,因为在计算开始时,要从存储系统中读取数据,计算结束时,要向存储系统中写入计算后的结果,如果这之间的读取和写入速度不匹配,不仅会拖延高性能项目的完成周期,低延迟还会严重影响高性能创造价值的能力。
针对本次项目需求,宝德为天津华大基因提供了一套具有高性能、高容量、高可用、高可靠特点的高性能计算集群。该集群计算子系统采用64个高密度计算节点+2个PR4840R承担前端计算节点;网络子系统采用高带宽、低延时的56GB InfiniBand网络做计算网络,千兆以太网做管理网络;后端采用600TB的Lustre并行文件系统做整个集群的统一存储,底层硬件基于高容量、高性能的高端磁盘阵列GS5316D。
本集群Lustre并行文件系统
宝德是国内领先的云计算解决方案提供商,同时也是国内HPC产品技术成熟度最高的厂商之一,在生物信息和生命科学计算领域,宝德HPC积累了大量的客户和行业经验,此次与华大基因的又一次合作,再次有力的证明了宝德高性能计算集群在该领域的雄厚实力。