对于高性能计算来说,制造是一方面,管理又是另外一方面。由于庞大的体积和超高的性能需求,超算的设计和制造难度可想而知。而另一方面,如何将超算系统内部的数万个CPU、PB级内存、海量存储以及无数的网络接口有效的管理起来同样是相当大的考验。而作为全球顶级高性能计算设备的制造商,浪潮在配套管理软件同样造诣颇深,而这其中的主流就是名为“天眼(Teye)”的超算集群管理软件。
天眼(Teye)能够提取高性能应用程序在大规模集群上运行时对系统资源占用的情况,并实时反映应用程序的运行特征,从而帮助用户最大限度的在现有平台挖掘应用的计算潜力,进而为系统的优化、应用程序的优化以及应用算法的调整改进提供科学的指引方向。
目标客户及应用领域:
高性能计算应用开发、性能优化、性能评估等领域,包括:
高性能应用软件开发者;
高性能应用软件优化从业者;
高性能集群项目验收系统性能评估人员;
高性能应用软件的性能评估人员和机构
功能强大
可抓取40余项微架构指标,极大的满足高性能应用调优的需要
支持实时监控集群节点CPU、MEM、Network、IO性能数据,提供集群系统中应用软件随时间变化的运行特征;
支持实时监控集群节点CPU的单、双浮点运算速度GFlops,X87浮点单元速度,SSE单元及AVX单元的实时运算速度;
支持实时监控集群节点CPU的128bit SSE指令向量化率、256bit AVX指令向量化率、节点内内存读、写带宽等数据;
支持实时显示所监控的集群各节点的NFS文件系统的吞吐,以及总NFS吞吐流量;
支持实时监控PCI-E设备与内存间的数据交换带宽。
完善的监控数据管理系统
支持并实现与MySQL数据库完美结合,方便并实现用户对被监测数据的数据库化存储及管理;
支持并提供MySQL数据库数据导出工具,方便并实现用户对数据的处理;
图形化界面易于操作
软件体积小,数据监控及时、精确,系统资源占用率低,即使在系统重负载情况下,天眼对系统资源的需求量也远远不足千分之一,极大程度上保证了所反映的高性能应用程序运行特征的真实性。此外,天眼软件采用了可视化图形界面。通过简单的菜单和鼠标的操作,各项微架构指标的数据会以图表形式呈现,一目了然。这使的大多数用户,不需要复杂的培训也可以轻松上手应用。