AMD云计算的自我实践
当前,云计算已经不仅仅是人们热议的话题,而且已经得到越来越多的应用。作为全球领先的半导体厂商,AMD公司拥有业界领先的APU、CPU和GPU的技术与产品,能够提供从云服务器到云终端的全线产品解决方案。另一方面,AMD在云计算的部署方面身先士卒。AMD创建了一个私有云,以此来提高自身的生产力,改善的资源的获取能力,节省相关的成本,以及保持在业界创新者的地位。其在云计算方面的自我实践很具有借鉴意义。
AMD是一家拥有创新传统的半导体设计公司,它的各种创新技术打造了现代计算的新面目。随着云计算的兴起,AMD再度担当了技术领导者的角色,引领着新一代高能效多核处理器的技术潮流,正在为全世界的云计算部署奠定基石。
AMD面临复杂性挑战
设计半导体是一项复杂的工程任务,需要耗费巨大的计算能力。对于AMD来说,这种计算能力必须能被遍及全球、多学科的AMD 工程师轻松、充分地获取。为此,AMD曾构建众多系统集群来满足计算能力需求,包括部署超过15,000 台服务器。这些服务器上安装着版本多样的操作系统与文件系统,以及千差万别的存储管理与集群软件。随着每年基础设施规模扩大20-30%, 软硬件升级几乎时刻不能停顿。
然而,“复杂性”的挑战还不止于硬件的操作系统。数据的管理与迁移同样问题重重。由于设施遍布全球并且互不相连,AMD不得不在各站点之间复制大型数据集。因此,在一个给定地点建立起可用的项目数据,可能需要花费数周时间。
项目一旦开展起来,还会遇到新的障碍。测试半导体设计,需要获取成千上万个计算核心。然而,为了避免资源浪费,任何一个AMD设施都不会过度配置。为了完成测试并符合AMD严格的产品标准,工程师们不得不见缝插针地安排时间,排队等待在可用的机器上运行测试。一方面,AMD 所拥有的服务器总数超出所需,另一方面,哪怕在很短时间内,将充足的计算能力转向某个特定项目组,都很难做到。简言之,AMD已具备巨大的计算能力,但无法满足灵活性、可管理性、可获取性、成本效率的要求。