计算奇迹 “亿阶线性方程组”被攻破

  3. 首次实现Krylov子空间算法的MIC加速

  由于系统开采用了一种Krylov子空间算法,大量的全局集合通信不可避免,使得算法的天然并行性不是十分良好,这是由算法自身决定的。在不改变算法本质思想的前提下,对算法结构做了调整,并成功隐藏了集合通信时间。首次将此算法成功移植到CPU+MIC异构集群平台上。

  超大规模线性方程组高性能求解系统开发完成后,太原理工大学工程数值计算团队在 “局部径向基函数配点法(Local RBSs colloction methods)求解高维偏微分方程”课题中使用该软件,仅利用3个计算节点(每个节点内配置2*Intel Xeon E5-2650 v2+2*Intel Xeon Phi 7120P),在20秒之内完成了7维问题线性方程组的求解,4分钟之内完成了8维问题线性方程组(亿阶规模)的求解,而原有的求解工具最多只能完成6维问题的求解。这一突破大大加速了太原理工大学工程数值计算团队对更高维度未知世界探索的脚步。

  据了解,国内在大规模线型方程组高性能求解系统的开发中一般求解规模在百万阶量级,对于亿阶规模矩阵的求解鲜有尝试。同时,国内外目前在大规模线型方程组高性能求解系统中一般采用的是CPU+GPU异构架构,本次浪潮是将大规模线型方程组算法首次成功移植到CPU+MIC异构集群平台上。