180 likes | 405 Views
中国科协青年科学家论坛 “工程 CAE 软件平台开发中的关键技术” 2010 年 11 月 17-19 日 湖南大学. 关于实现我国科学与工程数值软件的突破性发展的一点想法. 田 荣 中国科学院计算技术研究所 高性能计算机研发中心 大规模数值模拟与应用软件组 ( 软硬件 co-design). 中国高性能计算的现状. 硬件高性能 2007 年“曙光 4000A” Top10 2008 年“曙光 5000A” Top10 2009 年“天河 -1” Top5 (2.4 万计算核 ) 2010 年 5 月“曙光星云” Top2 (12 万计算核 )
E N D
中国科协青年科学家论坛 “工程CAE软件平台开发中的关键技术” 2010年11月17-19日 湖南大学 关于实现我国科学与工程数值软件的突破性发展的一点想法 田 荣 中国科学院计算技术研究所 高性能计算机研发中心 大规模数值模拟与应用软件组 (软硬件co-design)
中国高性能计算的现状 硬件高性能 2007年“曙光4000A” Top10 2008年“曙光5000A” Top10 2009年“天河-1” Top5 (2.4万计算核) 2010年5月“曙光星云” Top2 (12万计算核) 2010年11月 “天河-1A” Top1 (22万计算核) 应用低水平 据上海超级计算中心2009年统计:我国60%的HPC应用为16处理器核以下的规模
观点摘要 • 奥巴马总统:“中国有比我们更好的铁路系统。” “我们还刚刚获悉,中国目前已经拥有世界上最快的超级计算机。” • 温总理(视察天河一号时):“超级计算机已经应用在制造、石油、生物科学、金融等领域,但这还不够,希望你们继续努力,摆在我们面前的,就是要把这个大型的计算机应用好…” • 美国NCCS计算科学中心的作业规模…基本都是5~10万个 CPU同时运行,而我国每天最多只有几百或上千个CPU同时运行。“并非我们硬件比人家差几百倍,而是我们在高性能计算的软件方面非常落后,并行计算能力还很差。” • “…我国的超算中心只能去购买发达国家的商业软件,有些专用软件的价格非常昂贵,甚至比建一个硬件平台还要贵…还有由于国外出口政策的限制,即使有钱也买不到。”
机遇 • 中国超级计算能力的飞速发展已经引起世界的瞩目,但目前,我国大规模并行数值模拟高端软件严重不足 • 加快发展科学与工程数值软件已越来越成为人们的强烈共识
凤凰网调查也显示:工业与工程数值软件被认为是中国最新超级计算机应优先应用的领域凤凰网调查也显示:工业与工程数值软件被认为是中国最新超级计算机应优先应用的领域
如何发展工业与工程软件? • 工业与工程数值软件的成功发展,无法回避在市场中的定位问题 • 在最终决定软件生死存亡的市场上,国际竞争者已(远远)走在我们前面,前进的速度还不比我们慢。我们该如何才能实现超越,我们的突破口在那里? • “走什么样的发展路线,如何实现突破?”是关键问题
关于计算技术的发展 • 在过去的几十年里,CPU速度的发展一直遵循着摩尔定律,我们的应用代码会随着处理器频率的提高而自然地变快。然而,这一发展趋势由于处理器在性能提高上受到功耗问题,散热问题,针脚等物理限制已不复存在了。处理器性能的提高将不再单一依赖时钟频率的提高,而是要发挥并行性。 • 由于并行编程的复杂性,这种体系结构上的变化将极大地改变科学与工程计算实践。比如如何在众核上实现计算的有效加速,特别是有限元计算这种典型的访存密集型计算?如何面对千万亿(1015flops/s)次计算的挑战?这些新问题正在引发人们的关注和思考。
认识1:P级计算时代 = 新起点 • 以20%的并行效率估计,千万亿次级应用的并行度要达到20万以上的计算核。到目前为止,没有程序可扩展到这个规模。 • 如何发挥千万亿次级的计算能力是一个全新的课题 • 计算技术上的历史性转折让我们与国际同行又重新站在同一个起点上
认识2:P级计算软件的独特性 • 物理学特点:高分辨率全尺度全物理。这也是“预言性”数值模拟的物理学基础。待求问题的物理学特点的改变导致计算算法的改变,SPMDMPMD (例如:LINPACK测试可能越来越偏离实际应用特点) • 海量并行:发挥1P实际运算速度,按目前的系统估算,需要约20万核的并行度;PC机时代诞生的数值软件架构越来越不能适应海量并行计算的要求 • 高可扩展:目前商用CAE软件的可扩展性:固体计算一般在几十核规模,流体计算一般在几百核的规模。 • 必须容错:千万亿次超级计算机系统平均无故障运行时间将缩短到以几小时计。只有容错的程序才能完成计算。程序算法设计必须假设计算节点出错为常态,这是在过去软件开发中不曾考虑的问题。
技术突破口? • 数值算法不是软件成功的充分条件:回顾PC机时代发展起来的有限元CAE软件的发展历史,可以说决定最后胜出的并不是在某些有限元算法(诸如单元技术,求解方法等)上的突破,因为这些数值方法总是可以共享互通的(除非不公开发表和专利保护)。而决定一个数值软件在市场上能否取得成功往往是其优秀的软件架构和它的前瞻性和开放性。
技术突破口? • 面向未来,支持海量并行是关键:大多PC机时代诞生的数值模拟软件,其架构越来越不能适应海量并行计算的要求。设计、诞生于7、80年代的现有商业软件很有可能必须重新设计其架构以应对未来的计算需求 • 我国世界水准的超级计算机是基础和我们的优势所在 • 突破口:以高性能计算技术为支撑,在计算规模(精度和分辨率)上,突破现有国外软件的上限
关键共性技术? • 负载平衡可容错的统一并行架构 • 计算向备份数据转移的容错策略 • 面向性能与功耗的混合精度计算 • 少通讯算法和面向众核的计算密集型算法 • 共性应用算法与硬件co-design • XPU加速器
发展模式? • 美国:国立计算科学中心www.nccs.gov (2004年) • 日本:计算科学先进研究所(2010年7月) • 欧洲:PRACE项目“single site gathering the national and international players focused on numerical simulation and HPC”(2010年7月) • 面向E级计算的交叉整合模式:并行计算机、算法、软件与应用目标四方面的紧密结合 • 例如,算法-硬件的co-design技术,面向特定应用的XPU加速器等
关于核心数值技术? 韧 果冻,肌肉 (Mesh distortion Remeshing) 钢(工业粮食) 硬 软 豆腐,脑 (Remeshing) 粉笔,骨 (Remeshing) 脆 FEM多应用于第一象限的固体力学问题 Courtesy of S. Koshizuka, 2004 宜针对其他三个象限问题,采用能够对FEM技术形成补充的新兴“成熟”数值技术
the exact CLMM 技术趋势:有限元高效率和局部无网格灵活性的自然结合 例:可移动自然协调型局部无网格方法 [1] R. Tian, A.C. To, W.K. Liu. IJNME 2010 [2] ICCM 2010 Green pts: free points Red pts: FE mesh Displacement Strain
技术方向定位? • 加强应用数值算法-系统硬件的co-design • 以粒子/局部无网格技术为补充,以超大规模计算(模拟精度、分辨率等)为突破口
结论 • 我们高性能计算现状:硬件高性能-应用低水平。发展高性能应用软件,发挥机器的效能是人们对高性能计算下一个10年的自然期盼。 • 计算技术上的历史性转折是机遇;支持海量并行是关键。 • 与现有数值模拟技术相比,突破计算规模上限可能是我们在市场上立足的一个突破口。 • 加强机器、算法、软件与应用目标的紧密结合,发展算法-硬件的co-design(加速)技术。