首页 >>年度报告 >>2010年度报告 >>第二部分 国家自然科学基金项目成果巡礼


—— 第二部分 国家自然科学基金项目成果巡礼 ——


千万亿次高性能计算机研制取得突出成果

  千万亿次高性能计算是21世纪初期国际高性能计算领域的战略制高点,对满足核模拟、气象预报、材料分析、新药设计等重要应用领域巨大的计算需求具有十分重大的意义。国防科技大学杨学军教授带领研究团队,面向国家千万亿次高性能计算需求,在国家自然科学基金创新研究群体科学基金项目“千万亿次高性能计算机的关键技术”的资助下,围绕基于流计算体系结构的高性能科学计算开展研究,取得了一系列突出成果。

  (1)流计算体系结构是面向流媒体处理而提出的一种高性能计算体系结构,是否适用于科学计算是其能否用于千万亿次高性能计算机设计的首要问题。杨学军等人首次给出了科学计算应用程序可流化的6个判定条件,建立了循环可流化理论,从理论上系统地回答了流计算用于科学计算的条件,设计了国际上第一款可加速典型科学计算应用的64位流处理器,在国际上首次实践验证了流计算对大规模科学工程计算的适用性问题,探索出CPU和流处理器相结合而构建千万亿次计算机系统的有效途径。相关研究成果发表在计算机体系结构领域国际顶级会议ISCA 2007和国际权威期刊IEEE Transactions on Parallel and Distributed Systems上。在ISCA 2007会议上发表的关于流计算用于科学计算的成果是该会议十年来录取的第一篇来自中国研究机构、由中国学者独立完成的学术成果。IEEE Fellow、IAPR Fellow、IETE Fellow、国际著名学者Venue Govindaraju在计算机体系结构领域权威会议MICRO 2008上发表的文章引用了该成果。他们总结了各种应用驱动的前瞻性体系结构,认为“杨学军等提出了一种面向科学计算应用的可扩展的流处理器”。NVIDIA公司首席科学家、原美国Stanford大学计算机系主任Bill Dally评价该成果“是世界上首个实现的用于科学计算的流处理器”。

  (2)围绕如何让流处理器在科学计算应用中发挥高性能的问题,杨学军等人首次提出了发现流相干图的最优或接近最优的图染色算法,该算法使得编译器可以在多项式时间内找到最优染色解。建立了流复用模型,并采用编译存储优化技术,开发数据流之间的复用,释放了流处理器的强大计算能力,获得1.14~2.54的性能加速比。相关研究成果发表在计算机体系结构领域国际顶级会议PPoPP 2009、PACT 2008和国际权威期刊ACM Transactions on Architecture and Code Optimization上。审稿专家高度评价了相关成果,认为“这是将向量寄存器分配和标量替换用于流处理器寄存器分配的一项重要而有趣的成果”。

  (3)围绕CPU和基于流处理器体系结构的商用微处理器芯片GPU构成的大规模异构并行系统的编程、可靠性和功耗问题,他们设计实现了支持CPU和GPU混合的编程语言和编译环境OpenStream,统一了异构系统的编程风格,大大简化了异构程序的编写与移植;提出了基于并行复算的容错新方法、基于数据流的并行程序检查点分析方法和基于编译指导命令的异构系统容错技术,提高了大规模CPU-GPU异构并行系统的可靠性;设计了编译级GPU低功耗优化技术,降低了异构系统的功耗。相关成果被国际顶级会议PACT 2007和权威期刊IEEE Transactions on Parallel and Distributed Systems、《中国科学》、《软件学报》等录用和发表。其中,并行容错算法的研究成果是PACT会议自1993年创办以来首次录用由中国大陆科研单位独立完成的学术成果论文,3个评审专家给出4、4、5的高分(5分制),并有1人推荐参评大会优秀论文(Best paper)。

  上述研究成果为构建大规模CPU-GPU异构并行系统奠定了理论基础,为国防科技大学研制成功“天河一号”千万亿次超级计算机系统发挥了决定性作用。2010年11月“天河一号A”在世界Top500中排名第一,标志着我国自主研制高性能计算机的综合技术水平进入世界领先行列。

 

版权所有:国家自然科学基金委员会 京ICP备05002826号
Copyright 2005 NSFC, All Right Reserved