竞相研发E级超算
美国橡树岭国家实验室正在紧锣密鼓地研制超级计算机“尖峰(Summit)”。美国能源部希望在其2018年问世之日,这台投资2.8亿美元的超级“怪兽”能助美国夺回超算界“扛把子”的头衔。“尖峰”的运算速度被设计为每秒进行20亿亿次浮点运算,比目前世界上运行速度最快的计算机还快60%。
但对于喜欢“得陇望蜀”的计算机科学家来说,“尖峰”是他们的“陇右”,速度为其5倍的百亿亿次超算(也被称为E级超算,被公认是“超算界的下一顶皇冠”)才是他们的“西蜀”,这意味着他们需要把现有最高计算性能提高10倍以上。
目前,全球有多个国家正竞相研发E级超算。中国计划于2020年推出首台E级超算;美国能源部启动了“百亿亿次计算项目(Exascale Computing Project)”,希望于2021年至少交付一台E级超算,其中一台的名字为“极光(Aurora)”。据悉,美国在下一代超算技术方面的研发总投入将达到4.3亿多美元,用美国能源部部长里克·佩里的话说,这些资金就是剑指“下阶段研发百亿亿次系统的全球竞赛”。此外,欧盟预计于2022年—2023年交付首台E级超算;日本发展E级超算的“旗舰2020计划”由日本理化所主导,完成时间也设定在2020年。
超算之所以广受关注,一方面是因为它体现了各国的综合国力和科技创新能力;另一方面也在于它强大的能力。科学家估计,E级超算将在气候科学、可再生能源、基因组学、天体物理学、军事以及人工智能等领域大显身手,帮助他们解决目前无法解决的难题,比如,以更高的空间清晰度模拟全球气候变化、模拟宇宙演化及核试验等。
降低能耗是大挑战
但理想很丰满,现实很骨感,要想研制出E级超算,科学家面临着极大的挑战,功耗过高首当其冲。随着速度和性能要求不断提高,如果按现有设计方法,通过不断增加处理器数量来研制超算,其体型和规模会越来越大,数据在存储器和处理器之间进出所耗费的功率会越来越多。有人甚至预测,超算90%的功率将被用于数据输送。
有科学家已对此提出警告。2008年,美国能源部高级研究计划局(DAPRA)计算机科学家皮特·寇格领导的团队发布报告称,“功率是E级超算面临的最大问题”,以现有技术研制出的E级超算功率可能高达千兆瓦,需要一个专门的核电站来给它供电,这样的超算显然没有太大实用价值。
随着技术的不断进步,2015年,寇格将功率估算值降到180兆瓦至425兆瓦之间,但这仍然远超目前超算界龙头、中国“神威·太湖之光”15兆瓦的功率。
美国阿贡国家实验室计算、环境和生命科学实验室负责人皮克·斯蒂芬斯表示,目前很多科学家致力于降低超算的功率,最近几年涌现出了一批新兴技术,比如,让存储器更接近计算器,减少数据行进的距离;让高性能存储器向三维扩展而不是朝二维延伸;超算与闪存结合;在芯片不使用时关闭其中的电路;改变电压或频率等来节省功率等。
需要革命性的方式
科学家表示,除了上述技术之外,要真正降低能耗,需要制造工艺上出现革命性的突破。英特尔微处理器技术实验室原主管谢卡尔·博卡说:“渐进式的方法将不再管用,我们需要革命式的方法。”
据悉,中国首套E级超算系统的功率将不超过30兆瓦;法国可替代能源和原子能组织高性能计算专家简-菲利普·诺米尼介绍称,欧洲致力于将首套超算系统的功率保持在10兆瓦以内。
美国“极光”的功率被设计为40兆瓦,绝对最大功率为60兆瓦。英特尔公司目前正为其研制芯片,尽管相关细节仍未知,但英特尔公司高性能和百亿亿次计算首席架构师阿尔·加拉表示,公司目前正在开发一个新平台,包括新的芯片微体系结构等。而中国中科曙光目前正在研制的E级超算模型可能会采用与此前超算不同的方式。
《自然》的报道指出,美国也有专家认为,应该反思超算的发展方向,改变追求峰值运算速度的模式,而注重实用价值。Top500榜单创始人、田纳西大学计算机科学家杰克·东格拉就称:“速度并不意味着一切。尽管汽车达到300公里/小时的速度让人惊叹,但大多数汽车的真正价值在于,在日常限速范围内安全可靠地行驶。”
此外,研究人员也在思考未来十年如何超越E级超算,研制出速度更快且性能更佳的超算。他们认为,下下一代超算可能需要采用一些目前“小荷才露尖尖角”的技术,包括能模拟大脑内神经元操作的神经形态电路或量子计算等