?“新一代国产E级超级计算系统的十大应用挑战”发布
据介绍,新一代百亿亿次(E级)高性能计算机的研发是国家在下一代信息技术领域的重要部署,将有力带动国家信息技术产业的创新发展,自主化程度远高于其他超算平台。同时规模和性能都有很大提升。十大应用挑战发布的目的是充分发挥新一代E级高性能计算机的强大计算能力,开发适应国产超算系统的关键技术和应用软件,构建国产E级超算应用新生态。
挑战1:磁约束聚变堆全装置聚变模拟(人造小太阳)
可控聚变能被认为是未来应对能源和环境挑战的最有效手段之一。在磁约束聚变装置的设计中,最重要的问题是如何以较低的成本约束较高密度和温度的等离子体。
目前,人们普遍认为限制约束性能的主要机制之一是边界和核心产生的所谓微观不稳定性。在以前的研究中,由于多时间尺度问题,这些不稳定性通常用回旋动力学或磁流体动力学等简化模型来描述,等离子体核心和边界需要分别建模。
在新一代国产E级计算机上,将有可能利用经典等离子体的基本模型,以离子回旋半径的分辨率直接模拟磁约束聚变堆整个装置的等离子体,而不必区分边界和堆芯。借助几何算法,可以保证系统长期演化模拟结果的可靠性,更准确一致地再现其内部发生的不稳定过程,寻求磁约束聚变装置提高约束性能的机制。
此外,整个装置的等离子体动力学模拟还可以获得更加真实的装置尺度的等离子体演化模型,这将更好地指导未来磁约束聚变堆的等离子体设计,为受控聚变研究和聚变能源开发提供有力支持。
挑战2:十亿网格上全尺寸航天飞行器的计算流体动力学模拟
近年来,临近空间飞行器复杂流动问题的数值研究对理解高空高速流动机理发挥了重要作用。临近空间飞行器的飞行包线覆盖连续盆地、滑动盆地和过渡盆地,存在气动热、稀薄非平衡效应、高动压下多体分离、化学反应和等离子体等复杂的非定常多场耦合现象。
上一代超级计算机在计算能力和架构设计上无法模拟跨流域满足精度和效率要求的临近空间飞行器非定常多场耦合,但新一代国产E级超级计算机有望在理论上突破计算瓶颈,从而实现超百亿网格的高精度全尺度仿真。
一方面,开展跨流域临近空间飞行器非定常多场耦合仿真研究,可以帮助我们全面认识飞行器在高空高速飞行状态下复杂的耦合流动现象,识别流动机理及其对飞行器的影响。另一方面,可以拓展在新一代超级计算机上构建数值风洞的能力,为各种航天运载火箭和国产大飞机的设计提供载体,从而更好地服务于我国的战略发展和建设。
挑战三:数字细胞超亿级原子系统的动态模拟
在了解生命奥秘,尤其是细胞的生物机制方面,全原子分子动力学模拟的虚拟实验作用日益突出。
细胞内充满了各种生物大分子和小分子,始终处于动态拥挤环境中,拥挤环境会对生物分子的扩散、聚集、构象变化和化学反应产生重大影响。因此,它将是在细胞尺度上模拟生物系统整体原子分子动力学的重要手段,但目前的计算机难以提供足够的计算能力来实现。
中国制造的新一代E级超级计算机,理论上可以实现数十亿或数十亿个原子的数字细胞的分子动力学模拟,这使得未来在细胞层面进行精确模拟成为可能。细胞的全原子分子动力学模拟将使我们能够在虚拟实验中以高时空分辨率观察整个细胞及其生物大分子内外的微观动力学过程,帮助我们全面、深刻地理解新冠肺炎等人如何侵入细胞、细胞如何交换物质信息等生命科学的重要挑战。
通过数字模拟获得的知识也将在未来的新药研发和保护生命健康方面发挥基础性作用。
挑战4:对流尺度下的亚千米精细数值天气预报。
规模小、发展快的强对流天气系统往往难以预测,容易造成破坏性灾害,对大城市的运行管理构成极大威胁。
随着天气系统时空尺度的缩小,大气的混沌性越来越明显,预报的不确定性加剧,给精细化天气预报带来巨大挑战。目前基于检测技术的预警时效性和对系统演化的预测往往不足。
基于新一代国产E级超级计算机强大的计算能力,通过集成超高分辨率模拟、集合预报和快速环流技术,提前0-6小时预测强对流天气的触发、演变和消亡,为单个对流系统提供连续和概率预测,提高强对流引起的局地强降水、冰雹、突发性大风和龙卷风的预测精度。
挑战五:用百亿级高效高通筛选虚拟药物。
先导结构的发现和优化作为新药发现阶段的研究核心,往往需要数年时间和数亿美元,是药物研发的关键技术瓶颈。因此,如何生成新的分子和优化分子的关键性质(如生物活性、药物形成、安全性和选择性)是影响药物分子设计成败的两个关键问题。
估计可用的化学空间范围为10 23 ~ 10 60,部分成熟数据库中的小分子数量达到十亿。如何在如此巨大的化学空间中智能生成分子,搜索结构的快速进化,预测其性质,是药物筛选的巨大挑战。
目前药物筛选通常可以使用分子对接等相对粗糙的方法。之前的超级计算机可以快速筛选出几十亿的小分子,然后用更精确的自由能微扰计算等方法进行更精确的评估分析。
新一代E级超级计算机提供的强大计算能力,可以支持数百亿个药物小分子的快速筛选,配合更先进的算法,可以将虚拟药物筛选的效率提高几十倍甚至上百倍。同时,高效的药物筛选也可以与中药有效成分的发现相结合,促进中药研发的现代化。
挑战六:通用人工智能超大规模预训练模型
深度神经网络是新一代人工智能的先导领域,已成功应用于计算机视觉和自然语言处理,并取得了突出的成果。
随着应用场景的丰富和发展,传统的基于标记数据集的领域模型训练和应用范式越来越不适应人工智能应用的发展和普及。综合能力好、通用能力强的基于未标记数据和大规模预训练模型的自监督学习技术的出现,将数据驱动的深度学习技术和通用人工智能推向了一个新的发展阶段。
近年来,计算机和人工智能领域的专家和企业在现有高性能计算机上完成了1.75万亿参数的多模态预训练模型的开发,新一代E级超级计算机使支持参数更大、通用性更强(超过10万亿甚至10万亿)的模型的训练和应用成为可能。
大规模预训练模型的开发和部署,一方面将加速人形机器人的落地;另一方面,拥有通用模型作为基础,将大大降低细分领域数据转化为智能模型的难度,有效推动人工智能应用基础设施建设,提升智能社会的产业现代化、数字经济发展、数字治理能力。
挑战7:快速超大规模观测数据的高分辨率巡天图像处理
测量天空中的中性氢是500米口径球面射电望远镜(FAST)的重要科学目标之一。通过探测哈勃体积中中性氢的分布,为宇宙起源与演化、暗物质、暗能量等前沿科学领域的研究提供支持。
受视场限制,望远镜一次只能覆盖有限的天空区域,中性氢巡天可以持续数年。积累的观测数据需要进行拼接融合,才能获得完整的高分辨率勘测图像。在中性氢测量数据处理过程中,网格化是计算最密集和I/O最密集的环节,是制约中性氢测量数据处理和结果输出效率的瓶颈。
新一代E级超级计算机的数据处理能力,结合高性能网格算法,可以应对PB级中性氢巡天观测数据,从而为国家重量级五百米口径球面射电望远镜(FAST)“早出成果、多出成果、出大成果、出好成果”提供强大助力,推动天文学基础和前沿领域的重大发现。
挑战8:全球地震全波形反演
地震全波形反演是目前分辨率最高的成像方法,是研究地球内部结构和动态演化的有力工具,也可以为矿产资源和油气勘探提供关键支撑。
近十年来,地震科学领域的专家在上一代超级计算机上实现了区域尺度的低频弹性波全波形反演。
中国制造的新一代E级超级计算机将能够在全球范围内研究高频段粘弹性地震波场的传播模拟和波形成像,包括地震波衰减特性。全球尺度高频粘弹性地震波形反演一方面可以获得地球内部的高精度成像结果,加深我们对板块构造、俯冲带和造山带形成演化的认识,另一方面可以提供地球内部各圈层(中下地壳、岩石圈、软流圈等)物质和能量交换的地震学证据。),为研究地球深部成矿和火山/地震活动提供依据,帮助人类更全面地认识地质演化,了解类地行星的形成和发展。
挑战九:全脑千亿神经元动力学模拟
近年来,神经科学研究获得了大量关于大脑结构和活动的数据,以了解大脑的工作机制。对于运动控制、思维等大脑高级功能的分析和再现,迫切需要建立人脑规模的模拟神经网络平台。
人脑中有860亿个神经元。过去十年,计算神经科学领域的专家模拟了上一代超级计算机的脑回路。新一代E级超级计算机理论上可以模拟包括大脑皮层、小脑、基底神经节在内的全脑回路。
一方面,对人类全脑回路的模拟和研究可以帮助我们了解大脑思维的高级功能,开发类脑人工智能算法。另一方面,帕金森病和亨廷顿舞蹈症等脑部疾病的发病机制将得到进一步的分析和验证。此外,利用模拟大脑模型构建基于脉冲神经网络的神经模态机器人,可以提高现有机器人系统的感知和决策水平。
挑战10:全分辨率全球中尺度海洋数值模拟
气候变化是全球可持续发展的重大挑战,也是科学界面临的最具挑战性的科学问题之一。海洋是控制气候系统季节内、季节、年际和年代际变化的重要组成部分。
近年来,随着海洋观测的快速发展,海洋中尺度和亚中尺度过程的许多机制不断被揭示,海洋多尺度相互作用的特征更加清晰,这也对海洋环流的数值模拟提出了更高的要求。分辨率中尺度和次中尺度过程及其与大气的相互作用已成为重要的研究方向。
10年来,世界各国科学家在这个方向上不懈努力,将全球海洋模拟提高到了部分分辨率亚中尺度涡旋(2km)的分辨率,而中国科学家自主研发了3-5km的全球海洋模式,基本上可以完全区分开阔洋的中尺度过程。新一代E级超级计算机可以全分辨率模拟中尺度过程,帮助科学家全面认识海洋中的多尺度相互作用过程和海洋能量的级联过程,进一步提高海洋环流和整个气候系统的模拟能力。
编辑/范辉