ISC22 开会

超算彻底被老美的国家实验室超了,今年的进步在于ABCI GPU连接和AMD MI250。

Optimization and acceleration technologies for massively parallel computing

System Architecture of "ExaFLOPS" Supercomputers

OpenMP OpenACC LLVM collaboration


Completely different models.

Multiple threads can't be accessed Local/Stack variables.

OMP->Cuda

deglobalize+SPMDzation+Loop Oversubscription+No sync at last+Runtime Call specialization


Porting to universal devices



Remote Offloading





HPE







OMPT-based tools





Heterogenous Computing



CERN

他们是需要PB/s的数据写入。



A Subset of the CERN Virtual Machine File System: Fast Delivering of Complex Software Stacks for Supercomputing Resources

讲了CernVM-File System (CVMFS) 。是个全球部署分布式文件系统。通过将软件与操作系统脱钩,帮助各种社区在全球分布式计算基础设施上部署软件。然而,这个文件系统的安装取决于与远程资源的系统管理员的合作,以及从外部来源获取依赖性的HTTP连接。超级计算机提供了巨大的计算能力,通常比网格站点有更多的限制性政策,不容易提供利用CVMFS的强制性条件。已经开发了不同的解决方案来解决这个问题,但它们往往是针对某个科学社区的,并没有处理这个问题的整体性。在本文中,我们提供了一个通用的管道,帮助任何社区在没有外部连接的超级计算机上安装复杂的软件依赖。该方法包括追踪感兴趣的应用程序,建立一个依赖性的子集,在给定的环境中进行测试,并将其部署到远程计算资源中。我们通过在世界顶级超级计算机之一的Mare Nostrum上输出高斯--一个来自LHCb实验的蒙特卡洛模拟程序,用一个真实的使用案例来实验这个提议。我们提供了封装最低限度所需文件的步骤,并提供了一个轻量级和易于更新的CVMFS子集:12.4G,而不是整个LHCb资源库的5.2T。

Intel Accelerated Innovation for a More Sustainable and Open HPC-AI

Intel 吹水大会





后入厂的人就需要做统一的管理系统,OneAPI/XPU Manager都gan这些。