文章目录[隐藏]
超算彻底被老美的国家实验室超了,今年的进步在于ABCI GPU连接和AMD MI250。
Optimization and acceleration technologies for massively parallel computing
System Architecture of "ExaFLOPS" Supercomputers
OpenMP OpenACC LLVM collaboration
Completely different models.
Multiple threads can't be accessed Local/Stack variables.
OMP->Cuda
deglobalize+SPMDzation+Loop Oversubscription+No sync at last+Runtime Call specialization
Porting to universal devices
Remote Offloading
HPE
OMPT-based tools
Heterogenous Computing
CERN
他们是需要PB/s的数据写入。
A Subset of the CERN Virtual Machine File System: Fast Delivering of Complex Software Stacks for Supercomputing Resources
讲了CernVM-File System (CVMFS) 。是个全球部署分布式文件系统。通过将软件与操作系统脱钩,帮助各种社区在全球分布式计算基础设施上部署软件。然而,这个文件系统的安装取决于与远程资源的系统管理员的合作,以及从外部来源获取依赖性的HTTP连接。超级计算机提供了巨大的计算能力,通常比网格站点有更多的限制性政策,不容易提供利用CVMFS的强制性条件。已经开发了不同的解决方案来解决这个问题,但它们往往是针对某个科学社区的,并没有处理这个问题的整体性。在本文中,我们提供了一个通用的管道,帮助任何社区在没有外部连接的超级计算机上安装复杂的软件依赖。该方法包括追踪感兴趣的应用程序,建立一个依赖性的子集,在给定的环境中进行测试,并将其部署到远程计算资源中。我们通过在世界顶级超级计算机之一的Mare Nostrum上输出高斯--一个来自LHCb实验的蒙特卡洛模拟程序,用一个真实的使用案例来实验这个提议。我们提供了封装最低限度所需文件的步骤,并提供了一个轻量级和易于更新的CVMFS子集:12.4G,而不是整个LHCb资源库的5.2T。
Intel Accelerated Innovation for a More Sustainable and Open HPC-AI
Intel 吹水大会
后入厂的人就需要做统一的管理系统,OneAPI/XPU Manager都gan这些。