Pond: CXL-Based Memory Pooling Systems for Cloud Platforms @ASPLOS22

NUMA模拟器(Bandwidth is an attack argument), XGBOOST无脑allocator,什么垃圾. 一股湾区摸鱼怪的AB Testing 味做实验.

allocator 是hyperv的allocator所以没开源.这东西微软8年前就开始做在azure上了.后来还有smartNIC中间翻译地址啥的做offloading,微软搞pond顺理成章.

对memory预测错,他们在hypervisor层有一个allocation bit 来记录现在的memory 在哪,他们会有另外一套logic来减少panelty.(所谓的QoS monitoring)


他们的future work

  1. 微软肯定搞些CPU co-processor把上述过程硬件化,但是他们能控制hypervisor层软件解决方案也行,但是ML model会co exist within L3 cache.Parameter 越多其实是非常不利的.他们并未开源ML部分的实现,其实仔细看看history 和 untouched memory还是不一样的.
  2. geust OS层page migration 也是要学的.所以不如直接交给TPP(double prediction),但是怎么解偶? FaaS, geust OS自己控制就没这个问题.
  3. memory virtualization why not use Balloon Driver?
  4. No idea to get to the optimal.