LiteFlow: Towards High-performance Adaptive Neural Networks for Kernel Datapath

datapath:

Untitled

对于相对粗粒度的任务调度问题，用神经网络的方法对性能还没有太大影响，但如果是内核级别的例如进程调度，拥塞控制等，神经网络方法的overhead就是非常需要减少的。

现有的方法，要么程序全部放在用户态，训练和编程比较方便，但是内核态需要调用用户态的程序，造成状态切换会导致很大开销，特别是在例如拥塞控制多个并发数据流的情况；要么程序全部放在内核态，首先内核态基本支持不了NN的训练，因为内核态不能调用用户态的库，要是把NN量化+优化之后放进内核纯做推理，也不能适应变化的数据流环境。虽然不知道数据流特征的更新频率大不大，但我觉得不能适应环境应该是训练不够充分，不是个性化场景的话retraining感觉不用很频繁，例如Nvidia的DLSS就是纯推理的部署，而且从2.0开始就是generalized的，只需要时不时根据新出的游戏更新优化一下。

LiteFlow的workflow是部署一个只作推理的模型snapshot在内核态，然后收集snapshot的输入输出，在用户态batch-wise训练，通过比较用户态模型和内核态snapshot的性能，决定是不是要更新snapshot。

对用户态模型转内核态代码，用的是量化+代码生成的方法，对于一些内核态没办法用的算子（例如tanh）就用类似泰勒级数的方法去近似，所以还要针对不同的函数做近似，非常麻烦。

snapshot更新不是原地的，而是先copy后切换，不需要中断服务。active-standby-switch

Untitled