流程: Agent每隔一段时间做一次决策。 在一个时间片中, cache接受一系列请求, 然后在发生miss的视频集中选择频率最高的前k个视频,与cache中的视频一起, 提取这些视频的特征 将这些特征输入到SAC中,根据概率选择cache_capacity个数据保留在cache中。