本帖最后由 cantjie 于 2023-3-9 08:47 编辑
本文内容是SIGCOMM2022年的一篇论文的内容总结概括,原文链接为:https://dl.acm.org/doi/abs/10.1145/3544216.3544219【图片虽然带着知乎水印,但也是自己的,不是未经授权的转载哈】
本文通过快手APP直播业务,测量了国内5G网络,特别是独立组网SA 5G网络的带宽、延迟、可靠性等的表现,并从端到端、无线接入网和核心网进行分析,最后提出了一种5G感知的视频缓存优化策略,帮助观众降低卡顿时长。
1. 背景与挑战既然是通信人论坛,背景就不用怎么提了,简单来说就是:(学术界)已有的很多测量工作都是在5G部署早期阶段进行的,主要集中在NSA 5G上,SA 5G的具体表现还有待测量验证。
因此,这篇文章与先前的工作不同之处便在于:1)从内容提供商视角出发进行测量和优化;2)包含并着重关注了SA 5G的表现。 大家使用快手的众包直播服务来测量 5G 网络。 上图的下半部分分别画出了视频流所经历的接入网、核心网和互联网部分。
这种测量提出了许多挑战。 第一个挑战来自庞大复杂的在线系统本身。 它引入了如此多的性能指标和条件因素,应该仔细考虑才能使比较公平和结果具有说服力。 此外,数据收集可能对 QoE 产生的任何轻微负面影响都会影响大量用户,因此应该避免。 第二个挑战来自系统中的黑盒。 不仅来自多个供应商的CDN通常作为黑盒工作,而且核心网络的配置也很少向公众开放。 2. 测量方法测量包括两部分:被动部分和主动部分。 在被动部分,大家让用户每隔10秒将四种信息记录到日志中,并定期上传日志。 大家一年总共收集了超过一百 TB 的原始日志,并且很大一部分用户报告了 SA 5G 中的日志。 大家有超过一点七万亿的日志,其中国足球协会超级联赛过 130 亿来自 SA 5G。 在2020年12月至2021年11月的采集过程中,对于5G设备用户,SA 5G日志占比从4%上升到25%以上。 那是六十多倍的增长。
在主动部分,大家使用 traceroute 命令。 大家首先选择大约 500 万最活跃的 5G 用户,然后分配 traceroute 任务。 当时在线的人将对选定的四个域名实行traceroute并报告结果。 注意,在中国,核心网很少响应traceroute请求。 因此,大家忽略了内部组件,仅通过第一个互联网跃点来估计核心网络中的网关。
3. 测量结果论文中的Measurement Results分为端到端、接入网和核心网三个部分。这里大家重新整理结果,给出结果的另一种看法(见图中左侧小目录)。 5G 的一个关键承诺是减少延迟。 因此,大家首先检查连接建立延迟,这是启动延迟的重要组成部分。 大家发现,与 4G 相比,NSA 和 SA 5G 都减少了延迟。 SA 5G甚至可以和Wi-Fi相媲美,比NSA和4G好很多。
此外,大家检查了从主播到观众的整个传输过程,这对交互体验也很关键。 大家发现,与使用 4G 的用户和观众相比,任何一方使用 SA 5G 都会导致更低的延迟。
此外,在使用 4G 和使用 SA 5G 之间进行比较,大家发现没有转码的流(减少 600 毫秒)可以从 SA 5G 中获益更多(与转码的流相比:减少 237 毫秒)。 简而言之,原因是经过转码的流在互联网上的传播距离比没有转码的流更长。 因此,可以得出结论,SA 5G更多地受益于分布式系统。 这与大家的预期一致:更长的互联网传输距离将削弱 SA 5G 相对于 4G 的优势。
大家并没有就此止步。 大家进一步好奇 5G 的新结构如何有助于降低延迟。 因此,大家使用 traceroute 结果来回答这两个问题。 SA 5G 中的用户是否更接近互联网? 靠近互联网是否有助于减少 RTT? 对于第一个问题,大家找到了肯定的答案。 请注意,肯定的答案并不意味着用户迁移到大都市或放置服务器的地方。 这意味着核心网和互联网之间的网关更靠近 SA 5G 用户。 对于第二个问题,大家发现它取决于网关的路由策略。 为了回答第二个问题,大家定义了两个城市级别的距离。 即用户到网关的距离,以及网关到服务器的距离。 然后,大家看看RTT和这两个距离的关系。 对于给定的总距离间隔,大家使用线性回归来获得 RTT 与用户网关和网关服务器距离之间的斜率。
类似地,大家计算不同总距离间隔和ISP的结果。 大家发现,对于SA 5G,当总距离在三百公里以上时,RTT均与用户-网关距离负相关,而与网关-服务器距离正相关。 然而,4G 几乎显示出完全相反的关系。 这表明,在 SA 5G 中,将具有远程目的地的流量路由到本地互联网可能不是一个好主意。 相反,一个好的选择可能是将具有本地目标的流量路由到本地互联网(红线),同时将具有远程目标的流量路由到上层 UPF 以减少网关与服务器的距离(紫线)。
增强的可靠性是 5G 的另一个关键承诺,也与用户感知的卡顿情况高度相关。 大家发现 NSA 5G 和 4G 的性能差不多,而 SA 5G 比它们好很多。 这是因为可靠性更多地与控制平面相关。 因此,NSA 5G 和 4G 具有相似的性能,因为它们使用相同的 4G 控制平面,而 SA 5G 使用 5G 控制平面。
大家知道,handover,即用户移动导致服务基站发生变化,会造成可靠性下降。 因此,大家检查切换前后的卡顿频率。 大家首先发现,就在handover之前,卡顿频率已经高于全局平均水平。 这是因为用户通常在小区边缘获得更差的服务质量。 此外,大家发现大多数handover会马上增加卡顿频率。 因此,大家按百分比计算切换后的频率增加。 对于表示网络类型变化的垂直handover,NSA 5G 和 4G 之间的垂直handover对卡顿频率的增加最小,而涉及 SA 5G 的垂直handover则对卡顿影响最严重。对于水平handover,即在网络类型没有变化时。 SA 5G 增加缓冲频率最小,而 NSA 5G 最严重。 所以,大家说SA 5G对水平handover的容忍度更高。
大家还测量了5G的下载速度。 大家发现虽然SA 5G的下载速度远高于4G,但其下载速度在过去一年有所下降。 一个可能的原因是用户数量的增加。 大家从无线接入网的角度验证了这一点:大家发现随着接入密度的增加,SA 5G 的下载速度比 4G 下降得更快。
能耗是 5G 的另一个关键 QoE 问题。 大家使用用户可直接感知的电池电量下降率来比较不同网络类型、ISP 和比特率之间的性能。 一种观察是,性能与 5G SoC 高度相关,SA 5G 不一定比 4G 更耗电。 有关详细信息,请参阅大家的论文。
4. 讨论与增强首先,大家对5G时代的关键参与者给出了一些改进建议。 例如,大家鼓励内容提供商将服务器放置在离用户更近的位置,因为大家观察到 SA 5G 从分布式系统中受益更多。 大家还鼓励 ISP 仔细设计 UPF 的路由策略,其中应区别对待具有远程目的地和本地目的地的流量。
(video presents the strategy more clearly. At 11:25 of the video, url presented above) 大家并没有止步于改进意见,还在SA 5G中进行了改进实验。 大家观察到单个卡顿的平均持续时间在所有网络中都是相似的。 大家认为这是因为5G的更高的带宽和更好的可靠性没有得到充分利用。 因此,大家修改了 SA 5G 中的卡顿恢复策略,以缓解未充分利用的情况。 原始策略(左)有一个固定的水位: - 当网络状况不佳时,缓冲区长度会减少。 当它短于一帧时,播放器卡顿。
- 网络恢复后,重新填充缓冲区。 当它到达固定的水位线时,播放器恢复播放。
大家认为在 SA 5G 中,更高的带宽和更好的可靠性意味着一旦卡顿开始恢复,就不太可能遇到另一个卡顿。 因此,较小的水位线即可满足要求,同时能节省用户的等待时间。 大家建议通过对策略应用加法增加和乘法减少来适当地降低水位。 - 因此,在缓冲区长度减少到小于 1 帧后,水位线在卡顿之前被乘以一个小于1的系数。
- 在网络恢复后,水位线会在继续播放之前增加一个常数。
在快手应用上,大家取三组用户,每组300万用户,在这样的策略实行了18天后,大家发现,大家的自适应策略可以将 SA 5G 中的卡顿比例减少 7 个百分点。
最后,大家通过给出一些要点总结。 - 对于延迟,大家发现与4G相比,NSA和SA 5G都降低了延迟,而SA 5G更多地受益于分布式系统。
- 对于可靠性,SA 5G 提高了可靠性,但 NSA 5G 的性能与 4G 相似。 而且SA 5G虽然切换更频繁,但对水平切换的容忍度更高。
- 对于带宽,SA 5G 显示出比 4G 更高的下载速度,但 SA 5G 对蜂窝用户的密度更敏感。
- 对于能耗,大家发现SA 5G并不一定比4G更耗电。 实际上,它与5G SoC高度相关。
|