0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为云音视频质量监控与优化实践

LiveVideoStack 来源:LiveVideoStack 作者:康永红 2020-12-25 11:13 次阅读

云时代,视频直播、实时音视频通信等在线音视频服务面临各种复杂的网络环境和流量爆发式的增长,对音视频质量监控和成本优化提出新的严峻挑战。本次分享我们邀请到了华为云音视频大数据研发负责人康永红,他详细介绍了基于大数据的音视频全流程质量监控评估体系和各个环节的优化实践,以及面向不同的业务和场景,如何通过不同的关键数据指标改进音视频服务的体验质量和产品成本。

大家好,非常有幸能有这次分享机会,首先感谢LiveVideoStack。我是康永红,来自华为公司,在大数据和音视频业务领域有十多年研发经验,负责直播、视频会议、RTC、VR的QoC、QoE、QoS管理,主要聚焦在基于大数据解决音视频产品体验提升和成本优化的业务领域。我个人认为这也是整个音视频领域的一个难点。

2020年是不平凡的一年,客观来说它促进了我们音视频业务的爆发性增长。华为云基于大容量、低时延、全互联的媒体网络,通过全国的2000多个节点和几百T的宽带,和我们的客户一起服务了亿级在线用户。在这个过程中,通过大数据解决视频体验质量和成本优化显得尤为重要,同时我们也积累了一些经验,今天我将和大家分享云原生时代,华为云在音视频质量监控与优化的实践。

本次分享主要分为四部分:第一部分是云原生时代为什么要做音视频数据服务体系,第二部分是华为云视频直播和RTC音视频直播在体验质量上的实践案例,第三部分会介绍华为在云原生时代是如何快速构建音视频服务全流程质量监控平台,最后将总结和展望音视频业务体验质量的思考和技术规划。

1 “ 构建音视频数据服务体系

从音视频体验的发展趋势来看分为直播、RTC和XR三代,可以归纳为两个特点:第一点是用户体验越来越真实,传输分辨率从720P到1080P、再到XR的4K、6K、8K、乃至更大;另一点是业务要求互动性越来越强,迟延方面从30s到XR不超过100ms,对延迟要求更低。

基于以上质量体验的发展趋势,我们需要有一个后台技术支撑。我们在使用大数据解决支撑的过程中也经历了三个阶段:首先是5年前用大数据平台解决技术问题,其次是在3年前用数据中台解决效率问题,第三个阶段是最近两年我们综合1.0、2.0时代的特点,采用“中台+可信数据服务”的数据服务中台模式解决价值问题。我们认为数据服务中台是解决业务差异性和市场不确定性的最佳框架。

在直播中我们经常会碰到卡顿、实时音视频通话延迟等情况,这些问题都会严重影响用户体验。解决这些问题的一般方法是构建音视频质量监控平台,采集数据,用大数据的方法解决监控质量问题。在这过程中,我们又会碰到一些新的问题,比如采集数据延迟很大、丢失很多、数据不准确,此外还包括大数据算力不够、交付时延比较长等等问题。这些体验和技术问题带给我们很多挑战——包括会在什么场景出现这些问题,无法精准确定是网络问题、设备问题还是环境问题,以及这些问题影响了哪些客户等等。

那我们要怎么解决这些问题呢?在端+边缘计算+云计算的云原生时代,技术上已经给了我们一些解决方法。最好的实践是基于“数据湖+数据服务”的云原生数据驱动能力,去解决业务差异性和市场不确定性。这套架构分为六层,我们通过这六层去解决后台系统的相对稳态及前端业务稳态之间的矛盾。

架构落地的具体实践是基于云服务基础设施,首先我们构建了统一的音视频数据湖,同时构建从采集、生产到消费的数据价值链,通过这两者结合,支持所有同时在线的几大类服务接入,和面向内外部七类客户,以及包括运营、运维等客户数据服务的QoS、QoE、QoC等三大类七小类的场景诉求。当然仅仅基于这个架构开展体验质量优化工作是远远不够的,这只是技术上的解决方法。

从在业务角度出发,我们认为QoE体验是一个管理的问题,我们在业务上需要做一些设计,这块我们构建了音视频服务的体验体系,大致分为两个大的阶段和三个小的阶段。两个大阶段是先诊断、再提升,在诊断中分为监控和诊断两个小阶段。

具体展开来看,首先需要构建QoE、QoS的立体实时监控体系以及辅助AI的异常检测方法,做到实时发现问题。第二步在发现问题后用秒级诊断能力,快速诊断体验原因,这个原因可以具体到用户行为级。基于诊断结果,第三步就需要做体验提升,一般有两种方法:第一种是依靠人工经验做优化,另一种方法是智能调度,我们在面向不同行业、不同场景的情况下,基于智能调度策略在成本可控的情况下做到用户体验最优。

基于上述体验质量优化体系,接下来我将具体展开分享华为云在视频直播和RTC实时音视频方面的体验优化实践的案例。

2 “ 华为云视频直播体验优化实践

我们首先看一下华为云视频直播体验优化实践案例,我们在做到低时延、不卡顿、高清晰的同时,还实现了成本可控。总体分为三个阶段:第一阶段质量监控,第二阶段问题诊断,第三阶段体验提升。

视频直播的质量监控,我们首先构建了覆盖流质量、体验、规模、网络、成本、设备六个维度的立体质量监控体系,涵盖了QoE、QoS、QoC三十多个指标,其中包括帧率、码率等核心的QoS指标,秒开率、卡顿率等QoE体验指标和带宽、回源率等成本QoC相关的指标。

第二个阶段问题诊断——视频直播的秒级质量诊断,这是基于网络数据+端数据构建的直播流全链路监控体系。诊断流程贯穿了第一公里主播端监控推流帧率等QoS指标,到网络节点间帧率、码率等QoS质量指标监控,带宽回源率、成本指标,以及最后一公里观众端卡顿、秒开、黑屏等QoE指标。这样就实现端到端实时的秒级监控,如果发现异常情况可以及时反馈给顾客和调度系统,比如我们在第一公里发现帧率、码率出现异常,就通知客户在主播端进行策略调整,如果实在网络发现异常,就做一些节点用户数据调动或其他策略的优化,而当观众端出现体验异常时,智能调度系统会做调度策略的调整。以上整个全链路监控系统覆盖了12路直播全场景和全协议监控。

直播流全链路监控系统——从第一公里、到媒体网络、再到最后一公里,整个都是可视化的,这样可以提升问题诊断的效率。

第三步体验提升,视频直播体验提升大致分为两种方法。其一是通过运维同学的经验实施,另一种方法是基于智能调度系统——基于端、边、云数据协同做智能调度体验优化,这种方法利用了统一视频数据湖技术,实现端、边、云的QoS、QoE、QoC数据的协同,通过智能分析引擎生成流、客户、网络链路、节点、观众的实时画像,基于实时画像+调度策略由智能调度系统实施智能调度,在成本可控的情况下做到最佳体验。衡量指标主要选取两类指标,一类指标是成本指标,比如通过回源率来衡量成本是否下降;另一类指标为体验指标,通过卡顿率、秒开率等判断用户体验是否有提升。以上是视频直播在质量监控和体验提升的一些实践案例。

3 “ 实时音视频RTC体验优化实践

接下来分享实时音视频RTC的体验优化的实践案例。RTC属于第二代音视频业务,它和第一代直播在业务方面有很多差异,比较关注时延以及行为级的监控,基于这些差异性,我们也采用了三个不同优化体系。

第一点是质量监控,RTC质量监控体系建立了覆盖通话、网络、成本、设备等六个维度的立体质量监控体系,覆盖QoE、QoS、QoC三十多个指标。其中核心指标包括等码率、帧率、丢包率、抖动质量QoS指标和秒开率、时延、卡顿率、入房和选看成功率等用户体验QoE指标,以及带宽等成本QoC指标,与直播监控指标相比,特别是端到端的时延指标,这是基于前面提到的差异性着重关注的。

基于监控体系,第二个工作是问题诊断,我们首先建立了三类体验质量数据服务,第一类是监控指标数据服务,主要覆盖的是服务端、客户端、设备、QoE、QoS、QoC,这些数据放在统计库、时序库中使用。第二类是网络端所有控制面和媒体面的事件数据服务。第三类是终端事件数据服务,包括终端侧用户行为事件,例如加入房间、切换角色、操作麦克风或摄像头等事件,此外还包含了终端设备数据,例如CPU、内存、摄像头等。

基于这三类体验质量数据服务,RTC构建了三层问题诊断体系。

第一层构建是覆盖全链路、全维度的QoE/QoS实时监控体系,可以在分钟级完成体验诊断和快速恢复问题。上图案例中,红色1是十一点时发现成功率告警,我们通过维度下降发现是某一个客户的APP下降很厉害,最后通过节点维度定位到是天津某一个SFU节点服务异常,整个故障恢复时间在分钟级就可以完成。

第二层监控体系是基于网络行为数据和端侧行为数据的一键式用户个例通话QoS调查能力,它可以帮助我们快速解决RTC业务单用户的体验问题和投诉。上图的案例通过房间信息以及用户行为事件信息,快速判断用户听不到声音是因为进行了静音操作导致的,整个过程也是在分钟级完成。

第三层问题诊断能力是在第一层QoE/QoS全局指标监控和第二层QoS行为调查能力基础上的体验问题自动诊断高级能力,它通过监控三十多个指标产生二十多个异常事件,并通过学习模型,给出影响的六类体验场景。这样系统就可以快速自动化地判断出体验发生异常的原因,并且快速传递给客户。

4 “ 音视频服务全流程质量监控平台

上述介绍的是华为云RTC业务体验优化的实践案例,做体验质量优化工作是需要平台完成的,我们下面来分享华为是如何构建音视频服务全流程质量监控平台的。首先从数据采集、传输、计算到消费四个环节的亿级规模音视频质量监控大数据平台,包括支持端、边、云全数据采集和传输的数据网络,支持实时计算、离线计算和机器学习的多模数据处理系统,以及支持运维、运营、客户的数据消费服务体系。

在构建平台时,会遇到很多性能、质量、效率以及实时性的问题,如何构建一个大容量、低成本、高效率和可信数据质量的平台?我们采用了批流一体和存算分离的架构。批流一体解决的是开发效率的问题,我们同一个指标可能在批流一体中计算一次就可以对所有服务使用,不需要重复开发,同时我们有一站式数据开发平台可以解决开发效率的提升。成本问题上我们采用的是存算分离——存储和计算是分离的,存储采用的是对象存储,价格相对低廉,计算引擎采用的是前面介绍的批流一体的方式,这样可以做到成本最佳。质量方面是采用了“ODS-DWD-DWS-ADS”四层数据治理平台,保证所有数据可跟踪、可管理,确保任何指标数据都是实时、完整、准确的。

在有了大容量、低成本的平台后,我们还面临断网、设备故障等问题。我们在平台可用性上基于云服务实施,采用跨Region主备容灾和多AZ模式,整体SLA可达99.99%,来自端、边缘、云等全部六类数据不丢失,监控、调度等六类服务不降级。这样我们在整个环境下,任何环节出现异常,在质量和服务提升上都可以正常工作。

5 “ 总结与展望

回顾本次分享,音视频体验发展有三个特点:第一,用户对体验的要求是真实感越来越强,直播、RTC等用户要求更高;第二,在用户体验上要求越来越互动;第三,面对各种网络、终端业务环境越来越复杂。

为了保证音视频体验质量,我们有3个利器:第一,针对不同业务场景,构建“先监控再诊断后提升”的体验质量体系;第二,基于“数据湖+数据服务”解决用户差异性和市场不确定性的问题;第三,在实施过程中要平衡成本和体验的关系。

对未来音视频业务体验我们有三点规划方向:一是持续基于端、边、云数据协同来驱动QoE、QoS、QoC优化;二是构建音视频内容质量的智能评估体系;三是建立第三代XR音视频体验质量规范,如沉浸感等。

以上是本次分享的全部内容,谢谢大家。

原文标题:云原生时代——华为云音视频质量监控与优化实践

文章出处:【微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 视频
    +关注

    关注

    6

    文章

    1891

    浏览量

    71904
  • 华为
    +关注

    关注

    215

    文章

    33629

    浏览量

    247162
  • 云原生
    +关注

    关注

    0

    文章

    222

    浏览量

    7843

原文标题:云原生时代——华为云音视频质量监控与优化实践

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    音视频SoC与AI技术融合,带来更智能的音视频处理解决方案

    电子发烧友网报道(文/李弯弯)音视频SoC,即音视频系统级芯片或片上系统,是一种高度集成化的芯片,它将电路板上的多块芯片以及嵌入式软件全部集成到一块芯片中。音视频SoC芯片广泛应用于各种嵌入式系统
    的头像 发表于 04-26 01:20 1541次阅读

    【RTC程序设计:实时音视频权威指南】音频采集与预处理

    闲暇之余,继续学习【RTC程序设计:实时音视频权威指南】这本书。 书中对于音频采集的介绍非常详细和全面,包括原理、方法、技术细节以及实践应用等方面的内容。 音频采集是实时音视频通信中的关键步骤之一
    发表于 04-25 10:41

    【RTC程序设计:实时音视频权威指南】新书一瞥

    本人从事音视频领域的开发,经常接触实时音视频处理相关的技术,看到这本书非常有兴趣阅读,这本书全面介绍实时音视频(RTC)技术的权威著作,该书详细讲解了RTC的基本概念、技术原理、系统设计以及实际
    发表于 04-22 09:09

    【RTC程序设计:实时音视频权威指南】传输控制优化阅读 及其实践分享

    书中第八章 传输控制优化,主要介绍了拥塞控制,弱网降级,抖动缓存与平滑发送,错误恢复等几个部分的内容。 其中抖动缓存与平滑发送是非常重要的一部分,在实践中是保证音视频实时不断流的传输是必须
    发表于 04-21 17:11

    【RTC程序设计:实时音视频权威指南】本书概览

    ,这都是按照音视频流的开发的一般流程介绍的。然后介绍了编解码以上所技术,信令与媒体协商(个人觉得协商这里用协议更合适,因为里面讲解的是各种音视频传输的协议)。然后是控制传输优化,可扩展架构,评价指标等
    发表于 04-21 17:09

    音视频解码生成:打造极致观影体验的关键技术

    音视频解码生成是多媒体播放的基础。它将压缩编码的音视频数据还原为原始的、高质量音视频信号,使用户能够观看到清晰、流畅的视频内容,同时享受
    的头像 发表于 02-25 14:43 152次阅读

    音视频解码器优化技巧:提升播放体验的关键步骤

    随着数字多媒体内容的爆炸式增长,音视频解码器在现代技术生活中扮演着至关重要的角色。从流畅的在线视频流播放到高质量的本地文件解码,解码器的性能直接影响了我们的观看体验。那么,如何优化
    的头像 发表于 02-21 14:45 252次阅读

    音视频解码生成在多媒体制作中的应用

    视频编辑和后期制作中,音视频解码生成技术用于将原始素材解码为可编辑的格式。编辑人员可以对这些解码后的素材进行剪辑、特效处理、色彩调整等操作,以制作出高质量的影视作品。 2. 音频处理 音频处理是多媒体制作中的另一个重要
    的头像 发表于 02-21 14:39 110次阅读

    音视频

    音视频技术都喜欢深究内部最核心的原理和机制,尤其是ffmpeg这个编解码库,可以说是音视频领域事实上的标准。语音智能算法,语言语义分析和理解,流媒体服务器等高端技术也都基于它而构建。希望有幸获得本书,深度学习ffmpeg核心技术,和作者一起在技术海洋中探索和进步。
    发表于 11-23 08:51

    议程揭晓!RT-Thread议题:在嵌入式低资源系统中实现高效音视频播放

    LiveVideoStackCon 2023 音视频技术大会深圳站,保持着往届强大的讲师阵容以及高水准的演讲质量。 两天的参会时间,您可以快速了解音视频大咖前瞻的思想、把握音视频技术发
    的头像 发表于 10-26 09:05 186次阅读
    议程揭晓!RT-Thread议题:在嵌入式低资源系统中实现高效<b class='flag-5'>音视频</b>播放

    打造沉浸式专业音视频体验

    视频质量、延迟或控制的情况下进行成本效益设计。AMD 平台可快速适应新兴音视频技术的要求,可通过 AV-over-IP 的方式,采用无损压缩或者深压缩方式进行高质量
    的头像 发表于 09-06 09:10 434次阅读
    打造沉浸式专业<b class='flag-5'>音视频</b>体验

    音视频开发:实时传输与处理音视频流的技术与应用

    音视频
    YS YYDS
    发布于 :2023年06月27日 18:20:58

    基于WebAssembly构建Web端音视频通话引擎

    Web技术在发展,音视频通话需求在演进,怎么去实现新的Web技术点在实际应用中的值,以及给我们带来更大的收益是需要我们去探索和实践的。LiveVideoStackCon 2022北京站邀请到田建华为
    的头像 发表于 06-26 15:56 486次阅读
    基于WebAssembly构建Web端<b class='flag-5'>音视频</b>通话引擎

    音视频集成是什么 音视频视频有什么区别

    音视频集成是将音频和视频设备、系统和技术进行整合,以实现全面的音视频功能和体验的过程。
    发表于 06-19 17:14 1796次阅读

    车载音视频监控板和24V电源板静电测试及解决方案

    测试产品:车载音视频监控板和24V电源板
    发表于 06-09 10:54 322次阅读
    车载<b class='flag-5'>音视频</b><b class='flag-5'>监控</b>板和24V电源板静电测试及解决方案