0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

小米技术委标准与新技术部音视频标准总监《互联世界》演讲实录

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2020-12-16 10:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2020 年 11 月 19 日,第四届 EmTech China 全球新兴科技峰会于苏州市相城区召开。作为在全球享有盛誉,以权威见解深度解读全球科技趋势的盛会之一,《麻省理工科技评论》 的 EmTech 系列峰会已成为全球最具影响力的科技会议风向标。今年,EmTech China 2020 继续以技术与商业的结合为主线,数十位世界顶级科学家、海内外院士、商业领袖、科创精英莅临现场,探讨新兴科技发展现状及其为人类社会带来的巨大影响。此外,《麻省理工科技评论》“50 家聪明公司” 2020 年榜单也在现场重磅发布。

会上,小米技术委标准与新技术部音视频标准总监 Mary-Luc Champel 分享了以《互联世界》为主题的演讲。以下为经过整理的演讲实录:

之前演讲的嘉宾认为我们这些大的互联网公司扼杀了小型的初创公司,其实我们小米的模式是不一样的。小米的模式是建立生态系统,鼓励每个人加入到平台上来。今天我想跟大家介绍一下,类似小米这样的互联网公司,在 5G 服务上的多媒体编码是如何做的,我们有很多的创新,这些创新会影响到大家。

小米的模式是建立生态系统

首先我想给大家介绍一下为什么我们有这样的创新,然后给大家介绍体积视频、未来的 XR 服务以及应用于 5G 服务的视频编解码器。今年很多领域的发展是非常迅猛的,体积视频、未来的 XR 服务是我们日后的发展趋势。再然后我想跟大家介绍一下媒体传输,媒体传输是如何影响未来的。最后我想展望一下未来,也就是看一下 6G 服务未来的发展如何,我相信未来 5-10 年 6G 服务会实现。

现在有层出不穷的新型服务和新型用途,这给我们带来了新的挑战。当然我们还可能有新的媒体形式,比如几年前出现的媒体形式有图片、视频等。现在我们有 3D 视频,3D 视频更加复杂,是加强版的视频,同时还有 VR、AR 以及游戏等。

当然这些新的媒体、新的服务要求我们有更高的带宽、更低的时延。比如玩游戏播放视频时,速度不够快就会有时延;比如现场直播,你关注的足球队正在参加世界杯,如果在临门一角的关键时刻视频卡顿了,观众就会非常着急。现在很多国家的用户需要居家隔离,带宽的使用在大大增加。

一些用户在家办公,他们需要使用视频会议的方式进行交流。另外学生进行在线教育学习时,如果在线学习平台不能支持流畅的视频播放,家长和孩子们肯定会受到很大的影响。娱乐设施也会用到很多的带宽。这些都需要更好的编解码器,更好的带宽管理以及更好的传输解决方案。在小米,我们的任务是克服这些新挑战,以简单易用的方式为我们的用户提供新服务。

现在的视频编解码器普遍使用 H.264 标准,它在 2003 年就被提出来,为什么大家现在还在使用?因为它比较便宜,而且直到现在还是非常强大的技术。在 2013 年,VP9、H.265 (HEVC) 标准被制定,相比于 H.264,在同等视频质量下可以节省近 50% 的传输码流。

在 2018 年,一些公司成立了开放媒体联盟(AOM)组,提供可免费使用的编解码器 AV1,AV1 比 HEVC 标准下的编解码的性能较好一些。但因为它没有获得足够的硬件支持,所以到目前为止取得了较小的成功。在 2020 年,H.266 (VVC)、MPEG-5 (EVC) 和 MPEG-5 (LCEVC) 标准被制定,其中,H.266(VVC)标准是由 ISO 和 ITU 联合制定的。MPEG-5 (EVC) 标准是基于历史悠久的工具做的,因此可以免费使用,该标准采用了有限数量的新工具来实现更高的压缩效率。

大家看到的是视频编解码器整体的变化趋势,小米一直在密切关注这种变化趋势,而且关注的重点在 3GPP 领域。3GPP 主要研究面向 5G 服务的视频编解码器(包括下一代编解码器,如 VVC 和 EVC)。小米现在也在关注 5G 的发展,我们想看一下未来整个的应用趋势和未来的编解码器解决方案,考虑是否可以在相同视频质量水平下降低所需的压缩码率,或者可以在相同压缩码率下提高视频质量。

另外 3GPP 已经探索出了评估编解码器的多种用途,这些用途包括是不是纯高清流媒体、4K 电视服务、在线游戏、屏幕以及内容分享等等。针对每一个应用都提供了测试序列,在编码时也考虑了操作的限制,比如在有时延的情况下用户很难有愉快的游戏体验。另外对于 AVC 和 HEVC,我们使用行业公认的衡量标准,公认的衡量标准包括 PSNR、SSIM 和 VMAF。

二维视频、三维视频和体积视频

在这些领域我们已经花了大概两年多的时间进行研究,接下来我想给大家介绍体积视频,我们之前讲的是二维视频和三维视频,接下来讲的加强版的视频类型是体积视频。体积视频可以移动,当你移动自己的时候就会产生 3D 的体验,用户可以看到不同深度的东西。在这里我们可以看到这个视频,虽然是平面的视频,但是如果你在其中就可以体验到体积效果,感受到体积效果的原因是它支持交互式视差。我们从参考视频和深度图中渲染这些帧,编码的内容包括视频、深度图以及遮挡物体地图,利用这些数据我们可以得到重建帧。

另外,小米在做一些场景描述的工作,如果要让用户有更加丰富的体验,我们必须将视频和音频相结合,而且将 3D 的内容和互动的内容加入其中。目前是没有这样的技术能把这些全都整合到一块。

同样还有一点非常重要,就是我们关注与研究的点云编码 (PCC) 方向,也就是点以及空间的编码。点云中有数不清的点,它可以用于实时直播,你可以让这里面的人物旋转,还可以有渲染的功能。点云也可以应用于 3D 物体,即用于环境监测的雷达,用雷达监测出来的复杂场景可以变成 3D 的点云。3D 点云视频也可以应用在文化遗迹的捕捉上,可以用于保护我们的文物古迹。

MPEG 的 PCC 中有两种技术方法,一种是基于视频的编码方法 VPCC,另一种是基于几何的编码方法 GPCC。VPCC 采用传统的视频编解码器来处理点云,这是非常好的解决方案,这种方法可以用于密集和动态点云的压缩。GPCC 方法适用于稀疏的点云数据,下一代 GPCC 将会支持动态点云。该方法采用几何编码,将点云数据放入一个立方体,该立方体会被划分成 8 个子立方体,根据每个子立方体的空间占用模式对它们进行迭代划分,直至子立方体中只有一个点。

这是我们推导出来的空间占用模式。在编码时,点的查找路径中有很多冗余信息,GPCC 可以帮助减少这些冗余,从而减少编码所需比特,因此 GPCC 是非常有潜力的一种编码方法。上个月 MPEG 刚刚完成了 GPCC 第一版的编码器。可以给大家看一下我们实现的编码方法,大家可以看到小的立方体全都已经被创建出来了,可以逐渐确定它的占用模式。

XR 技术可帮助用户随时随地使用设备

在未来,我们还会看到什么样的技术呢?

比如XR 技术是一项很有意思的技术,可以给用户很多不一样的体验,尤其在线上游戏中会被经常用到,也可以帮助用户在任何时候任何地方使用任何的设备。分布式计算、分割渲染、VR 直播也是重要的应用领域。如果想要一个 360 度的视频,其中会有很多的数据,但是我不知道在我后面的是什么,如果我要快速地旋转,需要把我背后的这些数据都传过来,只有这样才能够使用户有 360 度的视角。依赖于 VR 视角的流媒体可以帮我们预测用户在接下来会有什么样的动作,提前把这些数据进行传输。

另一个方面是媒体传输技术。这里是基于 HTTP CDN 的流媒体,YouTube、爱奇艺、腾讯视频、苹果都在采用基于 HTTP CDN 的解决方案。HTTP CDN 要连接起来是非常简单的,客户端能够根据带宽获取质量最高的内容。很多信息或者数据都会被部署在 CDN 上面,由客户端来决定需要获取的内容,可以实时地根据客户端的带宽,直接去下载对应的资源或者内容。

媒体传输还有一种新的技术叫 CMAF,它是一种新的应用格式。内容的提供商对于相同的内容有很多不同的版本、不同的质量以及不同的加密方式,CMAF 可以为所有版本提供共同的格式,可以应用于一些基于 HTTP 的框架,比如 DASH 和 HLS,所以采用 CMAF 能够有相同的网络分发,去解决客户的需求。客户端可以是独立的,也可以采用支持 HLS 或 DASH 的网页浏览器。CMAF 是非常有意思的一种技术,因为可以支持 MSE,CMAF 可以由 MSE 的客户端来进行使用。如果大家对于 CMAF 的媒体传输感兴趣的话,下一个月会有专门的会议,时间大概是半天,我们会具体讨论 CMAF 的一些应用和部署。

5G 的停留和 6G 的展望

最后我想讲一讲 3GPP。一开始我们有移动电话 (1G,2G),之后我们有了流量数据(3G),有了 3G 之后我们可以通过手机上网,之后有了宽带(4G),我们小小的手机也可以观看或者发起直播。我们现在已经不仅仅用手机打电话了,而是用它上网。现在有了 5G,又有了新的生态系统,紧随其后的是上面接入了很多服务模块。我们不仅停留在 5G,还在展望 6G。

5G 现在在中国已经很流行了,中国很多的公司已经在讲 6G 了。那么 6G 到底是什么?6G 其实就是混合的模块,把我们的物理世界、虚拟世界以及数字世界结合起来,用户则是站在这几个不同世界的中间。这就是我的介绍,谢谢。

责任编辑:xj

原文标题:EmTech China现场直击丨小米技术委标准与新技术部音视频标准总监Mary-Luc Champel:小米模式是建立生态系统

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 生态系统
    +关注

    关注

    0

    文章

    711

    浏览量

    21615
  • 小米
    +关注

    关注

    70

    文章

    14547

    浏览量

    152563

原文标题:EmTech China现场直击丨小米技术委标准与新技术部音视频标准总监Mary-Luc Champel:小米模式是建立生态系统

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2026年高清音视频切换器方案选型分析

    宝安区,深度适配珠三角消费电子产业带客户需求,是专注高清音视频半导体芯片代理、定制化方案开发的国家高新技术企业,获评专精特新中小企业、创新型中小企业,拥有HDMI协会会员、全球HDCP2.2协会会员双重
    发表于 04-11 17:54

    MAX4079:完整的音视频后端解决方案

    MAX4079:完整的音视频后端解决方案 一、引言 在当今的电子设备中,音视频处理是一个关键的环节。无论是卫星接收器、有线电视接收器,还是家庭影院系统、DVD 播放器等,都需要高效可靠的音视频后端
    的头像 发表于 04-03 12:50 189次阅读

    从 “卡脖子” 到 “自主可控”,音视频分布式系统国产化实践之路

    在当前全球音视频芯片市场格局中,国外企业长期占据主导地位,核心技术与核心器件的垄断的局面,曾是国内音视频行业发展的重要制约因素。近年来,随着国际形势的深刻变化,国外对我国芯片行业的技术
    的头像 发表于 03-02 11:18 332次阅读
    从 “卡脖子” 到 “自主可控”,<b class='flag-5'>音视频</b>分布式系统国产化实践之路

    高清混合转换器:模块化技术重塑音视频信号转换行业格局

    行业技术升级提供了新路径,对音视频领域的工程应用、设备运维产生了深远影响。 当前,音视频信号转换领域市场成熟但痛点突出,传统信号转换器厂商数量众多,产品型号繁杂,根据信号转换类型可大致划分为四大类,覆盖各类
    的头像 发表于 02-11 11:09 406次阅读
    高清混合转换器:模块化<b class='flag-5'>技术</b>重塑<b class='flag-5'>音视频</b>信号转换行业格局

    2025年中国音视频产业十大创新进展

    2021-2025年中国音视频产业取得“万亿显示 + 6 万亿产业链”¹规模佳绩,成为制造强国建设的核心支柱。产业立足规模优势、响应“质量领跑”号召,在标准、芯片、应用、AI赋能等领域,以创新为抓手促内需、强产业。
    的头像 发表于 01-04 16:04 1127次阅读

    洲明科技荣获2025年度音视频行业品牌评选九项大奖

    2025年12月20日,由DAV数字音视工程网与《数字音视工程》杂志联合主办的第17届音视频行业品牌评选结果正式揭晓。
    的头像 发表于 12-28 11:45 792次阅读

    打破国外垄断!自主分布式音视频方案筑牢行业安全根基

    在当前的全球音视频芯片市场中,国外公司一直占据着主导地位,然而,近年来国外对中国芯片行业的打压让国内音视频行业的发展面临了巨大的挑战。在这样的背景下,国内领先的音视频技术企业挺身而出,
    的头像 发表于 12-19 11:28 466次阅读
    打破国外垄断!自主分布式<b class='flag-5'>音视频</b>方案筑牢行业安全根基

    三款PXIe板卡科普:解锁专业音视频处理的核心力量

    便是其中的“佼佼者”。它以高速FPGA为核心“大脑”,实现了对多路音视频信号的同步捕捉与精准处理,为后续的数据分析和应用提供了坚实基础。 从硬件架构来看,这款板卡采用3U CPCIe总线设计,这种标准化的总线接口不仅让板卡能够轻松适配主流设备,更依托
    的头像 发表于 12-04 17:04 998次阅读
    三款PXIe板卡科普:解锁专业<b class='flag-5'>音视频</b>处理的核心力量

    视听信号的“全能捕手”:认识KS-PXIe638型8通道音视频采集板

    视频技术世界里,我们既需要能将画面“分身”的分配器,也需要能生成标准信号的源板,但所有这一切的前提,是我们首先要能将真实世界的声音和画面
    的头像 发表于 11-10 11:52 469次阅读
    视听信号的“全能捕手”:认识KS-PXIe638型8通道<b class='flag-5'>音视频</b>采集板

    音视频编解码封装解封装部件介绍

    是否有探索开源鸿蒙音视频编解码技术的欲望?是否对开源鸿蒙音视频编解码格式支持有诉求?别急——今天这份开源鸿蒙AVCodec Kit介绍文章,就是解答疑惑的指南!参考这份指南,可以使用开源鸿蒙的
    的头像 发表于 10-31 09:15 641次阅读
    <b class='flag-5'>音视频</b>编解码封装解封装部件介绍

    IEC 62368标准适用于哪些产品

    IEC62368-1标准是国际电工委员会(IEC)制定的一项安全标准,适用于音视频设备、信息技术设备以及通信设备。该标准的全称是:IEC62
    的头像 发表于 10-29 14:47 1434次阅读
    IEC 62368<b class='flag-5'>标准</b>适用于哪些产品

    音视频开发全栈解析

    Media Kit 让开发者可以调用系统的音视频能力,涵盖播放、录制、录屏、元数据提取与转码六大核心功能模块,支撑系统应用与第三方应用在视频播放、内容创作、教学录屏、直播互动等典型场景下的音视频处理需求。
    的头像 发表于 09-18 14:42 1026次阅读
    <b class='flag-5'>音视频</b>开发全栈解析

    千视电子受邀亮相2025音视频产业链研讨会,引领全链路音视频IP化新趋势

    主管部门负责人,共同探讨产业前沿技术、市场趋势及合作机会,旨在推动湖南音视频产业链高质量发展。当前,全球音视频产业正经历深刻变革,正在加速迈向智能化、融合化及沉浸式体验的新
    的头像 发表于 08-27 11:33 1521次阅读
    千视电子受邀亮相2025<b class='flag-5'>音视频</b>产业链研讨会,引领全链路<b class='flag-5'>音视频</b>IP化新趋势

    泰芯半导体推出星闪音视频无线SOC芯片TXW828

    在短距离无线通信技术加速迭代的浪潮中,珠海泰芯半导体有限公司全球首先发布支持星闪(NearLink)标准音视频无线SOC芯片——TXW828。这款集WiFi/蓝牙BLE/星闪三模融合音视频
    的头像 发表于 06-20 15:51 3029次阅读

    音视频一体化解决方案

    随着数字化转型加速,音视频技术在各行业深度应用,传统音视频分散式管理系统面临多源异构设备接入困难、数据孤岛林立、运维复杂、协作效率低下等挑战,各行业对信息技术的需求逐渐从单一化向集成化
    的头像 发表于 04-24 09:14 1324次阅读