0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

音视频新创的生存境遇与未来的多媒体技术圆桌交流

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-05-13 11:08 次阅读

在 LiveVideoStackCon 2021 上海站当中,我们策划了一个由三场圆桌组成的“技术商业策略”专题,并邀请到微帧科技的联合创始人&CEO 朱政作为专题出品人,与来自工业界、学术界,甚至是投资领域的嘉宾聊了聊未来的多媒体技术、大厂们深耕与扩张的阻碍,以及音视频新创的生存境遇。

因为圆桌反响不错,会后,我们决定将圆桌的现场内容整理编辑后发布(交由各位圆桌嘉宾审校后,相应内容也做了一些修改,但并未改变其原意),希望能给大家带来一些思考。

When We Are Expanding

“技术商业策略”圆桌 • 第1弹

圆桌主持

朱政-微帧科技 联合创始人&CEO

圆桌嘉宾

李浩-网心科技 CTO 李郁韬-腾讯云 副总裁 陆振宇-华为云视频云总监 毕玄-阿里云视频云负责人 廖念波-即构科技技术副总裁

主持

本场圆桌的主题跟技术商业策略的关系非常紧密,主要探讨大厂如何进行战略决策和商业规划,以及如何利用资本和资源的雄厚实力跑马圈地。下面首先请各位老师进行自我介绍。

我是网心科技的李浩,负责公司产品和技术团队。网心科技聚焦在边缘计算领域,作为先行者在该领域已持续投入了六年。

大家好,我是来自腾讯云的李郁韬,主要负责音视频通信和一些边缘计算的产品的研发工作。

大家好,我是来自华为云的陆振宇。我在华为工作了16年,过去的四年都在做和视频相关的业务,谢谢大家。

大家好,我叫毕玄,现在负责阿里云的视频云团队,阿里云视频云基本覆盖了从内容到交互,各种视频需要的所有PaaS,以及一些SaaS的技术。

大家好,我是来自即构科技的廖念波。我们是2015年创立的,专注于实时音视频的解决方案的云商,谢谢大家。

When We Are Expanding

主持

各位老师都非常谦虚,介绍的时候都没有提及自己的title。我相信今天有各位坐在一起,应该能帮助我们看到接下来视频云技术解决方案的整个规划和变化。圆桌讨论的第一个问题相对简单一点:看到这么多重量级人物在一起,大家对刚结束的Q1是什么心情,可以分享一下吗?以及能不能用两到三个关键词简单形容一下今年的工作计划,谢谢。

李浩

Q1 对我来讲是持续的压力。行业变化很快,整个行业的需求也很充沛,核心在于我们如何把这些需求实现好、服务好,所以对我来讲,这些压力是属于幸福的烦恼。

我觉得今年有几个关键词:第一个词是找寻。我们希望能在边缘计算的赛道里落地更多的创新场景;第二个词是突破,技术和服务能力能继续突破,持续提供超客户预期的产品,团队能力和行业认知继续突破,在当前赛道能持续领跑。

李郁韬

我觉得主要是需求做不完,对其他没什么特别的感觉。特别是春节期间,一直在完成各类新需求以及客户保障的工作。

陆振宇

对全年的感觉就像是华为云在视频方面登山。我们的目标是非常明确的,虽然这座山很高,登山的过程也像是过去的 Q1——需求做不完,我和团队也很辛苦,但是我相信,围绕一个确定性的目标登山,从全年的角度来看,我们一定能登过那座山,这也会给我们带来足够的成就感。

毕玄

对阿里云来讲,我们很高兴地看到在 Q1 相比过往疫情没那么严重的情况下,阿里云仍然保持了非常高速的增长。这说明整个产业不是纯粹因为疫情这一波红利而火起来,而是在疫情过去以后,仍然保持了非常高速的增长,这是我认为我们整个产业最重要的一个地方。

对于全年,我觉得关键是如何把内容视频化做得更大。我们认为,对现在的整个行业来讲,还有非常多的内容是有诉求、但没有完成视频化这一步的。第二点是我们相信交互的线上化会推进得更快。大家在疫情期间,感受最强烈的可能就是视频会议,即体验从线下搬到线上。并且,很多年轻的小伙伴们把很多线下的社交活动也搬到了线上。所以我相信在整个视频产业,我们还是要在内容方面更好得做好视频化交互,更努力地达到线上化,这也是我们会持续投入的方向。

廖念波

对于过去的 Q1,包括即将过去的四月份,我们最大的一个感受就是时间过得太快,有太多客户需求要去满足。未来一年即构的重点工作可以用两个关键词来概括。大家都知道 C++C# 两门语言,但我们是做 RTC 的,所以我们的两个关键词就是 RTC++ 和 RTC# 。

RTC++ 是说要不断丰富自己的产品线,不只是 RTC,还包括一些周边辅助的、紧密相关的产品能力,比如 IM、会议以及教育场景下的白板功能、文件共享、录制的能力,以及美声、变声、人脸 AR 等 AI 相关的能力。关于 RTC#,可以看到 # 这个符号是两横两纵,对应我们的客户的行业分类,我们目前客户主要还是分布在泛娱乐、教育,还有很多传统的行业是需要实时音视频的解决方案的,我们也感受到了很多这方面的场景和需求的压力。接下来我们的工作及战略重点是全行业的深入场景的解决方案,与金融、政企、物联网、医疗等行业更深的融合,水利万物随方就圆,将音视频技术真正的融于无形。RTC++和RTC#就是我们的工作关键词,谢谢各位。

主持

各位老师的话总结起来,感觉主要是需求做不完和幸福的烦恼。看上去,总的来说都是视频在不断繁荣,视频的时代在加速到来。还想请问一下各位老师,从技术、产品、商业几个维度来看,大家觉得21世纪的第三个十年,也就是接下去的十年,音视频的生态会有哪些方面的改变。

李浩

下一个十年在视频内容理解上面会有很大突破。视频是更有效的信息传递方式,人的思维模式很容易理解视频,视频内容理解的突破可以让物与物之间也通过视频传递信息,物与物之间的传递也不再是现在这种简单信令传递。所以我们判断将来是一个全视频场景、全视频连接的环境,所以视频内容的增长不会受限于人的消费时间,视频行业会成为一个基础性行业。

李郁韬

从腾讯的角度看这十年,就是所谓的全真互联网的十年。我们认为这十年的互联网的定义会从移动互联网——人人都能接入到网络——变成在互联网上人人都有全真的交互、全真的内容体验、全真的娱乐体验。所以音视频的这个部分会成为全真互联网的一个底层设施,能让大家通过音视频的技术真正的把线下搬到线上,做到虚实共生。很多虚拟人、虚拟物品、虚拟内容都会在线上爆发。我们的很多技术都要围绕着更实时的通信、更高清的体验,以及更广泛的连接和接入这些部分来展开,这是我们从腾讯的角度观察到的一些趋势。

陆振宇

如果我们从视频的生产制作、分发,再到最后的消费来看,我觉得两端可能发生的变化会牵引中间的变化。

首先我们看生产端。生产端,我们认为第一个就是机器生产的视频会超过人生产的视频。现在大家看的视频还都是人生产的视频,生产完之后把它们用来做分发,但是以后机器生产的视频,或者说原生的在云上生成的视频——这个云包括了边缘——可能会超过人所生产的视频。因为人所能消费、所能生产的视频是跟时间有关的,但变成机器生产视频之后,它实际上突破了时空的限制。我们再说消费端。现在人眼消费是有时间的限制的,在消费端的人眼这边,我赞同李总说的,全真也好,或者叫沉浸式的体验也好,包括显示的设备都一定会发生大的变化。华为的终端对未来的终端形态的畅想和研究也是认为,在未来的十年,手机一定不是最主要的终端,是什么样的形态可能会有多种选择。另外用人工智能或者是其他的方式来消费和使用这些视频,也是一个很大的趋势。所以总结一下就是在生产端和消费端都会有很大的变化,中间的处理和分发也是随之产生的一些指标。

毕玄

看未来的话,在短期阶段,最重要的还是去解决内容视频化这个问题。因为现在内容在整个视频化阶段面临的一个很大问题是第一次生产制作的问题。大众现在拍一段高质量的短视频难度是非常大的,有点类似很多年前拍一张高质量的照片,但这在现在对多数人来说都不是问题。所以我们相信拍高质量短视频难的这个阶段也会过去,但这需要整个产业不断地去努力。

我觉得,第一,我们仍然要在内容视频化上考虑怎么让生产制作这一点变得更加简单。它可能覆盖了很多东西,从拍摄的SDK到剪辑端,再到智能生产端,我们都看到了非常大的进步。第二个是我们认为整个视频产业要更往前进一步的话,一方面是要生产量更大,一方面是处理。现在很多做视频业务的创业公司,远比以前做各种业务创业的投入度更大,因为光带宽就耗费惊人,所以在处理端如何把带宽压得更低的同时又保持很好的体验,我觉得这是视频产业要继续努力的一点。如果不做到这点,整个产业是很难壮大起来的。在交互线上化这一点,很多体现在把线下会议、线下的社交转移到线上进行。但我相信大家有感受到线上开会和线下面对面开会的差别。其中最典型的体验差异可能是延时造成的,因为延时就可能会出现抢话等各种各样的现象,当面交流的两个人的延时肯定在毫秒以下,但现在互联网的延时不可能做到这一点,所以我们要继续往这个方向努力。音视频产业在过去几年之所以火爆起来是因为直播短视频带动了整个产业的发展,疫情又带动了音视频通讯的发展。所以我们觉得未来还需要有其他的技术,比如上一个话题探讨的VR、AR,我们也非常希望未来有更不一样的东西来带动整个产业进一步往前,带来爆发式的增长。

廖念波

我觉得下一个十年的音视频技术,特别是实时的音视频通讯技术会成为各个行业的基础设施和最基本的交互模式,尤其是伴随着 5G、终端的基础网络设施这样一些基础能力的提升。

我们当前看到的音视频技术更多体现在手机上,我相信下一个十年它会变成各个行业里植入式、沉浸式或者场景化的能力。这个过程中,我们作为音视频解决方案的提供者,怎么深入地了解客户的行业本身的业务知识和场景,可能是抓住这个浪潮的重要前提。第二点,就目前在泛娱乐方面主要的应用,中国是走在世界的创新前列。各种玩法,以及音视频技术本身在商业变现方面的实现都是非常好的。我相信下一个十年可能会是我们出海的好时机,我们已经看到有些中国的客户在做海外市场,而且做得非常好。我们接下来会投入大量的精力和更多的技术去支持我们的客户出海,同时我们自身也会尝试走出去以支持更多的海外客户。

主持

谢谢各位老师,在座各位老师作为视频行业基础设施和解决方案的提供者所预测的未来十年将会发生的变化,应该就是近期大概率就会发生的。接下来想请问各位,总览海外和国内,有哪些亟待解决的行业痛点?从你们的角度来看,要解决这些行业痛点,需要先解决哪些跨在技术和商业之间的鸿沟?

李浩

这个问题比较大,我从我们正在做的一些事情上入手——在视频上绕不开的一个问题就是传输。我也做过一段海外业务,就目前来讲,视频的生产、消费能力大于现有网络的承载能力:传输能力和成本压制了包括 VR/AR 在内的更清晰、更实时、更多元化的视频需求。

全球的基础网络环境差异很大,中国的基础设施在全球范围内算很好的,光纤到户率 90% 多,移动网络高密覆盖,基站数量占全球一半以上,相比印度光纤到户率只有 4%,印尼受限它的地理条件网络连通性很差,非洲还处于 3G 时代,带宽只够传输关键帧。随着中国音视频产品的加速全球化,需要我们在差异化的基础设施上搭建自适应的网络,通过和内容端的配合,利用新的编码、组网、传输技术最大化提高现有网络基础设施的利用率。我们希望充分利用这几年在边缘计算领域的积累,来最大化挖掘网络能力,这里面有着大量的沉默资源,屏蔽复杂性和波动性,为音视频业务提供高性价比的全球化传输服务。

李郁韬

这个问题好大,为了避免讲不完,我也只讲一个环节,从全真互联网的角度去阐述。

内容的丰富度是我们接下来最有可能去解决以及去实现商业化的。举个例子,今天我们都在说云游戏,但是云游戏整个行业还面临很大的问题,包括怎么去解决带宽的成本、服务器的成本、GPU的成本。在业界来看这还有很长的路要走,而且特种硬件对于游戏或者万物云化这种渲染能力的支持还有很多工作要去摸索。那回到我们今天看到的云游戏,其实它的发展会远快于我们的预期,原因在于我们今天有大量成熟的游戏可以马上搬到云上。搬到云上之后不是说在云上运行的游戏就比终端的好玩,更多的是有一种全真的体验,能够跟游戏直播以及直播里面的交互打通。所以,如果说全真互联网在游戏这个领域有一个具象解释的话,那就是以后的云游戏都在云上,是一种我们可以跟亲朋好友一起去玩,同时又可以分享给别人一起去玩的元宇宙体验。从这个角度看来,如果把云游戏做到极致,所有的游戏都会在云上运行,未来就可能产生很多商业化的机会。首先,游戏不再是分发下载类,而是随时都可能有新上架的玩法,以及像拓展世界、实现超级玩家这样增值服务。其次,跟直播和实时音视频的交互类产品做打通可以把游戏更为泛化。以前只是参与玩游戏的玩家才是游戏用户,它的用户量是很小的,但如果把游戏直播的用户也算是游戏玩家的话,用户的规模会增长好多倍。所以在云游戏融入全真互联网时代的时候,再叠加直播、互动,就可以找到更大的用户基数。 今天所谓的“互联网红利已经见底”是用户数量的见底,细化到每一个细分领域,其渗透率还有很大的发展空间,还可以在其中挖掘商业机会,包括广告、更多互动玩法的增值收入都可以去做。 再讲回到视频云,云计算能干些什么呢?我们用音视频通信技术、用云基础设施可以加速上述进程的推进,同时又可以找到独特的技术价值点,参与到整个商业化的变现链条里——这是我今天想谈的一个环节。

陆振宇

我补充一个环节,是一些关键根技术的缺失——这是行业的问题。关键的根技术我在这里可以举两个例子,第一个例子是GPU。我们都谈到,不管在制作侧还是消费侧都要通过 GPU 来做内容的生产,但首先,GPU 所有的技术都在美国少数公司的手里;其次,这个技术实际上和 30 年前的 GPU 相比只是在架构上和能力上呈线性的增长,并没有其他显著变化,这样的 GPU 不能够支撑未来的全球互联网。头号玩家这样的场景如果只靠 GPU 的堆叠,不管从成本上还是从实践的能力上是做不到我们共同期待的愿景的——这里面就是典型的根技术缺失。

站在华为的角度,我们一定会做长线的投资和技术的攻关,去解决类似于云 GPU 的开发问题——像云 GPU 或者下一代不一样的 GPU —— 如何来解决我们刚才说的场景。这样类似的根技术我们还看到了很多,除了 GPU 以外,网络传输也算是一个。现在我们看到的网络传输都是基于三层、四层来做,比如说网络中最大的一个包是 1500 个字节,1500 实际上是传统互联网在 20 年前、30 年前定义出来的,在当下的很多场景中并非最好的配置,但考虑到大量历史设备的兼容,我们不得不定在 1500。在网络传输上,围绕音视频产品及应用出现的问题能否有 overlay 的网络,或者有其它根技术来解决。在跨地域跨网接入不同网络种类能否有更好的网络体验?这些与网络传输相关的跟技术都是有待突破的。我举的两个例子,总结来说是一些关键根技术的发展制约着音视频产业的发展。

毕玄

从商业端来看,以阿里为例,我们电商领域的手淘在不断努力让整个商品层面往短视频化去发展。这个过程是非常复杂的,商业端有非常强烈的诉求。大家去看一个商品的时候,不希望只是一个简简单单的图片或者一段简单的介绍,最好是有一个非常详细的视频介绍,甚至很多人希望有类似 VR、AR。

像过去一年,我们在 6·18 之类的创新上可以看到非常火爆的 AR 口红。整个商业端非常希望音视频的基础能够往前进步,可以帮助商业把内容往视频这一端转的时候更加简单。再举一个不一样的例子,我们始终认为类似 VR 这种技术的成熟度是一个非常大的问题。但是我们又能在一些垂直场景里面看到它的成熟度是非常高的,比如说 VR 看房。所以我觉得新领域最关键的是从商业这一端找到一些场景。在这些场景里,新技术的落地可能要付出很大的成本,但对业务来讲,其带来的价值也会更高,这样就有助于反向驱动。整个技术的发展我认为是这两方面。

廖念波

在发展及满足客户需求过程中,我们发现一个痛点。在座的各位其实都是视频领域的专业人员,无论是在技术还是商业应用方面都非常熟悉。但在传统的行业里面,强烈的落地需求和短缺的人才以及完整的解决方案之间的矛盾是行业很大的一个痛点。

举个例子,我们曾经服务过一个客户,他是教育领域的创业者,在音视频这一块想要组建一个能够真正落地的人才团队很困难,即使他花长时间去招聘,要组建一个 20 人的团队也是非常难的。在这个过程中,我们可以说是以一种直接进入的驻场方式去帮助他——我们的技术 VP 这个时候直接变成他们的一 CTO,不只帮他做 RTC 的解决方案,还帮他把业务后台的整个技术架构都完成。这对于我们来说可能是比较容易获得的资源,但是对于广大的传统行业,例如金融、教育以及医疗等行业,它有大量的需求,但都不一定能够很快得到满足。所以我觉得这是我们做 RTC 解决方案的价值所在,或者说是一份社会责任。我们提供解决方案,客户只需要直接去使用,就能够很快实现和落地——这是我想说的第一个痛点。第二点是在具体的技术方面,整个世界的技术标准化都还不够,技术领域还是很割裂的。虽然说地球村已经提出很多年了,但是不管从codec 也好,还是传输的协议也好,或者说硬件的 GPU、CPU 这些方面,这些技术都还是被割裂成了几大块,这个过程中给产业、给我们的应用带来了很大的一个困扰。我觉得在标准化这块还有进一步提升的空间。

主持

谢谢各位老师,听上去行业还是有很多痛点,每个老师都举了各不相同的例子,我们也期待各位在新的一年能够解决更多的痛点,引领、推动我们这个行业的发展。下面回到我们的主题,想请问一下各位老师,各位自身在展开技术攻坚和业务发展时,在深耕垂直领域以及扩张业务板块的时候有没有遇到什么难处或者阻力?

李浩

我们属于深耕垂直领域,网心成立时的基础判断是认为未来的计算会变成一个像电网水网一样无处不在,除了云计算还需要边缘端网络。

我们在边缘计算领域沿着传输、存储、运算的路径在规划,但真正开始深耕一个领域,发现碰到的挑战会很多,不存在约定一个时间能走到终点、然后转移注意力再启动第二个产品的情况。例如音视频行业在快速发展,我们提供的传输产品也在时刻和行业的需求、标准赛跑,从 QoS 到 QoE 的质量评价标准变化,到编码技术、网络基础设施进化等,都要花很多精力,所以深耕是无止境的。公司是由有限资源组成,所以想把一个事情做好需要专注度,我们会专注在边缘计算的基础服务领域,在今年会在该领域扩展运算类产品。挑战的话,一个是行业成熟度,新的场景还不够多,需要有足够的耐心。另一个就是新兴领域的人才难得,需要花足够多的精力来找寻,持续提升团队人才密度。

李郁韬

这个问题我想了一下,阻力倒谈不上,但我觉得最大的困难是跟行业的客户一起探索如何更好地运用云原生的部分。举个例子,为什么云原生很重要?在四五年前,一个团队要做一个音视频的应用或者把自己APP视频化,至少需要十几人的团队,同时人员成本也很高。这两年视频发展起来之后,越来越多的应用不需要再去自建,包括 RTC 这种高难度的,非常建议大家使用在场的其中一家或者两家就好了,那个部分真的挺难的。

为什么我们觉得这块儿又不是那么难呢?因为相对来讲,腾讯做的时间较长,有较多经验和沉淀。举两个鲜活的例子:去年,腾讯会议从几千用户增长到 1 亿用户的时候,它是完全云原生的,它用了所有的云技术,包括音视频、容器化等等一系列的技术都是基于云原生去做的,所以它能够做到在疫情期间一周左右的时间就快速扩容到百万级PCU的规模,如果脱离了云,这是不可能实现的。最现实的情况是,疫情爆发那段时间没人会卖服务器,即使买到服务器,也搬不进机房,因为机房的工人几乎都不在。第二个例子是微信视频号。微信视频号从去年决定做直播再到上线,整个功能的开发时间只有两三个月。在这么大体量的一个APP里面,要做到稳定的音视频直播、互动功能,在四五年前是不敢想象能在两三个月里解决的。但它完全基于云去做的话,可以复用云上 PaaS 产品所有的特性,所有踩过的坑他都不用再踩。在今天,我们看到微信视频号的发展速度像火箭一样往上走,所有用直播的,包括在朋友圈发一个直播、在小程序里看直播、在群里发起直播等等全都是用了云的技术去做。总结下来,建议大家用云就好了。

陆振宇

不管是深耕还是做扩张,对于我们来说一个最现实的困难是人不够。我们作为相对的后来者,要花更多的时间把刚才谈到的所有坑都踩一遍,包括很多华为内部的黑科技,我们要把它们都加进来,这也是一个挑战。

我们在深耕这件事情上的思路是,华为本身是一个技术体系,除了华为云,还有大量在历史视频技术的沉淀和积累。我们现在的使命,是快速把华为技术上的沉淀和积累带入到我们视频云所提供的产品上去。比如网络传输,针对 RTC,分三层、四层、七层分别去做网络层、传输层和应用层的优化。这里分别和公司专门做网络各种协议的实验室,做分布式计算的实验室,以及媒体研究院去展开合作。华为体系本身有点复杂,但是里面的扫地僧也很多。我们每天不断地去探访和寻找这些扫地僧,把这些历史上或者说围绕各种场景做的新技术、好的能力运用到我们的产品中间来,这是我们深耕的一个策略。另外,在扩张上我们的做法是充分和用户及合作伙伴去合作。现在,音视频的技术已经被大量运用到政企和传统行业中,而政企和传统行业实际上没有运用视频的技术和能力,但 ISV 和 PSI 成熟的生态已经有了。我们认为,对于视频产业来说,比较重要的是面向这些传统的集成商的赋能。我们如果能把自己觉得已经玩得很熟练的直播、点播、RTC,以及一些比较新的 AR、VR 的能力赋能给传统行业的集成商,那么就能够撬动这些集成商,把这些价值带入到我们传统的行业中间去,这是我们在扩张上所选择的最主要的道路。

毕玄

在扩张方面,基本上各行各业都开始需要音视频的能力。在以前,各行各业做业务系统时系统里基本没有音频和视频,但现在,基本所有的行业只要做业务系统,或多或少都跟音视频有点关系。但我们认为要真正覆盖所有行业基本也不大可能,在扩张的很多行业里,我们更多的是跟生态伙伴一起合作。

在深耕这个层面,我们认为对阿里来讲最重要的是到音视频诉求最为强烈的几个行业里去。因为对音视频诉求越为强烈,它会越快地推动整个音视频技术的发展,包括业务创新。从目前来看,比如大家都做了很多年的互联网娱乐,过去好几年的创新基本上都跟音频或者视频相关,几乎已经没有别的创新方式了。所以我们认为和互联网泛娱行业深度结合有助于这个产业的发展,能够更快地做好这个行业。教育是被大家看到的一个行业,因为教育从单向直播走向了更为互动、实时化的直播体系,跟这个行业的结合非常重要。我觉得像我们这样的厂商跟互联网泛娱创业的企业去结合,最好的一个点是娱乐产业的更新迭代速度非常快,它需要非常快速的创新。而云厂商跟它们的结合是可以互相满足彼此诉求的,我们希望整个音视频产业的技术更好得往前发展,希望业务端能够更快地完成娱乐端的创新想法。

廖念波

关于深耕和扩张,即构有明确的态度。我们首先是要深耕 RTC 实时音视频通讯这一块,因为我们感受到无论是从技术、产品还是服务,这一块都有大量的工作要去做。虽然我们是从 2015 年才开始创业,但我们的主要技术团队在这个行业已经扎根过超过十年。这个行业不是说可以泛泛地去做一下,或者说是泛泛之辈都能够做的,所以即使是已经扎根了很多年的团队也需要进一步的去深耕,去思考如何更好地满足客户的需求,如何更多地结合客户的场景。另一方面,技术的追求是没有止境的,这是我们关于深耕的思路。

同时我们也会做一些扩张。业务的扩张更多的还是围绕 RTC,只要是相关的周边联动所需要的产品和解决方案,我们都会去提供。比如 IM 和实时音视频往往是伴生的,通常有实时的音视频的需求,就有 IM 的需求。同样的道理,在音视频这一块还有 AI 的需求,这部分我们也都会去做。在这个过程中肯定也会有一些矛盾和冲突,比方说资源不够、我们的做得还不够快、客户还不够满意等等,这其实就是我们本身可以去努力、去长时间坚持的一件事。

主持

谢谢各位老师。不知不觉时间就快到了,想问的问题真的太多了。接下来还是把机会留给我们现场的观众朋友。

现场 Q&A

Q:各位老师好,刚才有提到 2020 疫情的影响,主要是切断了人们之间的物理联系,比方说人们不能去学校、不能去公司、不能去超市、不能去电影院、不能去KTV,那么我的问题是从增强人与人之间物理联系这方面考虑有哪些重要的技术或者业务是我们需要去做的,以及如何实现刚才各位老师提到的企业社会责任?谢谢。

我觉得疫情很大程度促进了许多以前在线下完成的交互行为的线上化。线上完成最多的应该就是视频会议,会议除了现在大家感觉到的一些基本的体验以外,最大的挑战还在于线上整体会议的体验跟线下体验的比较明显的差距。包括我们在内的很多公司都一直在想如何更好地突破这个问题。

落到技术层面,我们可以看到里面很大的一个问题还是延时。所以,如何更好地无限逼近延时,不光是我们需要解决的问题,也需要整个社会不断往前去推进,毕竟整个网络的延时都摆在那里了。对我个人而言,我也觉得如果是单就交互这块来说的话,最大的问题可能还是在延时这里。

我补充一点,我觉得疫情确实加速了音视频的应用,并且让用户对新应用的接受度也加快了很多。比方说有研究表明 2020 年用户对线上教育的使用时长达到了 800 亿分钟每个月,这个数据是非常惊人的。我觉得这里还有一个需要所有从业者去关注的一个点,就是安全。在整个过程中我们如何保护用户和客户个人隐私方面的数据,包括他们的权益等等,这是值得我们去关注的,而不只是说更好的体验或者更低的时延等等。

在这一块,我们一直以来都花了大量的精力,例如我们的产品设计或者说是技术的设计,每个环节都会去关注我们推出的产品在个人隐私保护,或者说信息安全这一块,是不是做到了足够的可靠。这些都内化为我们团队的一种能力。

Q:刚才陆总提到了1500字节限制的问题,说它并不适应今天的音视频网络,然后也提到了一点就是您也在呼吁,应该有一个overlay network的出现,但这里边有一些技术的限制。我特别想听您和其他几位大厂的技术专家的看法:在overlay network下,下一代应用的关键技术有哪些很可能即将迎来突破,有哪些仍然是巨大的痛点?

除了overlay,其实还有一种专网。长远来看,音视频是一个技术,而不是一个目的,那么目的实际上是通过更好的网络、更好的计算能力解决客户的问题。我举个例子,华为最近有一个煤矿军团,大家可以去了解一下,昨天我和上海研究所 5G live 的主任交流,在煤矿的场景中间,他们会为一个煤矿建一张端到端5G的专网,就是从最后的接入到核心网,到整个全流程 5G 专网。在这个 5G 专网下,他提供的 RTC 运行环境和我刚才提到的要面临的问题就不存在了。也就是说,在华为看来,在某些场景,特别是行业场景,可以通过专网的形式来解决一些问题。

那反过来如果我给你这个包是 8K 的包,你的 RTC 能做什么,我觉得这是另一种解决问题的思路。比如在煤矿甚至军事等方面,在一些特殊的场景下,音视频的能力怎么帮助解决行业场景的问题,解决网络是第一个问题。第二个,我们再回到互联网。可能在三层、四层和七层都是一个overlay的网,其实 RTC 的概念本身的设定就是音视频在不稳定的互联网基础设施上,怎么搭七层的 overlay 的网络能够更简单、更好地传输音视频。这块要做的还有很多,比如三层是 IP 的 overlay,那么 RTN 的网络也好,或者各家不同名字的网络也好,我相信包括华为在内,都会把这样的服务以产品的形式在线上推出。七层已经有 RTC 了,那么在三层和四层上也会有对应的产品出来,而且专门面向音视频,或者说是音视频传输通道以及音视频传输的 overlay 网络服务。这是我们在两种场景下不同的解决方案。

我也想补充一下,其实我们今天讲 RTC,本质来讲也是在网络协议上做了一些成果。在座的大家做音视频其实都不会再去关心 TCP、UDP 的一些基本特性了,因为今天很多上层的协议已经把这些屏蔽掉了,而且做了很多优化。那我们今天看到的一个发展趋势,它会往不同业务场景更多元化地去推出不同优化的所谓更高层的 overlay 的音视频的传输协议。

举个例子,我们在过去可能用 ATP 协议解决实时传输的问题,但是今天,在很多流媒体传输中,我们要解决采集到上行,以及远程制作中心之间的一些传输问题,我们使用传统广电用得比较多的 SRT 协议。SRT协议本质来讲就是更激进的重传,然后更激进地去解决底层网络的问题。今天我们在海外遇到那么多不同国家的问题,包括我们现在服务的很多大客户,他们都用了很好的 QUIC 优化,用了码率自适应的技术去解决当地体验的问题。今天,从每一个端都会有不同的协议针对性地去解决不同的业务场景,所以,我们预判未来像 SRT 这类标准的协议都会被云服务包装成各式各样的产品来提供给大家,大家在上面调用接口,去选择你的业务场景就OK了。底层技术的话,我相信华为更有发言权了,底层之后应该也会往更适配上层的方向走,未来协议的发展值得期待。

Q:想问一个关于扩张的话题,在扩张一个子方向的时候,是如何去思考的,什么时候决定要不要去扩张这个子方向,如何评估它的人均产出和整个市场规模?我觉得大家都要考虑商业上的问题,不是单纯的技术情怀,我想听听各位专家的一些看法。

我们定位自己是创业公司,所以挺适合回答这个问题,中间三位大厂的老师属于资源很充沛的。扩张子方向的时机选择上,最好是处于市场开始接受新产品或新模式的过程中,有两三家客户在实际场景中已经使用并产生经济价值,可以在投入可控的情况下树立第一个标杆客户。如果真正在完全蓝海市场时去介入,对ToB创业公司来说,如果没有一个很好的客户机会或者持续的资源支持,很难充分验证想法,走到市场成熟。

同时,如果市场上大部分客户都已经采用,产品逐渐标准化,开始进入资源比拼的时候,创业公司介入就有点晚,例如CDN、RTC等。更重要是找到可创新或优化的点,绝大部分创新是渐进式的,颠覆式创新是很难的。对于企业服务赛道如能在客户使用的成熟服务中找到可优化的点,对比他现行方案体验更优或成本更优,会是很好的机会。

我这里可以补充一点小技巧或者说是方法。我觉得在决定要不要进入一个行业或者说要不要去扩张的时候,我们更多的要看我们的输入是否足够,就是在跟客户接触过程中,客户给到我们的反馈或者说我们从中间汲取到的信息是不是足够的。只有输入足够的情况下,你才能够去做一个正确的决策,才能够推出更好的产品。因为有时候你得先在这个赛道里面,然后去做,才有可能成功,如果你的主营业务或者说你拿到的输入信息远远不够的话,就去切入的话,除非是大厂有钱、有人,不然对于创业公司来说是非常难的一件事情,我们还是要尊重概率和客观事实。

都在说大厂,好像大厂不用选择一样,其实我们一样要选择。对于我们来讲也一样,没有无限资源无限投入,所以我们永远在判断每一个市场在发生什么变数,当然这是非常主观的判断。我以视频会议为例,视频会议对我们来讲是一个很多年的市场,它以前很多年都非常稳定,但为什么这个市场突然又火起来?我们觉得最关键的原因是移动端的加入,以前大家开视频会议都是在会议室里开,没有人拿着手机开一个视频会议,但现在移动端的加入导致整个市场发生了巨大变化,因为原来的产品线都没有办法满足新的需求。所以对做选择来讲,我觉得第一点是从主观上判断这个市场会不会发生变数,当然,如果是全新的市场就另当别论。第二个是技术的判断,即这个技术离成熟爆发的点还有多远。关于这一点,相对来讲大厂确实会更有优势,因为小一些的公司必须去赌,把所有宝压在一个方向。但大厂可能可以赌更多的方向——但也不能赌太多。所以我觉得主要是两点,第一是市场的判断,第二是技术的判断。

原文标题:当我们扩张时——技术商业策略圆桌第一弹

文章出处:【微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    28

    文章

    2596

    浏览量

    79951
  • 多媒体
    +关注

    关注

    0

    文章

    480

    浏览量

    36676

原文标题:当我们扩张时——技术商业策略圆桌第一弹

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【书籍评测活动NO.29】RTC程序设计:实时音视频权威指南

    的各个组成部分,以分析其必要性与实现方式。 因此,推荐这本《RTC程序设计:实时音视频权威指南》给大家。 这是一本关于多媒体技术的书。从内容组织来看,对于每个知识点,本书基本上都是先介绍背景,再介绍
    发表于 03-04 17:04

    音视频解码生成:打造你的专属高清影院体验

    在数字化时代,人们对观影体验的要求越来越高。音视频解码生成技术,作为现代多媒体播放的核心,正是为了满足这种需求而不断发展和完善的。通过这项技术,我们可以轻松打造属于自己的高清影院体验。
    的头像 发表于 02-25 14:47 161次阅读

    音视频解码生成:打造极致观影体验的关键技术

    在现代多媒体时代,音视频解码生成技术已成为提供极致观影体验的核心要素。它不仅能够确保音视频数据的高效传输,还能保证播放的流畅性和画质清晰度,为用户带来身临其境的观影享受。 1. 解码生
    的头像 发表于 02-25 14:43 138次阅读

    音视频解码器优化技巧:提升播放体验的关键步骤

    随着数字多媒体内容的爆炸式增长,音视频解码器在现代技术生活中扮演着至关重要的角色。从流畅的在线视频流播放到高质量的本地文件解码,解码器的性能直接影响了我们的观看体验。那么,如何优化
    的头像 发表于 02-21 14:45 223次阅读

    音视频解码生成在多媒体制作中的应用

    音视频解码生成是多媒体制作中不可或缺的一部分,它扮演着将编码的音视频数据转化为可播放、可编辑的内容的关键角色。在多媒体制作的全过程中,音视频
    的头像 发表于 02-21 14:39 103次阅读

    万兴科技发布国内首个音视频多媒体大模型“天幕”

    万兴科技近日正式发布了国内首个音视频多媒体大模型——万兴“天幕”,并宣布大模型研发中心将正式落户马栏山。
    的头像 发表于 02-04 11:42 842次阅读

    音视频

    音视频技术都喜欢深究内部最核心的原理和机制,尤其是ffmpeg这个编解码库,可以说是音视频领域事实上的标准。语音智能算法,语言语义分析和理解,流媒体服务器等高端
    发表于 11-23 08:51

    ESP RTC音视频传输延迟测试

    音视频
    Kevincoooool
    发布于 :2023年11月11日 10:54:02

    HarmonyOS音视频开发概述

    音视频开发指导中,将介绍各种涉及音频、视频播放或录制功能场景的开发方式,指导开发者如何使用系统提供的音视频API实现对应功能。比如使用TonePlayer实现简单的提示音,当设备接收到新消息
    发表于 10-17 16:39

    打造沉浸式专业音视频体验

    视频质量、延迟或控制的情况下进行成本效益设计。AMD 平台可快速适应新兴音视频技术的要求,可通过 AV-over-IP 的方式,采用无损压缩或者深压缩方式进行高质量音视频传输,并在成本
    的头像 发表于 09-06 09:10 423次阅读
    打造沉浸式专业<b class='flag-5'>音视频</b>体验

    音视频矩阵是什么意思 音视频矩阵的主要作用

    音视频矩阵(Audio-Video Matrix)是一种设备或系统,用于管理和控制音频和视频信号的传输和分配。它允许用户根据需求选择和路由不同的音频和视频源,并将它们传输到所需的输出设备,如扬声器、显示器、投影仪等。
    发表于 07-20 15:16 2034次阅读

    AIGC或成为音视频的核心技术之一

    您认为大语言模型的出现和AIGC技术的发展为音视频带来了哪些最直观的变化?
    发表于 07-06 12:47 1283次阅读
    AIGC或成为<b class='flag-5'>音视频</b>的核心<b class='flag-5'>技术</b>之一

    音视频开发:实时传输与处理音视频流的技术与应用

    音视频
    YS YYDS
    发布于 :2023年06月27日 18:20:58

    基于WebAssembly构建Web端音视频通话引擎

    Web技术在发展,音视频通话需求在演进,怎么去实现新的Web技术点在实际应用中的值,以及给我们带来更大的收益是需要我们去探索和实践的。LiveVideoStackCon 2022北京站邀请到田建华
    的头像 发表于 06-26 15:56 471次阅读
    基于WebAssembly构建Web端<b class='flag-5'>音视频</b>通话引擎

    音视频集成是什么 音视频视频有什么区别

    音视频集成是将音频和视频设备、系统和技术进行整合,以实现全面的音视频功能和体验的过程。
    发表于 06-19 17:14 1742次阅读