0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一套代码快速实现一个语音聊天室

BYXG_shengwang 来源:未知 作者:胡薇 2018-06-29 15:52 次阅读

语音聊天在泛娱乐社交行业中有着重要的地位,行业中很多佼佼者也都为用户提供了语音聊天室,甚至有些平台最初就是依托语音聊天起家的。从最初的一对一语音,到以 YY 为引爆点的多人语音群聊,再到现在聚集了一批“音控”且月流水能达到1亿的纯语音社交平台,很多类型的应用中都有语音聊天室,我们来简单列举几个。

语音电台

这是语音聊天室中比较典型的场景。主播可以在直播间中与给听众讲故事、唱歌,内容形式不一而足,观众也可以申请上麦,与主播聊天互动。主要实现的功能就是语音连麦,以及通过消息系统来实现的文字消息功能。看似简单,但是有些优质的语音社交平台能达到每月1亿的流水。

语音开黑

目前还有一些游戏不支持实时语音通话的功能。同时,也有一些王者玩家想收费带青铜小白上分,而游戏中不支持付费带玩,那么语音聊天室成为了满足需求的出口。在一些应用中,玩家可以通过可付费预约的语音聊天室,允许其他玩家预约陪玩的,同时还可以语音开黑。功能上与语音直播相似,只是在这个频道中,不需要增加观众上下麦的逻辑。

以上只是包含了语音聊天的部分场景而已,综上来看,语音聊天室需要满足的主要功能包括:支持多人参与的语音聊天;支持播放背景音乐;支持设置背景图片;

如何实现语音聊天室

要实现一个具备以上功能的语音聊天室,大致可以分为两步:实现语音连麦、支持背景音乐播放。

首先是实现语音连麦。如果要通过自研的方法实现,会相对复杂一些,不仅需要自己部署服务器并做好高并发应对,对编解码器进行优化以解决回声和噪声问题,还要合理部署边缘节点来解决网络延时问题。而以上这些问题,我们早已为开发者解决,并将接口集成于声网 SDK 中。同时,我们为了帮开发者们快速实现,现已正式推出语音聊天室场景化方案。

语音聊天室场景化方案是基于声网视频通话 SDK 实现的。为什么是视频通话 SDK 而不是语音 SDK 呢?视频通话 SDK 支持语音与视频功能。若开发者做好语音聊天室后,还可以根据自己需要在该基础上实现视频连麦。而且,更便于已经开发视频连麦直播的开发者,进一步实现语音聊天室。下图为语音聊天室场景化方案的架构图与实现思路:

首先,房主一端创建 RtcEngine 对象,并填入 App ID。通过setChannelProfile 将频道设置为直播模式。然后用 setClientRole 来设定主播(Broadcaster)和观众(Audience)的角色。在主播或观众离开房间时,通过调用LeaveChannel来完成。我们可以通过一张图,来了解语音聊天室中接口调用逻辑:

其次,我们还可以为语音聊天室增加背景音乐。主播可以在自己的客户端上选择要播放的音乐,然后通过 SDK 的 AudioMixing 接口在本地与主播语音混音后播放给连麦听众和普通听众。

观众上下麦、主播离开房间、聊天背景图片的切换等控制消息,都会通过消息系统来实现。消息服务器还承载着另一个任务,就是传输用户在来聊天室中的文字消息的传输。

最后,考虑到在娱乐直播、游戏开黑、社交,甚至是教育场景下的语音聊天室,对于声音的码率、采样率、声道数的需求都有细微差别。我们在SDK中,还提供了“设置音质”的接口,即 setAudioProfile,供开发者根据实际听到的效果来自由调整。

举个例子,如果做的是娱乐方向的应用,会遇到听众频繁上下麦,并且需要48 KHz采样率、音乐编码、双声道、编码码率 192 kbps,那么可按照上述代码来设置 profile、scenario。SDK 中对这个接口的 profile 与 scenario 各有5个不同的参数设置,具体大家可点击「阅读原文」查看 setAudioProfile 的详细文档。

声网语音聊天室场景化方案

有些开发者希望以语音社交切入泛娱乐市场,也有一些市场上的视频社交玩家,希望加入语音聊天室,来进一步拓展市场版图。由于该场景方案是基于声网视频通话 SDK 实现,可以同时满足以上两种需求。

我们在 Github 已经提供了一套完整的 Demo,大家可以点击「阅读原文」在开发者文档中心获取。在 Demo 的基础上,开发者只需要不到1周的时间,对 UI 和功能做简单修改即可准备测试上线。语音聊天室场景化方案的优势包括:

76ms 低延时

声网 SDK 实现了全球平均端到端76ms 的实时音视频低延时传输。声网Agora SD-RTN™ 实时通信网络采用私有 UDP 协议进行传输,基于软件定义优化路由选择最优传输路径,自动规避网络拥塞和骨干网络故障带来的影响。同时,根据我们的统计,除了电信、联通、移动三大运营商,全国还有约2%的小运营商用户。声网也已覆盖支持了这2%用户所在的数十家中小运营商。

44.1KHz 高音质

对于面向“音控”用户的产品来讲,必须要保证主播音质和背景乐音质的还原度。声网语音聊天室场景化方案能保证低延时传输的同时,支持192Kbps 44.1KHz 高音质语音。

快速且易于集成

通过几个接口的调用即可实现语音聊天室。对于初次接触声网 SDK 的开发者,我们还提供了完成度较高的 Demo,开发者在根据自己的需求修改 UI 与功能后,即可在短时间内完成产品原型的开发。同时,SDK 已经为开发者提供消息系统,可以直接通过接口调用。

高灵活度与扩展性

基于该方案开发的泛娱乐社交产品,可以在无需增加新 SDK 的情况下,进一步实现视频聊天室。同时,对于声网的老用户来讲,在原先视频连麦产品的基础上,快速实现语音聊天室。另外,声网 SDK 还为开发者提供更多接口来进一步实现更多功能。

目前,专注于语音社交的荔枝,在游戏开黑方面的佼佼者 HeyHey,以及在海外市场做得风生水起的直播应用 Yalla 都在使用由声网 SDK 提供的实时音视频服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SDK
    SDK
    +关注

    关注

    3

    文章

    962

    浏览量

    44640

原文标题:从底层核心到UI,一套代码快速实现语音聊天室

文章出处:【微信号:shengwang-agora,微信公众号:声网Agora】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛,还可以语音对话

    起来非常便捷;而更换EMMC就麻烦了很多。另外点更重要的是,如果手上有多台设备,可以用张卡玩遍所有设备,而不需要每一套设备都需要单独烧录
    发表于 04-12 12:41

    UEFIRC:运行于UEFI环境下的IRC聊天室

    据悉,开源开发者Phillip Tennen展示了基于UEFI的沉浸式IRC网络聊天室:UREFIRC原型设计。该设计无需进入操作系统,仅在UEFI环境内运行。
    的头像 发表于 04-08 16:16 295次阅读

    请问DAVE的应用程序可以作为一套代码配置多外设配置吗?

    ADCPUDIONDENDUCTION,我想要实际:设定标志位,通过标识位决定采样方式,并配置好使用的 APPPPPANG。如果我使用了单采样,那么 APP配置ADC电流采样
    发表于 01-25 08:08

    鸿蒙原生应用/元服务开发-新版本端云体化模板体验反馈

    、前言 云端体化模板是基于Serverless服务构建的一套模板,提供了应用生态常见场景需求的代码实现,开发者可将所需能力
    发表于 12-05 14:57

    使用C语言写的一个轻量级聊天应用!

    SmallChat支持文本、图片、语音和视频等多种聊天方式。用户可以在聊天窗口中输入文字,并发送图片、语音和视频消息。同时,还支持多人语音
    的头像 发表于 11-17 16:27 854次阅读
    使用C语言写的一个轻量级<b class='flag-5'>聊天</b>应用!

    怎么和ChatGPT语音聊天

    ChatGPT语音聊天免打字输入、训练外语口说能力的好帮手。 ChatGPT手机App的语音聊天功能是陆续开放给全球Plus用户,ChatGPT Plus用户先确认App是否已经更新到
    的头像 发表于 11-14 17:36 2038次阅读
    怎么和ChatGPT<b class='flag-5'>语音</b><b class='flag-5'>聊天</b>?

    有没有种基于STM32的远程视频语音聊天互动的小车?

    就是可以远程跟别人视频聊天的WiFi小车,车上面也接屏幕,反正我感觉好难。。。 “主要由四轮小车,摄像头,显示器,扬声器,以及中央控制部分构成。以实现
    发表于 11-04 10:32

    AT32上实现关键词语音识别(KWS)

    AT32上实现关键词语音识别(KWS)本文基于此开源模型和代码,在AT32 MCU 上对KWS 效果进行展示。
    发表于 10-26 07:45

    离线语音与IoT结合:智能家居发展新增长点

    具有以下特点: 1、离线语音控制,快速响应和可靠性:不需联网,即可实现离线语音控制。由于离线语音控制是在设备本地进行处理,不需要依赖云服务器
    发表于 10-17 11:06

    如何使用PSIO实现ARGB2照明效果

    、PS/2、微电、Wiegand和LED。这个示例代码显示如何使用PSIO来实施控制 ARGB2 LED 时间序列和彩虹波效应,并使用一套定时器定期更新 ARGB2 LED的颜色,以及一套用于选择执行模式
    发表于 08-29 07:30

    使用多个EADC采样模块取样EADC频道来实现最大采样频率

    V3.0 本示例代码使用多个EADC取样模块取样EADC频道,以实现最大采样频率。 M480系列的模拟输入渠道有两种,它们既快又慢。CH10~15是
    发表于 08-29 06:07

    智能语音开放平台选哪家,启英泰伦提供硬件、软件体化开发服务

    和降低了开发难度。 【小语种语音模型开发】:上传小语种命令词文件和少量录音音频文件,即可通过平台自动进行训练,从而识别小语种的语音识别。 03固件在线测试 做好的固件不清楚语音识别效果怎么办,自己搭建
    发表于 08-17 14:00

    分享一套财务数据分析模板,零开发,更好用

    分析项目中摸索出一套系统化的财务数据分析模板,可令人在短时间内深度分析财务数据,掌握企业经营管理健康情况,为决策提供助力。 奥威BI财务数据分析模型介绍 这是一套基于奥威BI数据可视化工具的系统化
    发表于 08-15 10:47

    51单片机使用哈佛结构,它RAM和ROM的总线是同一套总线分时复用的还是两总线?

    51单片机使用哈佛结构,它RAM和ROM的总线是同一套总线分时复用的还是两总线?
    发表于 05-09 16:03

    全自动洗衣机的设计方案

    最近发现16进制很好用,于是出了设计方案。程序,报错,显示使用同一套方案。水位0-3,占2位。洗衣0-3,占2位。漂洗0-3,占2位脱水0-3,占2位比如显示:2213意思是水位2,洗2次,漂1次,脱3次。
    发表于 04-21 12:19