一套代码快速实现一个语音聊天室-电子发烧友网

语音聊天在泛娱乐社交行业中有着重要的地位，行业中很多佼佼者也都为用户提供了语音聊天室，甚至有些平台最初就是依托语音聊天起家的。从最初的一对一语音，到以 YY 为引爆点的多人语音群聊，再到现在聚集了一批“音控”且月流水能达到1亿的纯语音社交平台，很多类型的应用中都有语音聊天室，我们来简单列举几个。

语音电台

这是语音聊天室中比较典型的场景。主播可以在直播间中与给听众讲故事、唱歌，内容形式不一而足，观众也可以申请上麦，与主播聊天互动。主要实现的功能就是语音连麦，以及通过消息系统来实现的文字消息功能。看似简单，但是有些优质的语音社交平台能达到每月1亿的流水。

语音开黑

目前还有一些游戏不支持实时语音通话的功能。同时，也有一些王者玩家想收费带青铜小白上分，而游戏中不支持付费带玩，那么语音聊天室成为了满足需求的出口。在一些应用中，玩家可以通过可付费预约的语音聊天室，允许其他玩家预约陪玩的，同时还可以语音开黑。功能上与语音直播相似，只是在这个频道中，不需要增加观众上下麦的逻辑。

以上只是包含了语音聊天的部分场景而已，综上来看，语音聊天室需要满足的主要功能包括：支持多人参与的语音聊天；支持播放背景音乐；支持设置背景图片；

如何实现语音聊天室

要实现一个具备以上功能的语音聊天室，大致可以分为两步：实现语音连麦、支持背景音乐播放。

首先是实现语音连麦。如果要通过自研的方法实现，会相对复杂一些，不仅需要自己部署服务器并做好高并发应对，对编解码器进行优化以解决回声和噪声问题，还要合理部署边缘节点来解决网络延时问题。而以上这些问题，我们早已为开发者解决，并将接口集成于声网 SDK 中。同时，我们为了帮开发者们快速实现，现已正式推出语音聊天室场景化方案。

语音聊天室场景化方案是基于声网视频通话 SDK 实现的。为什么是视频通话 SDK 而不是语音 SDK 呢？视频通话 SDK 支持语音与视频功能。若开发者做好语音聊天室后，还可以根据自己需要在该基础上实现视频连麦。而且，更便于已经开发视频连麦直播的开发者，进一步实现语音聊天室。下图为语音聊天室场景化方案的架构图与实现思路：

首先，房主一端创建 RtcEngine 对象，并填入 App ID。通过setChannelProfile 将频道设置为直播模式。然后用 setClientRole 来设定主播（Broadcaster）和观众（Audience）的角色。在主播或观众离开房间时，通过调用LeaveChannel来完成。我们可以通过一张图，来了解语音聊天室中接口调用逻辑：

其次，我们还可以为语音聊天室增加背景音乐。主播可以在自己的客户端上选择要播放的音乐，然后通过 SDK 的 AudioMixing 接口在本地与主播语音混音后播放给连麦听众和普通听众。

观众上下麦、主播离开房间、聊天背景图片的切换等控制消息，都会通过消息系统来实现。消息服务器还承载着另一个任务，就是传输用户在来聊天室中的文字消息的传输。

最后，考虑到在娱乐直播、游戏开黑、社交，甚至是教育场景下的语音聊天室，对于声音的码率、采样率、声道数的需求都有细微差别。我们在SDK中，还提供了“设置音质”的接口，即 setAudioProfile，供开发者根据实际听到的效果来自由调整。

举个例子，如果做的是娱乐方向的应用，会遇到听众频繁上下麦，并且需要48 KHz采样率、音乐编码、双声道、编码码率 192 kbps，那么可按照上述代码来设置 profile、scenario。SDK 中对这个接口的 profile 与 scenario 各有5个不同的参数设置，具体大家可点击「阅读原文」查看 setAudioProfile 的详细文档。

声网语音聊天室场景化方案

有些开发者希望以语音社交切入泛娱乐市场，也有一些市场上的视频社交玩家，希望加入语音聊天室，来进一步拓展市场版图。由于该场景方案是基于声网视频通话 SDK 实现，可以同时满足以上两种需求。

我们在 Github 已经提供了一套完整的 Demo，大家可以点击「阅读原文」在开发者文档中心获取。在 Demo 的基础上，开发者只需要不到1周的时间，对 UI 和功能做简单修改即可准备测试上线。语音聊天室场景化方案的优势包括：

76ms 低延时

声网 SDK 实现了全球平均端到端76ms 的实时音视频低延时传输。声网Agora SD-RTN™ 实时通信网络采用私有 UDP 协议进行传输，基于软件定义优化路由选择最优传输路径，自动规避网络拥塞和骨干网络故障带来的影响。同时，根据我们的统计，除了电信、联通、移动三大运营商，全国还有约2%的小运营商用户。声网也已覆盖支持了这2%用户所在的数十家中小运营商。

44.1KHz 高音质

对于面向“音控”用户的产品来讲，必须要保证主播音质和背景乐音质的还原度。声网语音聊天室场景化方案能保证低延时传输的同时，支持192Kbps 44.1KHz 高音质语音。

快速且易于集成

通过几个接口的调用即可实现语音聊天室。对于初次接触声网 SDK 的开发者，我们还提供了完成度较高的 Demo，开发者在根据自己的需求修改 UI 与功能后，即可在短时间内完成产品原型的开发。同时，SDK 已经为开发者提供消息系统，可以直接通过接口调用。

高灵活度与扩展性

基于该方案开发的泛娱乐社交产品，可以在无需增加新 SDK 的情况下，进一步实现视频聊天室。同时，对于声网的老用户来讲，在原先视频连麦产品的基础上，快速实现语音聊天室。另外，声网 SDK 还为开发者提供更多接口来进一步实现更多功能。

目前，专注于语音社交的荔枝，在游戏开黑方面的佼佼者 HeyHey，以及在海外市场做得风生水起的直播应用 Yalla 都在使用由声网 SDK 提供的实时音视频服务。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

SDK

SDK

+关注

关注
3

文章
962

浏览量
44640

原文标题：从底层核心到UI，一套代码快速实现语音聊天室

文章出处：【微信号：shengwang-agora，微信公众号：声网Agora】欢迎添加关注！文章转载请注明出处。

【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛，还可以语音对话

起来非常便捷；而更换EMMC就麻烦了很多。另外一点更重要的是，如果手上有多台设备，可以用一张卡玩遍所有设备，而不需要每一套设备都需要单独烧录一个

发表于 04-12 12:41

UEFIRC：运行于UEFI环境下的IRC聊天室

据悉，开源开发者Phillip Tennen展示了基于UEFI的沉浸式IRC网络聊天室：UREFIRC原型设计。该设计无需进入操作系统，仅在UEFI环境内运行。

发表于 04-08 16:16 •295次阅读

请问DAVE的应用程序可以作为一套装代码配置多套外设配置吗？

ADCPUDIONDENDUCTION，我想要实际：设定一个标志位，通过标识位决定采样方式，并配置好使用的 APPPPPANG。如果我使用了单采样，那么 APP配置一个ADC电流采样

发表于 01-25 08:08

鸿蒙原生应用/元服务开发-新版本端云一体化模板体验反馈

一、前言云端一体化模板是基于Serverless服务构建的一套模板，提供了应用生态常见场景需求的代码实现，开发者可将所需能力

发表于 12-05 14:57

使用C语言写的一个轻量级聊天应用！

SmallChat支持文本、图片、语音和视频等多种聊天方式。用户可以在聊天窗口中输入文字，并发送图片、语音和视频消息。同时，还支持多人语音和

发表于 11-17 16:27 •854次阅读

怎么和ChatGPT语音聊天？

ChatGPT语音聊天免打字输入、训练外语口说能力的好帮手。 ChatGPT手机App的语音聊天功能是陆续开放给全球Plus用户，ChatGPT Plus用户先确认App是否已经更新到

发表于 11-14 17:36 •2038次阅读

有没有一种基于STM32的远程视频语音聊天互动的小车？

就是可以远程跟别人视频聊天的WiFi小车，车上面也接一个屏幕，反正我感觉好难。。。 “主要由四轮小车，摄像头，显示器，扬声器，以及中央控制部分构成。以实现

发表于 11-04 10:32

AT32上实现关键词语音识别（KWS）

AT32上实现关键词语音识别（KWS）本文基于此开源模型和代码，在AT32 MCU 上对KWS 效果进行展示。

发表于 10-26 07:45

离线语音与IoT结合：智能家居发展新增长点

具有以下特点： 1、离线语音控制，快速响应和可靠性：不需联网，即可实现离线语音控制。由于离线语音控制是在设备本地进行处理，不需要依赖云服务器

发表于 10-17 11:06

如何使用PSIO实现ARGB2照明效果

、PS/2、微电、Wiegand和LED。这个示例代码显示如何使用PSIO来实施控制 ARGB2 LED 时间序列和彩虹波效应,并使用一套定时器定期更新 ARGB2 LED的颜色,以及一套用于选择执行模式

发表于 08-29 07:30

使用多个EADC采样模块取样一个EADC频道来实现最大采样频率

V3.0 本示例代码使用多个EADC取样模块取样一个EADC频道,以实现最大采样频率。 M480系列的模拟输入渠道有两种,它们既快又慢。CH10~15是

发表于 08-29 06:07

智能语音开放平台选哪家，启英泰伦提供硬件、软件一体化开发服务

和降低了开发难度。【小语种语音模型开发】：上传小语种命令词文件和少量录音音频文件，即可通过平台自动进行训练，从而识别小语种的语音识别。 03固件在线测试做好的固件不清楚语音识别效果怎么办，自己搭建

发表于 08-17 14:00

分享一套财务数据分析模板，零开发，更好用

分析项目中摸索出一套系统化的财务数据分析模板，可令人在短时间内深度分析财务数据，掌握企业经营管理健康情况，为决策提供助力。奥威BI财务数据分析模型介绍这是一套基于奥威BI数据可视化工具的系统化

发表于 08-15 10:47

51单片机使用哈佛结构，它RAM和ROM的总线是同一套总线分时复用的还是两套总线？

51单片机使用哈佛结构，它RAM和ROM的总线是同一套总线分时复用的还是两套总线？

发表于 05-09 16:03

一个全自动洗衣机的设计方案

最近发现16进制很好用，于是出了一个设计方案。程序，报错，显示使用同一套方案。水位0-3，占2位。洗衣0-3，占2位。漂洗0-3，占2位脱水0-3，占2位比如显示:2213意思是水位2，洗2次，漂1次，脱3次。

发表于 04-21 12:19

搜索历史

一套代码快速实现一个语音聊天室

评论

【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛，还可以语音对话

UEFIRC：运行于UEFI环境下的IRC聊天室

请问DAVE的应用程序可以作为一套装代码配置多套外设配置吗？

鸿蒙原生应用/元服务开发-新版本端云一体化模板体验反馈

使用C语言写的一个轻量级聊天应用！

怎么和ChatGPT语音聊天？

有没有一种基于STM32的远程视频语音聊天互动的小车？

AT32上实现关键词语音识别（KWS）

离线语音与IoT结合：智能家居发展新增长点

如何使用PSIO实现ARGB2照明效果

使用多个EADC采样模块取样一个EADC频道来实现最大采样频率

智能语音开放平台选哪家，启英泰伦提供硬件、软件一体化开发服务

分享一套财务数据分析模板，零开发，更好用

51单片机使用哈佛结构，它RAM和ROM的总线是同一套总线分时复用的还是两套总线？

一个全自动洗衣机的设计方案