0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

理论到操作实现 让AI玩具机器人等智能硬件在嘈杂环境中只听我说话

ListenAI 来源:jf_40317719 作者:jf_40317719 2025-10-17 17:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

【理论到操作实现】让AI玩具机器人智能硬件在嘈杂环境中只听我说话

前言

本文分享的小聆AI相关的理论和声纹技术,主要是用来提升 AI 智能玩具、机器人等智能硬件在实际场景的语音交互体验。在用户使用中通常会遇到这些问题:1、身边人交谈干扰;2、用户发音模糊;3、玩具碰撞声、哭闹声等突发高频噪声易被声学 VAD 误判为语音;4、呼吸声、风声等高频干扰导致语音失真。针对这些影响人机交互的常见问题,小聆AI做了对应处理,并在小程序端增加了单独人声虑噪的配置功能,大家按照文章中的步骤操作即可自主实现智能硬件对应功能。下方视频为实际人机交互场景中的率噪效果。

https://docs2.listenai.com/z/233.mp4

单独人声虑噪的实现理论

为保证AI玩具机器人等智能硬件在嘈杂环境中只听“我”说话的效果,从以下几点进行了优化:

1、 语音VAD优化:消除非人声噪声,不响应常见家居噪声(如风扇、电视等)

2、 声纹过滤:对人声进行声纹对比,只保留指定声纹的音频

3、 语义VAD噪声过滤:分析上下文语义,用户附和时不打断播报,用户犹豫、停顿延长拾音时间

实现步骤

1、 准备一个语音交互硬件,可以是CSK6大模型开发板、聆思Arcs mini大模型MCP开发板、也可以是ESP32语音模组

2、 打开“小聆AI”小程序,点击添加设备,选择对应硬件按提示操作即可完成绑定进行配置 (ESP32的开发板可以选择【开源套件】)

3、 绑定成功后,进入【语音识别配置】→【识别模式】→ 【仅识别已注册声纹的用户】

识别默认默认为【所有人】

识别已注册声纹的用户:在连续交互模式下,仅识别已注册声纹的用户语音,如果只想让AI语音只回复指定人可以选择这项

识别唤醒设备的用户:在连续交互模式下,仅支持唤醒设备的用户继续交互,其余人的语音将不会被识别 (可以理解为AI语音只回复用名字叫醒它的那个人)

4、 点击【确认】后,进入声纹注册页面,点击【开始录音】,按文本读完后点击创建即可。

5、 声纹创建成功后会进入声纹对应的【编辑画像】界面,这个页面可以手动填入声纹主人的兴趣爱好、需要AI长期记忆的内容。

画像编辑完成后返回【识别模式】界面,选择【仅识别已注册声纹的用户】即可实现视频中的效果。

小聆AI语音交互的更多资料和玩法实现参考

小聆AI详细配置参考:https://docs2.listenai.com/x/S_TEd8h7C

零代码克隆原神可莉实现桌面陪伴参考: https://docs2.listenai.com/x/x7CVdoQI3

更多个性配置方法可以参考官方开发文档:https://docs2.listenai.com/x/S_TEd8h7C

CSK6大模型开发板的硬件资料:https://docs2.listenai.com/x/nTn9kMMCU

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41834

    浏览量

    302983
  • 声纹
    +关注

    关注

    0

    文章

    26

    浏览量

    4571
  • 大模型
    +关注

    关注

    2

    文章

    3854

    浏览量

    5289
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2026年国十大机器视觉公司的决胜逻辑:全栈能力与场景深耕

    AI+3D视觉为核心的智能机器人科技公司,其优势在于3D视觉引导工业机器人技术。产业链,其向
    发表于 05-15 09:16

    基于米尔RK3576核心板的国产割草机器人解决方案

    割草机器人提供了一颗真正的“中国芯”。该方案不仅实现了厘米级定位与毫秒级避障,更在数据安全与供应链韧性上提供了坚实保障,助力中国智造在庭院机器人赛道上实现弯道超车。 一、
    发表于 04-24 17:31

    为什么说关节扭矩传感器是高端机器人的“触觉神经”?

    操作:完成毫米级、毫牛级任务 精密装配、手术机器人领域,扭矩传感器能分辨0.01牛米的力矩变化。例如,手术机器人缝合血管时,传感器实时反
    发表于 04-17 17:27

    相约机器人展:杰和科技携边缘AI硬件方案重磅亮相

    解决方案及高性能AI算力模组重磅亮相,集中展示工业机器人、特种机器人、服务机器人领域的前沿控
    的头像 发表于 04-15 09:02 444次阅读
    相约<b class='flag-5'>机器人</b>展:杰和科技携边缘<b class='flag-5'>AI</b><b class='flag-5'>硬件</b>方案重磅亮相

    智能机器人从0到1系统入门课程 带源码课件 百度网盘下载

    机器人 AI 交互:语音识别 + 视觉识别入门实践 人工智能技术飞速演进的当下,机器人正从冰冷的自动化设备向具备感知能力的
    发表于 04-11 16:41

    艾络迅亮相阿里云通义智能硬件展,AI陪伴机器人方案引领行业新风向

    1月8日,阿里云通义智能硬件深圳海上世界文化艺术中心盛大开幕。移远通信旗下物联网智能品牌艾络迅携最新升级的AI陪伴
    的头像 发表于 01-08 19:12 631次阅读
    艾络迅亮相阿里云通义<b class='flag-5'>智能</b><b class='flag-5'>硬件</b>展,<b class='flag-5'>AI</b>陪伴<b class='flag-5'>机器人</b>方案引领行业新风向

    探索RISC-V机器人领域的潜力

    应用,特别是机器人操作系统领域的可行性。MUSE Pi Pro以其强大的K1 AI CPU和官方对主流开源软件栈的积极适配,成为了一个非常有吸引力的选择。 二、 硬件初窥:性能小钢炮
    发表于 12-03 14:40

    高精度机器人控制的核心——基于 MYD-LT536 开发板的精密运动控制方案

    算法与 C++ 实时模块开发; - 可作为控制核心部署高精度测量机器人、激光切割机械臂、协作机械臂、AGV导航车系统; - 具备机器人
    发表于 11-14 15:48

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    机器人· 应用领域:迎宾机器人、养老机器人、导览机器人· 多摄像头输入:同时实现人脸识别(迎宾)、跌倒检测(养老)、自主导航避障(导览)
    发表于 10-29 16:41

    小萝卜机器人的故事

    经过我的申请, 马老师发放了, 小萝卜机器人的, 开发权限, 原来的小萝卜公司, 因为经营不善倒闭, 作为科研产品, 几个技术对此惋惜, 自掏腰包, 要让小萝卜机器人, 再生, 每次听到小萝卜说
    发表于 10-23 05:24

    再掀语音交互革命,广和通AI解决方案加速机器人听觉进化

    机器人世界里,感知是智能化的第一步,是机器人获取环境信息,学习适应并自主决策的前提。听觉作为五感之一,深度融合
    的头像 发表于 08-26 17:44 1110次阅读

    机器人竞技幕后:磁传感器芯片激活 “精准感知力”

    2025 世界人形机器人运动会于 8 月 17 日圆满收官,赛场上机器人在跑步、跳跃、抓取项目中的精彩表现,背后是运动控制、环境感知技术
    发表于 08-26 10:02

    工业机器人的特点

    的基础,也是三者的实现终端,智能制造装备产业包括高档数控机床、工业机器人、自动化成套生产线、精密仪器仪表、智能传感器、汽车自动化焊接线、柔性自动化生产线、
    发表于 07-26 11:22

    具身智能硬件真正“活”起来 商汤科技机器人说话,需要几步?

    交互能力! 第一步:打开机器人,连接机器人; 第二步:机器人系统,解压“日日新V6软件包”,运行配置界面,配置API KEY并点击开始,
    的头像 发表于 06-06 14:25 1580次阅读

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    接口则语音机器人可以连接到互联网,实时获取最新的信息,增强其智能性和交互能力。 实际应用场景,以
    发表于 05-28 11:36