0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开发者说 | AI操控机器人系列第三期——语音控制

地瓜机器人 2022-08-17 11:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摘要:

AI操控机器人系列第二期的人体跟随教程中,身为地平线资深程序员的奶爸朱靠,使用地平线发布的机器人开发平台TogetherROS软件栈,搭建了人体跟随机器人。

同为开发者的梁雪,期待AI的世界,想让自己的生活也AI一把,并且一向是个能动口绝不动手的懒人,于是热衷于体验各类AI机器人,尤其是动动口就能操控的机器人,想着有朝一日过上“能只动口绝不动手”的生活,于是乎,就有了下面的这些体验。

产品A:说说话确实是能跟着走一走,but,我真的不想说完话之后还需要自己向右转才能引导它右转呀……

产品B:为什么还是得动动手,遥控来操控……噢,可达不到懒人预期呢。

难道就没有动动口就能让机器人运动,达到控制机器人的目的吗?答案必然是,有!下面地平线AI操控机器人系列——语音控制闪亮登场。

一、功能介绍

大家先看一下最终实现的功能。

20220815-190006.gif

从开始语音到机器人依据指令快速且准确的运动,得益于地平线旭日®️X3派上5Tops算力的BPU,可以实现低延迟算法推理能力,以及语音算法模块实现的远场(3~5米)降噪、回声消除,高准确率的asr识别功能。开始码代码前,先来简单分析一下人体跟随机器人需要具备哪些基本模块。

语音输入——麦克风

旭日X3派采用的是麦克风阵列硬件拾音,通过麦克风采集到音频之后交给后面的智能语音分析模块处理。

智能语音感知

智能语音算法对原始音频进行处理,对音频进行降噪并且识别出语音,同时还能输出语音声源定位的DOA角度。

交互

识别出语音之后,定义并且实现不同语音对应的不同功能应用,比如“向前走”语音控制机器人向前运动。

控制

根据“交互”模块输出的控制指令,实现对机器人的机械控制。

机器人本体

当然还需要一个具备运动能力的机器人本体,接收控制指令并控制电机运动,最终实现通过语音控制机器人运动的效果。

地平线发布的机器人开发平台TogetherROS软件栈内置了丰富易用的机器人开发组件,包含搭建一个智能机器人应用(如机器人语音控制)所涉及到的所有功能模块,完全开源免费,并允许开发者二次开发。

二、准备工作

准备搭建机器人人体跟随应用案例的硬件设备和软件包。

硬件

①旭日X3派

3.png


②麦克风阵列及转接板

640.jpg


③机器人

5.png


本次使用本末的轮足机器人来介绍,没有的开发者们也不用担心,文章后面会介绍自己搭建机器人的方式。

安装系统
参考旭日X3派的用户手册的安装系统章节,安装完成(或者已经安装过)需要更新系统。

系统配置
配置旭日X3派的无线网络,参考旭日X3派的用户手册的无线网络章节。

安装TogetherROS
使用apt命令通过DEB包安装TogetherROS。登录旭日X3派ssh root@192.168.1.147,执行命令:

root@ubuntu:~# sudo apt install hhp
root@ubuntu:/userdata# ls /opt/
tros

可以看到TogetherROS已安装在/opt目录下,说明安装成功。至此,准备工作结束,下面开始使用这些硬件设备和软件包搭建机器人人体跟随App。

三、使用介绍

接下来开始操作各个功能模块,再一步步组装起来,分别验证其功能。

安装音频麦克风

首先需要将旭日X3派与音频转接板连接起来,安装好的旭日X3派以及音频板图如下:

接口.jpg


直接使用TogetherROS中的ROS package测试麦克风阵列的功能,通过脚本加载麦克风阵列驱动,并且启动智能语音识别模块。登录旭日X3派ssh root@192.168.1.147后,在终端(以下默认终端都是通过ssh登录)中输入以下命令启动:

# 配置TogetherROS环境
source /opt/tros/setup.bash
# 从TogetherROS的安装路径中拷贝出运行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .
# 加载音频驱动,设备启动之后只需要加载一次
bash config/audio.sh
#启动launch文件
ros2 launch hobot_audio hobot_audio.launch.py

智能语音识别模块默认发布的智能语音消息话题名为:/audio_smart, 在另一个终端执行使用ros2 topic list命令可以查询到此topic信息:

$ ros2 topic list
/audio_smart

语音识别和命令词控制小车运动功能

旭日X3派上打开一个终端,启动语音识别和控制的脚本

# 配置TogetherROS环境
source /opt/tros/setup.bash
# 从TogetherROS的安装路径中拷贝出运行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .
# 加载音频驱动,设备启动之后只需要加载一次
bash config/audio.sh
#启动launch文件
ros2 launch audio_control hobot_audio_control.launch.py

在当前终端执行ros2 topic echo /cmd_vel命令查询旭日X3派上的话题信息,当语音控制“向前走”,终端输出如下:

linear:
  x: 0.30000001192092896
  y: 0.0
  z: 0.0
angular:
  x: 0.0
  y: 0.0
  z: 0.0

说明智能语音识别算法和交互功能的软件包已安装成功,并能够通过/cmd_vel话题对外发布机器人运动控制消息。

将旭日X3派安装在机器人上

首先,需要将音频板安装在旭日X3派上,其次,将安装了线性四麦麦克风阵列的旭日X3派直接固定在机器人上,并将机器人的USB控制接口插到旭日X3派上。安装效果如下图:

10 (3).jpg

安装好后,可以通过控制机器人运动查看是否成功安装。在旭日X3派上启动本末双足机器人运行控制Node,打开一个终端,执行如下命令:

# 配置TogetherROS环境
source /opt/tros/setup.bash
#启动本末机器人运动控制package
ros2 run diablo_sdk ros_bridge_example

旭日X3派上重新打开一个终端,通过发布/cmd_vel话题消息控制机器人以0.3r/s的速度转动:


# 配置TogetherROS环境
source /opt/tros/setup.bash
ros2 topic pub -r 10 /cmd_vel geometry_msgs/Twist '{linear: {x: 0, y: 0, z: 0}, angular: {x: 0, y: 0, z: 0.3}}'

机器人收到控制指令后转动的效果如下:

转.gif

四、完整的机器人语音控制效果

旭日X3派上打开一个终端,启动智能语音识别和语音控制脚本

# 配置TogetherROS环境
source /opt/tros/setup.bash
# 从TogetherROS的安装路径中拷贝出运行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .
# 加载音频驱动,设备启动只需要加载一次
bash config/audio.sh
#启动语音控制launch文件
ros2 launch audio_control hobot_audio_control.launch.py

旭日X3派上打开一个终端,启动机器人运动控制Node

# 配置TogetherROS环境
source /opt/tros/setup.bash
#启动本末机器人运动控制Node
ros2 run diablo_sdk ros_bridge_example

通过语音控制机器人运动

20220815-190006.gif

五、原理分析

对于一个复杂的机器人系统,一般在机器人上配置上位机和下位机两种处理器。语音控制机器人由两部分组成,分为上位机和下位机。各部分详细组成如下图:

17.jfif

!

六、语音控制进阶

智能语音识别Node中,设备唤醒词和命令词默认配置/opt/tros/lib/hobot_audio/config/hrsc/cmd_word.json文件下(当然,若用户将此config文件夹拷贝到了其他路径,那以实际使用的配置路径为准):

{
    "cmd_word": [
        "地平线你好",
        "向前走",
        "向后退",
        "向左转",
        "向右转",
        "停止运动"
    ]
}

配置文件的第一项为唤醒词,后面的是命令词,用户可以根据需要进行配置,实现语音操作的自定义。

本文转自地平线开发者社区,完整文章内容详见:https://developer.horizon.ai/forumDetail/109609560406362625

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    39

    文章

    1831

    浏览量

    116342
  • 人工智能
    +关注

    关注

    1821

    文章

    50511

    浏览量

    267736
  • 语音控制
    +关注

    关注

    5

    文章

    519

    浏览量

    29778
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    TUYA全球开发者大会|从AI植物机器人到狗语翻译,创新AI硬件扎堆首发!

    深圳,4月23日——作为AI+IoT领域重量级盛会,TUYA全球开发者大会在现场展出了一批让直呼“想拥有”的AI硬件。从“养成系”的情绪潮玩,到零门槛手搓的桌面伴侣,再到满地跑的逗宠
    的头像 发表于 04-24 20:00 626次阅读
    TUYA全球<b class='flag-5'>开发者</b>大会|从<b class='flag-5'>AI</b>植物<b class='flag-5'>机器人</b>到狗语翻译,创新<b class='flag-5'>AI</b>硬件扎堆首发!

    【黑金云课堂笔记】第三期知识点总结

    恭喜黑金云课堂的小伙伴完成第三期内容的学习 上周我们掌握了 Verilog 基础与逻辑设计、Vitis 搭建工程及 Zynq 配置流,并初步了解了 Linux 系统 ✊ 大家在交流群里反馈非常积极
    的头像 发表于 04-01 16:08 244次阅读
    【黑金云课堂笔记】<b class='flag-5'>第三期</b>知识点总结

    再谈低温烧结银的应用:从春晚四家机器人出镜的幕后推手说起

    代半导体重驱动,低温烧结银市场年增速超 40%,2025–2030 年进入规模化替代传统焊料的关键。 总结:春晚四家机器人的惊艳表现,是AS系列低温烧结银在电机、传感器、芯片、功率
    发表于 02-17 14:07

    NVIDIA Jetson系列开发者套件助力打造面向未来的智能机器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 开发者套件,助力打造面向未来的智能机器人
    的头像 发表于 12-13 10:20 3476次阅读

    探索RISC-V在机器人领域的潜力

    运行ROS 2,充分证明了RISC-V架构完全有能力承载机器人操作系统这样的复杂软件栈。它不仅是学习RISC-V的绝佳工具,更是探索未来边缘计算和智能机器人的一个强大起点。 致谢: 感谢进迭时空、发烧友提供开发板,以及论坛中各
    发表于 12-03 14:40

    打造机器人母生态!一年开发者数量翻倍,地瓜机器人发布具身智能大算力开发平台

    增长200%,个人开发者数量翻倍。   作为机器人芯片公司,地瓜机器人已经打造了两大系列产品:旭日X系列主打高性价比,面向泛消费
    的头像 发表于 11-27 09:16 8346次阅读
    打造<b class='flag-5'>机器人</b>母生态!一年<b class='flag-5'>开发者</b>数量翻倍,地瓜<b class='flag-5'>机器人</b>发布具身智能大算力<b class='flag-5'>开发</b>平台

    广和通亮相DDC 2025地瓜机器人开发者大会

    11月21日,DDC2025地瓜机器人开发者大会在深圳顺利举行。大会汇聚来自机器人全产业链的技术团队、生态伙伴与开发者,共同探讨机器人技术的
    的头像 发表于 11-26 15:49 653次阅读
    广和通亮相DDC 2025地瓜<b class='flag-5'>机器人</b><b class='flag-5'>开发者</b>大会

    高精度机器人控制的核心——基于 MYD-LT536 开发板的精密运动控制方案

    方案; 开发者可直接对接上层 ROS 框架,实现多轴机器人同步控制与智能路径规划。 、典型应用:高精度装配机器人
    发表于 11-14 15:48

    铸校企合作典范,领无铅技术前沿!奥迪威与兰州大学举行联合研究院第三期合作签约仪式

    铸校企合作典范,领无铅技术前沿!奥迪威与兰州大学举行联合研究院第三期合作签约仪式
    的头像 发表于 11-04 15:30 1240次阅读
    铸校企合作典范,领无铅技术前沿!奥迪威与兰州大学举行联合研究院<b class='flag-5'>第三期</b>合作签约仪式

    RK3576机器人核心:屏异显+八路摄像头,重塑机器人交互与感知

    ,以其"屏异显"和"八路摄像头"的强悍能力,为机器人开发者提供了前所未有的强大算力平台。米尔电子基于其MYD-LR3576
    发表于 10-29 16:41

    亚马逊云科技第三期创业加速器圆满收官 助力初创释放Agentic AI潜力 加速全球化进程

    北京——2025年10月28日 ,亚马逊云科技第三期创业加速器项目圆满收官。35家入营企业齐聚一堂,分享了各自的业务发展情况,以及参与本期加速器的收获及体验。第三期创业加速器持续聚焦AI,特别是前沿
    的头像 发表于 10-29 15:18 1120次阅读

    小萝卜机器人的故事

    经过我的申请, 马老师发放了, 小萝卜机器人的, 开发权限, 原来的小萝卜公司, 因为经营不善倒闭, 作为科研产品, 几个技术对此惋惜, 自掏腰包, 要让小萝卜机器人, 再生, 每次听到小萝卜
    发表于 10-23 05:24

    超过200万开发者加入NVIDIA机器人技术生态

    已经有超过 200 万开发者加入 NVIDIA 机器人技术生态系统。这些开发者正在推动制造业、食品配送、农业、医疗健康、设施维护等众多行业的变革。 自 2014 年 NVIDIA Jetson 平台
    的头像 发表于 08-21 19:47 2193次阅读
    超过200万<b class='flag-5'>开发者</b>加入NVIDIA<b class='flag-5'>机器人</b>技术生态

    涂鸦AI画画机器人开发方案

    儿童教育的画画机器人品牌,通过语音互动激发孩子创作力,已畅销全球100多个国家。为助力开发者和各类品牌高效构建此类产品,涂鸦重点突破AI语音
    的头像 发表于 06-12 18:17 1644次阅读
    涂鸦<b class='flag-5'>AI</b>画画<b class='flag-5'>机器人</b><b class='flag-5'>开发</b>方案

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    源的开发资料为开发者提供了深入研究和定制语音机器人功能的基础,开发者可以根据不同的应用需求,对语音
    发表于 05-28 11:36