0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GLaDOS交互机器人入选Hackster.io挑战赛9个优胜作品之一

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-05-10 11:33 次阅读

其他优胜作品包括 AI 驱动的虚拟试衣应用和一款能够寻找遗失物品的机器人等。

YouTube 机器人技术主播 Dave Niewinski 开发的机器人五花八门,从可驾驶的“La-Z-Boy”椅子到由 AI 引导的扔沙包机器人、马车比赛机器人等。

他最近的交互式电子动画 GLaDOS 项目成为了 Hackster AI 创新挑战赛的九个优胜作品之一。约 100 名参赛者通过创建开源项目、推动 AI 在边缘计算、机器人和物联网领域的应用,来角逐由 NVIDIA 与 Sparkfun 提供的奖品。

Niewinski 根据视频游戏开发商 Valve 的第一人称解谜系列游戏《传送门》(Portal)中的 GLaDOS 向导,设计出了一个创新机器人,该机器人赢得了生成式 AI 应用组第一名。

另两位优胜者 Andrei Ciobanu 和 Allen Tao 分别获得了边缘生成式 AI 模型和边缘 AI 应用组的一等奖。Ciobanu 利用生成式 AI 帮助实现虚拟试衣,而 Tao 所开发的基于 ROS 的机器人可通过绘制家庭内部地图来帮助寻找物品。

将 LLM 应用于机器人

Niewinski 在其位于加拿大安大略省滑铁卢的 Armoury Labs 开发定制化的机器人应用。他使用 NVIDIA Jetson 平台开发边缘 AI 和机器人技术,并根据自己的经验创建开源教程和 YouTube 视频。

为了给自己配备一名实验室私人助理,他制作了一个自己的 GLaDOS 交互机器人。该机器人使用基于 Transformer 的语音识别、文本转语音和大语言模型(LLM)处理查询,这些功能与模型均在 NVIDIA Jetson AGX Orin 上运行,可与机械臂和摄像头进行交互。

GLaDOS 可以追踪 Niewinski 在实验室中的行踪,能够朝不同的方向移动来面对他,并对询问作出快速反应。

Niewinski 表示:“我喜欢用机器人做一些出乎人们意料的事情。”

他希望这个助手的声音能像《传送门》中的原版 GLaDOS 一样,并且能够迅速作出反应。幸运的是,游戏公司 Valve 把《传送门》和《传送门 2》中的所有语音台词都放在了自己的网站上,Niewinski 可以下载音频来训练模型。

他提到:“使用 Jetson 的话,一般的问答语音都能快速运行。”

Niewinski 利用 NVIDIA 的开源 NeMo 套件对 GLaDOS 的语音进行了微调,训练出一个名为 FastPitch 的频谱生成器网络和一个名为 HiFiGAN 的声码器网络来提高音频质量。

这两个网络都被部署到搭载 NVIDIA Riva 的 Orin 上,将语音识别与合成功能的运行速度优化到数倍于语音的实时速度,使其能够与 LLM 同步运行并保持流畅的交互传输。

为了让 GLaDOS 生成符合现实的回答,Niewinski 使用了一个名为 OpenChat 的本地托管 LLM,该模型在 Docker 中运行,来自 jetson-containers。所有这些 AI 都在 Jetson 模块上运行,使用的是由 CUDA 和 JetPack 构建的最新开源 ML 软件堆栈。

为了让 GLaDOS 能够移动,Niewinski 专门为宇树科技 Z1 机械臂开发了交互功能。GLaDOS 可以通过一个立体摄像头和多个模型来观察和追踪人类语言,其机械臂周围装上了 3D 打印的 GLaDOS 头部和身体外壳。

借助生成式 AI 试遍新款服装

来自罗马尼亚的 Winner Ciobanu 希望借助生成式 AI 提升虚拟试衣体验,他的作品 EdgeStyle: Fashion Preview at the Edge 夺得了第一名。

他使用 YOLOv5、SAM、OpenPose 等 AI 模型,从图像和视频中提取并完善数据,然后使用 Stable Diffusion 生成图像,他表示Stable Diffusion是实现精准虚拟试穿的关键所在。

Ciobanu 提到,这个系统教会了模型如何将衣服“穿”在不同姿势的人身上,从而增强了试穿的真实感。

“这个系统非常方便,可以让用户不用真的去实际试穿,就能看到衣服穿在身上的效果。”

他表示,NVIDIA JetPack SDK 提供了在 Jetson Orin 上顺利运行 AI 模型所需的所有工具。

“AI 技术日新月异,拥有一套稳定的工具非常有用。它确实为我们这些开发者节约了时间,减少了麻烦,让我们能够摆脱技术问题的困扰,把更多精力放在构建很酷的东西上。”

让机器人帮助寻找遗失物品

加拿大安大略省的获奖者 Winner Tao 创造的机器人可以帮助人们在家中寻找遗失物品。他的 An Eye for an Item 项目赢得了 Hackster 挑战赛的第一名。

Tao 提到:“寻找丢失的物品是一件苦差事,而近期零样本物体检测和 LLM 领域的最新进展使计算机可以根据文字或图片描述为我们检测任意物体,这带来了实现自动化的可能性。”

Tao 表示自己需要机器人的计算能力来对任何非结构化环境中的物体进行分类,比如客厅、大型仓库等。他还需要机器人执行实时计算以进行导航定位,并在更大规模的物体检测模型上进行推理。

他表示:“Jetson Orin 是一个绝佳的选择,它支持从使用 NanoDB 查询文本和图像到实时里程反馈等一切功能,包括使用 Isaac ROS 硬件来加速 AprilTag 检测进行漂移校正。”



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    206

    文章

    27231

    浏览量

    201853
  • 语音识别
    +关注

    关注

    38

    文章

    1650

    浏览量

    111894
  • ROS
    ROS
    +关注

    关注

    1

    文章

    273

    浏览量

    16746
  • 边缘计算
    +关注

    关注

    22

    文章

    2848

    浏览量

    46076
  • ai技术
    +关注

    关注

    1

    文章

    1239

    浏览量

    23819

原文标题:AI 大显身手:GLaDOS 交互机器人入选 Hackster.io 挑战赛 9 个优胜作品之一

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    入围全球机器人顶会ICRA 2024!毫末在RoboDrive2024挑战赛崭露头角

    5月15日, 毫末智行出席全球机器人顶级会议 ICRA 2024,并在 RoboDrive2024 挑战赛的第三赛道——Occ 语义占用预测任务取得第三名。 当日,毫末与其他优胜团队一道,详细阐释
    的头像 发表于 05-17 10:32 113次阅读
    入围全球<b class='flag-5'>机器人</b>顶会ICRA 2024!毫末在RoboDrive2024<b class='flag-5'>挑战赛</b>崭露头角

    基于飞凌嵌入式RK3568J核心板的工业机器人控制器应用方案

    在工业机器人领域的快速发展。 市场研究机构MIR预测,我国工业机器人行业将步入第二发展高峰期。在这轮新的发展浪潮中,市场竞争的焦点将转向存量市场的争夺和细分增量市场的占据。各企
    发表于 05-11 09:40

    DIY推荐!自制基于ESP32的沙画机器人

    作者在高二的时候就做过非常基础的沙画机器人,现在准备去普渡大学上学了,正好也打算带上它,于是想着用这俩年新学到的技能重新设计下之前的沙画机器
    发表于 04-15 15:09

    【开源作品】基于树莓派4B、ESP32制作的桌面机器人、气象站、立方光!

    ;gt;>点此查看全文 基于树莓派 4B DIY 能笑会动的桌面机器人 Emo是款基于树莓派4做的个人伴侣机器人,集时尚与创新于身。它不仅仅是
    发表于 03-05 16:52

    OpenHarmony人形机器人创新挑战赛来啦

    12月28日,第二十六届中国机器人及人工智能大赛人形机器人创新挑战赛在苏州正式发布,首次结合
    的头像 发表于 12-30 08:32 576次阅读
    OpenHarmony人形<b class='flag-5'>机器人</b>创新<b class='flag-5'>挑战赛</b>来啦

    【开源项目】Emo:基于树莓派 4B DIY 能笑会动的桌面机器人

    Emo是款基于树莓派4做的个人伴侣机器人,集时尚与创新于身。它不仅仅是机器人,更是
    发表于 12-26 15:18

    开源项目!教你如何复刻自平衡赛车机器人、智能家居中控、竞技机器人先进模糊控制器等

    开源项目作品 为了方便大家更好提升自己,电子发烧友小编为大家整理了些工程师大佬设计的开源项目作品,供大家可以参考学习,希望对广大工程师有所帮助。 1.用全志R128复刻自平衡赛车机器人
    发表于 12-26 09:17

    做项目没灵感?一起来看看Build2gether包容性创新挑战赛的创意吧!

    Build2gether包容性创新挑战赛近日,由欧洲顶级大学ETHZurich主办、全球知名硬件社区Hackster.io承办的Build2gether包容性创新挑战赛圆满结束。本次
    的头像 发表于 12-23 08:29 172次阅读
    做项目没灵感?一起来看看Build2gether包容性创新<b class='flag-5'>挑战赛</b>的创意吧!

    LabVIEW的六轴工业机器人运动控制系统

    LabVIEW开发六轴工业机器人运动控制系统 本项目开发了高效的工业机器人控制系统,重点关注于运动学算法和轨迹规划算法的实现和测试。LabVIEW作为
    发表于 12-21 20:03

    开源作品!稚晖君超迷你低成本开发板、超酷机器人、智能手环等参考方案

    ;>>点此查看全文&下载资料 2.分享大佬的设计作品只瓦力机器人 主要叙述
    发表于 12-12 10:28

    Arduino教学机器人的使用教程

    本文档的主要内容详细介绍的是Arduino教学机器人的使用教程
    发表于 09-27 06:53

    ai人工智能机器人

    的进行监控管理。 智能电话机器人的另一个优势是不知疲倦,不需要休息和喝水,不需要休息。人在工作时就会有各种各样的脾气,但智能电话机器人不会,永远都以最严谨、最周到的态度和客户进行沟通。 在科技高速发展
    发表于 09-21 11:09

    profinet转ethernet网关连接发那科机器人配置案例

    机器人连接的远程I/O的IP地址即PROFINET转EtherNet网关ethernet端的IP地址; 10、添加链接; 11、设置好从站IP(本例为192.168.0.5)厂商ID为
    发表于 08-03 17:58

    自编程机器人,售后难做吗?

    自编程是如何完成的。 自编程其实也不是很高深的问题。 当用户给出参数时,有时也包括逻辑。 例如用户说,如果设备打开完毕,执行命令。 这个例子就包括了如果。你的智能
    发表于 06-08 16:20

    如何快速地让机器人投入生产

    机器人也是种设备,它主要内容是完成制造的其中功能。 制造
    发表于 06-06 16:18