0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GLaDOS交互机器人入选Hackster.io挑战赛9个优胜作品之一

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-05-10 11:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

其他优胜作品包括 AI 驱动的虚拟试衣应用和一款能够寻找遗失物品的机器人等。

YouTube 机器人技术主播 Dave Niewinski 开发的机器人五花八门,从可驾驶的“La-Z-Boy”椅子到由 AI 引导的扔沙包机器人、马车比赛机器人等。

他最近的交互式电子动画 GLaDOS 项目成为了 Hackster AI 创新挑战赛的九个优胜作品之一。约 100 名参赛者通过创建开源项目、推动 AI 在边缘计算、机器人和物联网领域的应用,来角逐由 NVIDIA 与 Sparkfun 提供的奖品。

Niewinski 根据视频游戏开发商 Valve 的第一人称解谜系列游戏《传送门》(Portal)中的 GLaDOS 向导,设计出了一个创新机器人,该机器人赢得了生成式 AI 应用组第一名。

另两位优胜者 Andrei Ciobanu 和 Allen Tao 分别获得了边缘生成式 AI 模型和边缘 AI 应用组的一等奖。Ciobanu 利用生成式 AI 帮助实现虚拟试衣,而 Tao 所开发的基于 ROS 的机器人可通过绘制家庭内部地图来帮助寻找物品。

将 LLM 应用于机器人

Niewinski 在其位于加拿大安大略省滑铁卢的 Armoury Labs 开发定制化的机器人应用。他使用 NVIDIA Jetson 平台开发边缘 AI 和机器人技术,并根据自己的经验创建开源教程和 YouTube 视频。

为了给自己配备一名实验室私人助理,他制作了一个自己的 GLaDOS 交互机器人。该机器人使用基于 Transformer 的语音识别、文本转语音和大语言模型(LLM)处理查询,这些功能与模型均在 NVIDIA Jetson AGX Orin 上运行,可与机械臂和摄像头进行交互。

GLaDOS 可以追踪 Niewinski 在实验室中的行踪,能够朝不同的方向移动来面对他,并对询问作出快速反应。

Niewinski 表示:“我喜欢用机器人做一些出乎人们意料的事情。”

他希望这个助手的声音能像《传送门》中的原版 GLaDOS 一样,并且能够迅速作出反应。幸运的是,游戏公司 Valve 把《传送门》和《传送门 2》中的所有语音台词都放在了自己的网站上,Niewinski 可以下载该音频来训练模型。

他提到:“使用 Jetson 的话,一般的问答语音都能快速运行。”

Niewinski 利用 NVIDIA 的开源 NeMo 套件对 GLaDOS 的语音进行了微调,训练出一个名为 FastPitch 的频谱生成器网络和一个名为 HiFiGAN 的声码器网络来提高音频质量。

这两个网络都被部署到搭载 NVIDIA Riva 的 Orin 上,将语音识别与合成功能的运行速度优化到数倍于语音的实时速度,使其能够与 LLM 同步运行并保持流畅的交互传输。

为了让 GLaDOS 生成符合现实的回答,Niewinski 使用了一个名为 OpenChat 的本地托管 LLM,该模型在 Docker 中运行,来自 jetson-containers。所有这些 AI 都在 Jetson 模块上运行,使用的是由 CUDA 和 JetPack 构建的最新开源 ML 软件堆栈。

为了让 GLaDOS 能够移动,Niewinski 专门为宇树科技 Z1 机械臂开发了交互功能。GLaDOS 可以通过一个立体摄像头和多个模型来观察和追踪人类语言,其机械臂周围装上了 3D 打印的 GLaDOS 头部和身体外壳。

借助生成式 AI 试遍新款服装

来自罗马尼亚的 Winner Ciobanu 希望借助生成式 AI 提升虚拟试衣体验,他的作品 EdgeStyle: Fashion Preview at the Edge 夺得了第一名。

他使用 YOLOv5、SAM、OpenPose 等 AI 模型,从图像和视频中提取并完善数据,然后使用 Stable Diffusion 生成图像,他表示Stable Diffusion是实现精准虚拟试穿的关键所在。

Ciobanu 提到,这个系统教会了模型如何将衣服“穿”在不同姿势的人身上,从而增强了试穿的真实感。

“这个系统非常方便,可以让用户不用真的去实际试穿,就能看到衣服穿在身上的效果。”

他表示,NVIDIA JetPack SDK 提供了在 Jetson Orin 上顺利运行 AI 模型所需的所有工具。

“AI 技术日新月异,拥有一套稳定的工具非常有用。它确实为我们这些开发者节约了时间,减少了麻烦,让我们能够摆脱技术问题的困扰,把更多精力放在构建很酷的东西上。”

让机器人帮助寻找遗失物品

加拿大安大略省的获奖者 Winner Tao 创造的机器人可以帮助人们在家中寻找遗失物品。他的 An Eye for an Item 项目赢得了 Hackster 挑战赛的第一名。

Tao 提到:“寻找丢失的物品是一件苦差事,而近期零样本物体检测和 LLM 领域的最新进展使计算机可以根据文字或图片描述为我们检测任意物体,这带来了实现自动化的可能性。”

Tao 表示自己需要机器人的计算能力来对任何非结构化环境中的物体进行分类,比如客厅、大型仓库等。他还需要机器人执行实时计算以进行导航定位,并在更大规模的物体检测模型上进行推理。

他表示:“Jetson Orin 是一个绝佳的选择,它支持从使用 NanoDB 查询文本和图像到实时里程反馈等一切功能,包括使用 Isaac ROS 的硬件来加速 AprilTag 检测进行漂移校正。”



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30600

    浏览量

    219655
  • 语音识别
    +关注

    关注

    39

    文章

    1803

    浏览量

    115569
  • ROS
    ROS
    +关注

    关注

    1

    文章

    290

    浏览量

    18482
  • 边缘计算
    +关注

    关注

    22

    文章

    3473

    浏览量

    52699
  • ai技术
    +关注

    关注

    1

    文章

    1313

    浏览量

    25602

原文标题:AI 大显身手:GLaDOS 交互机器人入选 Hackster.io 挑战赛 9 个优胜作品之一

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    ,已经成为机器人开发者不容忽视的核心处理器。而米尔电子的MYD-LR3576开发板,则以其丰富的接口、稳定的性能和成熟的软硬件支持,为快速原型验证和产品开发提供了绝佳的平台。如果您正在寻找款能够同时处理复杂视觉任务和丰富交互
    发表于 10-29 16:41

    再掀语音交互革命,广和通AI解决方案加速机器人听觉进化

    机器人世界里,感知是智能化的第步,是机器人获取环境信息,学习适应并自主决策的前提。听觉作为五感之一,深度融合AI,可帮助机器人实现高效感
    的头像 发表于 08-26 17:44 626次阅读

    2025 EDA精英挑战赛华大九天题发布

    中国研究生创“ 芯 ” 大赛·EDA精英挑战赛(以下简称EDA精英挑战赛)是由教育部学位管理与研究生教育司指导,中国学位与研究生教育学会、中国科协青少年科技中心主办的“ 中国研究生创‘芯 ’大赛
    的头像 发表于 08-26 15:00 1311次阅读
    2025 EDA精英<b class='flag-5'>挑战赛</b>华大九天<b class='flag-5'>赛</b>题发布

    2025 EDA精英挑战赛紫光同创题发布

    中国研究生创“ 芯 ” 大赛·EDA精英挑战赛(以下简称EDA精英挑战赛)是由教育部学位管理与研究生教育司指导,中国学位与研究生教育学会、中国科协青少年科技中心主办的“ 中国研究生创‘芯 ’大赛
    的头像 发表于 08-25 09:40 1280次阅读
    2025 EDA精英<b class='flag-5'>挑战赛</b>紫光同创<b class='flag-5'>赛</b>题发布

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    的非常好的,特别是些流程图,很清晰的阐释了概念 很适合作为初学者入门的引路书 还能了解很多技术和框架,破除初学者的自负困境,让初学者知道功能是由很多开发者维护的,前人已经为各种产品搭建了完善的框架。避免陷入得一个人单打独斗的错觉
    发表于 04-30 01:05

    泰科机器人荣获第二届特种机器人产业链揭榜推进活动“优胜单位”

    泰科机器人针对“模块化电机伺服驱动器”榜单形成的技术解决方案被评为优秀解决方案,其攻关成果在测评比选中胜出,泰科机器人被评为优胜单位,并且入选榜主单位“中兵智能创新研究院”的生态合作伙
    的头像 发表于 02-26 09:12 1094次阅读
    泰科<b class='flag-5'>机器人</b>荣获第二届特种<b class='flag-5'>机器人</b>产业链揭榜推进活动“<b class='flag-5'>优胜</b>单位”

    平头哥半导体亮相AICAS 2025挑战赛技术研讨会

    近日,历时两多月,600余支参赛队伍激烈角逐,AICAS 2025全球技术挑战赛初赛阶段赛程已顺利结束,中技术研讨于2月22日在杭州圆满召开。本次研讨会作为AICAS全球技术挑战赛
    的头像 发表于 02-25 11:23 1108次阅读

    探索具身智能边界,地瓜机器人邀你共战ICRA 2025 Sim2Real挑战赛

    探索具身智能边界,地瓜机器人邀你共战ICRA 2025 Sim2Real挑战赛
    的头像 发表于 01-13 20:18 1022次阅读
    探索具身智能边界,地瓜<b class='flag-5'>机器人</b>邀你共战ICRA 2025 Sim2Real<b class='flag-5'>挑战赛</b>

    物理仿真人形机器人的统全身控制策略

    创建动作自然并对各种控制输入做出智能响应的交互式仿真人形机器人仍是计算机动画和机器人技术领域最具挑战性的问题之一。NVIDIA Isaac
    的头像 发表于 01-06 12:31 1622次阅读
    物理仿真人形<b class='flag-5'>机器人</b>的统<b class='flag-5'>一</b>全身控制策略

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    具身智能机器人的基础模块,这个是本书的第二部分内容,主要分为四部分:机器人计算系统,自主机器人的感知系统,自主机器人的定位系统,自主
    发表于 01-04 19:22

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    。 多模态融合的创新与突破 机器人控制技术的另一个重要突破在于多模态大模型的应用。相比于仅通过文字进行人机交互的传统方法,现代机器人能够融合视觉、声音、定位等多模态输入信息,为任务执行
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    影响与发展,提供了全球及国内行业趋势的见解。书中详细讨论了这新兴领域面临的诸多挑战,从应用的不确定性、昂贵的成本到伦理问题,为读者呈现了当前形势的现实视角。 接下来,书中深入探讨了具身智能机器人的历史
    发表于 12-28 21:12

    【「具身智能机器人系统」阅读体验】1.全书概览与第章学习

    讲解如何构造具身智能基础模型的方法和步骤,包括数据采集、预处理、模型训练和评估等。 在第四部分,介绍了具身智能机器人的计算挑战,包括计算加速、算法安全性和系统可靠性等内容。 最后,在第五部分介绍了
    发表于 12-27 14:50

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    熟练程度,但由于其多模态性质,训练 EAI 模型需要更多的机器人数据。这些机器人数据包括各种传感输入和交互类型,不仅极具挑战性,而且收集成本高昂。 训练 EAI 的第
    发表于 12-24 00:33

    EDA精英挑战赛果公布!思尔芯“战队”薪火相承斩获“麒麟杯”

    2024中国研究生创芯大赛·EDA精英挑战赛12月7-8日,2024中国研究生创芯大赛·EDA精英挑战赛(原“集成电路EDA设计精英挑战赛”)总决赛及颁奖典礼在南京成功举办。此次大赛,思尔芯作为核心
    的头像 发表于 12-11 01:03 1408次阅读
    EDA精英<b class='flag-5'>挑战赛</b><b class='flag-5'>赛</b>果公布!思尔芯“战队”薪火相承斩获“麒麟杯”