0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

具备情境理解能力的个人助理机器人研究进展

Arvinhw 来源:DevicePlus 作者:DevicePlus 2023-02-27 10:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

这篇文章来源于DevicePlus.com英语网站的翻译稿。

poYBAGPzJJKAdp6QAAES5vu24a0064.jpg

尽管语音交互正像触摸屏那样为数字接口带来重大变革,但语言处理有其局限性。特别是,数字语言处理仅限于有限且特定的指令,尚未具备人类对话中的情境理解能力。

在相关领域的前沿研究中,麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)的研究人员致力于构建一个更好的处理单元,使机器人不需要循序渐进的指令,而是可以从指令和语境中的上下文来对事物进行推断。

因此,“ComText”诞生了,这是一个处理系统,代表“上下文中的指令”,使机器人可以理解聊天背景信息,如语言线索和周围环境。

为什么上下文很重要?

在自然语言的使用中,经常说类似于“把它捡起来”这样的话。虽然人类能够根据情境来理解这里的“它”指的是什么,但如今的数字化助手或机器人需要更多的信息才能够理解,因为指令缺乏特定性。

MIT 解释说:“捡起它意味着能够看到并识别物体,理解指令,识别出问题中的“它”指的是你放下的工具,回到你放下手中工具的记忆中,并将你放下的工具与其他类似形状和尺寸的工具区分开来。

目前,像Alexa和Siri这样的数字化助手正在彻底改变我们与科技互动的方式,但要让机器人个人助理不断发展,这种对于情境的理解能力是必不可少的。

pYYBAGPzJJSAEuLpAACptCrJXJE591.jpg

ComText 的实际应用:语言处理

ComText 的实际应用:空间理解

挑战

RAGE Frameworks的首席执行官Venkat Srinivasan认为这种交互的挑战主要有三点。

首先,许多支持语音的人工智能工具,比如IBM Watson和Google AlphaGo,在处理人类语言方面存在困难,因为“当前大多数应用是将文本视为数据,而不是语言”。

第二点是情境理解:“只有当技术专注于语言结构,而不是像目前大多数技术所做的那样仅仅注意文本中的单词时,才能进行正确的情境理解。”

最后一个挑战是逻辑:使用这个解决方法得出的结论,其推理之间的可追溯性。

“情境学习”的研究与发展

根据这篇研究论文,为了开发ComText,一个研究团队使用了“强化自然语言的概率模型”。

“主要贡献在于告诉了我们机器人应该像人类那样有多种类型的记忆,” 首席研究员Andrei Barbu表示,“我们有了解决这个问题的第一个数学公式,现在正在探索这两种类型的记忆是如何相互配合并发挥作用的。”

为了测试这个工具,研究者使用了一个名叫Baxter Research Robot(百特研究机器人)的双臂人形机器人,在频率∼20Hz、分辨率1080×760的条件下,使用交叉校准的Kinect 2版 RGB-D观察工作区。配置有一个Amazon Echo Dot(亚马逊回声点),可以将语音指令转换为文本。

为了研究该机器如何有效地对上下文线索进行评估,要求独立操作的人员直接指示机器人完成五项任务,最后制作了96个用户与机器人交互的短视频。通过对视频进行分析,研究者发现在90.2%到94.7%的时间,推断出的命令以“在目标位置,对正确的物品执行正确的操作”的方式被执行。

发生失败主要是由于感知错误,或由于障碍物遮挡了视线,或因为物体直接朝向或远离相机的移动。

这个实验成功的证明了ComText从以往的语言陈述中搜集线索,并将它们与视觉观察相结合,然后对移动物体进行追踪的能力。随着时间的推移,通过更多的交互和观察,这些积累起来的经验也会被逐渐细化。

个人助理机器人的潜在应用

虽然关于AI伦理问题的偏见仍然存在,但ComText在发展成为具有更接近“人类交互能力”的机器人方面依然取得了重大进展。不过,现实情况是,要实现一个能理解人类互动细微差别全功能助手机器人,我们还有很长的路要走。
首席研究员Rohan Paul 表示:“目前,我们还没有生产产品。” 与之相对的是,他们仍然坚持如何在机器搜集更大范围的上下文信息并得出结论的能力方面得到提高,Paul说:“我们真正想做的是让人类和机器人的能力相结合,一起来创造出更复杂的东西。”

pYYBAGPbhjqAbi1JAAAGd6_rQT0867.png

DevicePlus 编辑团队

设备升级版适用于所有热爱电子和机电一体化的人。

审核编辑黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30637

    浏览量

    219792
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探索RISC-V在机器人领域的潜力

    SLAM等轻量级算法时表现出了不错的性能,CPU占用率在可接受范围内。整个系统响应及时,证明了MUSE Pi Pro完全有能力作为小型移动机器人的“大脑”。 四、 其他功能浅尝 • AI模型部署
    发表于 12-03 14:40

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    瑞芯微RK3576 AIoT处理器处理器凭借其卓越的多屏异显与8路摄像头接入能力,为机器人领域带来革新。米尔电子MYD-LR3576开发板实测数据显示,在高负载下CPU占用仅34%,完美实现多路视觉
    发表于 10-29 16:41

    工业机器人的特点

    的基础,也是三者的实现终端,智能制造装备产业包括高档数控机床、工业机器人、自动化成套生产线、精密仪器仪表、智能传感器、汽车自动化焊接线、柔性自动化生产线、智能农机、3D 打印机等领域。而智能制造装备中工业
    发表于 07-26 11:22

    轮式移动机器人电机驱动系统的研究与开发

    【摘 要】以嵌入式运动控制体系为基础,以移动机器人研究对象,结合三轮结构轮式移动机器人,对二轮差速驱动转向自主移动机器人运动学和动力学空间模型进行了分析和计算,
    发表于 06-11 14:30

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    的四核1.4GHz处理器具备强劲的运算性能,能够高效处理语音机器人运行过程中的复杂任务。语音识别和合成需要大量的计算资源,该处理器可以快速对语音信号进行分析、处理和转换。在实时语音交互场景中,无论是
    发表于 05-28 11:36

    盘点#机器人开发平台

    地瓜机器人RDK X5开发套件地瓜机器人RDK X5开发套件产品介绍 旭日5芯片10TOPs算力-电子发烧友网机器人开发套件 Kria KR260机器人开发套件 Kria KR260-
    发表于 05-13 15:02

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    阅读心得体会:ROS2机器人视觉与地图构建技术 通过对本书第7章(ROS2视觉应用)和第8章(ROS2地图构建)的学习,我对机器人视觉感知和自主导航的核心技术有了更深入的理解。以下是我的心得体会
    发表于 05-03 19:41

    汽车焊接机器人的智能控制系统研究进展

    效率、保证焊接质量具有重要意义。近年来,随着人工智能、大数据、物联网等技术的发展,汽车焊接机器人的智能控制系统的研究取得了显著进展,为汽车制造业带来了新的变革。
    的头像 发表于 02-26 14:09 724次阅读

    清华大学:软体机器人柔性传感技术最新研究进展

    课题。近日,清华大学深圳国际研究生院曲钧天助理教授的海洋软体机器人与智能传感实验室(Ocean Soft-Robot and Intelligent Sensing Lab,OASIS-LAB)在国际期刊
    的头像 发表于 02-14 14:31 1215次阅读
    清华大学:软体<b class='flag-5'>机器人</b>柔性传感技术最新<b class='flag-5'>研究进展</b>

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    具身智能机器人的基础模块,这个是本书的第二部分内容,主要分为四个部分:机器人计算系统,自主机器人的感知系统,自主机器人的定位系统,自主机器人
    发表于 01-04 19:22

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    的设计不仅提高了机器人对环境的理解能力,还使其能够更精准地执行复杂任务。 扩散模型的新思路 除了大模型,扩散模型的引入为机器人控制开辟了新的研究方向。在以UniPi为代表的创新工作中,
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    与未来,涵盖如基于行为的人工智能、生物启发的进化人工智能及认知机器人技术的发展。这一历史背景为随后的大模型驱动的具身智能讨论奠定了基础,随着人工智能模型复杂性和能力的不断提升,这一主题也变得愈加
    发表于 12-28 21:12

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    将自然语言理解与运动规划融为一体。这种端到端的方法使机器人能够直接从人类指令生成动作序列,大幅简化了控制流程。该项目的工作流程包含设计并封装一个人机器人函数库、编写清晰地描述提示词、在仿真环境中执行
    发表于 12-24 15:03

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    嵌入式人工智能(EAI)将人工智能集成到机器人等物理实体中,使它们能够感知、学习环境并与之动态交互。这种能力使此类机器人能够在人类社会中有效地提供商品及服务。 数据是一种货币化工具 数据是互联网
    发表于 12-24 00:33

    【「具身智能机器人系统」阅读体验】+初品的体验

    解决许多技术的和非技术的挑战,如提高智能体的自主性、处理复杂环境互动的能力及确保行为的伦理和安全性。 未来的研究需要将视觉、语音和其他传感技术与机器人技术相结合,以探索更加先进的知识表示和记忆模块,利用强化学习进一步优化决策过程
    发表于 12-20 19:17