0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌借助Gemini AI系统深化对机器人的训练

要长高 2024-07-12 16:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

7月12日,国际科技界传来新动态,谷歌正借助其先进的Gemini AI系统,深化对旗下机器人的训练,旨在显著提升它们的导航能力和任务执行能力。DeepMind机器人团队最新发布的研究论文,详细阐述了如何利用Gemini 1.5 Pro的强化长上下文窗口功能,极大地优化了用户通过自然语言指令与RT-2机器人交互的体验。

这一创新技术的核心在于,机器人首先通过拍摄并分析家庭或办公室等指定区域的视频,利用Gemini 1.5 Pro的强大能力来“学习”并理解其所在环境。随后,机器人能够基于这些视觉信息,灵活运用语音和/或图像反馈,执行用户的复杂指令。例如,当用户询问“我在哪里可以给手机充电?”时,机器人能迅速识别环境,并引导用户至最近的电源插座。

据DeepMind透露,在覆盖超过9,000平方英尺的测试区域内,这些由Gemini驱动的机器人成功响应并完成了50多项不同用户指令,成功率高达90%,展现了极高的准确性和效率。

更令人振奋的是,初步研究还揭示了Gemini 1.5 Pro赋予机器人的额外能力——即除了精准导航外,还能规划并执行更为复杂的任务指令。例如,面对询问是否有特定饮料的用户,机器人能够自主决定前往冰箱检查,随后返回并报告结果,这一连串动作展现了其强大的决策与执行能力。

尽管在视频演示中,机器人对每条指令的迅速确认给人留下了深刻印象,但研究报告也诚实地指出了背后隐藏的“秘密”——处理这些复杂指令实际上需要10至30秒的时间。这表明,尽管技术进步显著,但实现完全无缝的人机交互仍需时日。

不过,这一系列的进展无疑为我们描绘了一幅未来生活的美好图景:或许不久的将来,我们就能与这些高度智能化的机器人共享家园,让它们帮助我们找到遗失的钥匙、钱包,甚至是执行更多日常生活中的琐碎任务,极大地提升生活的便捷性与舒适度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    215

    文章

    31762

    浏览量

    224850
  • 谷歌
    +关注

    关注

    27

    文章

    6273

    浏览量

    112314
  • AI
    AI
    +关注

    关注

    91

    文章

    42532

    浏览量

    303445
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌发布Gemini for Science

    2026年5月20日,谷歌I/O开发者大会上,谷歌正式推出Gemini for Science——一款专门面向科研场景的AI模型。这不是又一个能帮你查文献的聊天
    的头像 发表于 05-21 10:42 1290次阅读

    谷歌正式发布Gemini Spark

    应用即可访问。谷歌给它的定位非常清晰:这不是一个聊天机器人,而是一个24小时不下线的数字助理,主动替你把事情做完。
    的头像 发表于 05-21 10:39 593次阅读

    谷歌正抢先布局移动端AI

    近日,距离谷歌I/O开发者大会开幕仅剩一周,谷歌抢先公布了一系列Android系统重大升级,正式宣布将旗下Gemini模型从聊天机器人升级为
    的头像 发表于 05-14 10:27 820次阅读

    杰和科技亮相机器人大会,边缘AI驱动机器人场景落地

    4月22日,业内领先的嵌入式边缘AI厂商杰和科技亮相FAIRplus2026机器人全产业链接会。基于在工业嵌入式、边缘AI领域的深厚积累,杰和科技立足机器人底层功能需求,聚焦
    的头像 发表于 04-22 16:39 798次阅读
    杰和科技亮相<b class='flag-5'>机器人</b>大会,边缘<b class='flag-5'>AI</b>驱动<b class='flag-5'>机器人</b>场景落地

    NVIDIA如何用AI构建机器人

    下一代机器人将是通用型专家,既能理解指令、学习通用技能,又可针对特定任务进行训练
    的头像 发表于 03-25 09:55 1008次阅读

    英飞凌携手NVIDIA,依托数字孪生技术加速部署安全可靠的机器人

    英飞凌科技股份公司近日宣布进一步扩大与NVIDIA的合作,推进物理 AI系统架构的发展,重点聚焦人形机器人领域。双方将基于2025年8月宣布的合作继续深化合作,结合英飞凌在电机控制、微
    发表于 03-19 16:52 1427次阅读
    英飞凌携手NVIDIA,依托数字孪生技术加速部署安全可靠的<b class='flag-5'>机器人</b>

    再谈低温烧结银的应用:从春晚四家机器人出镜的幕后推手说起

    ,完成翻跟头、脖子延伸、互动接梗,强调关节灵活+低功率+长期稳定。 银河通用:《我最难忘的今宵》:Galbot G1具身智能,自主决策、精细操作,依赖AI芯片+传感器+高效互连。 2机器人动得稳、准、快
    发表于 02-17 14:07

    Gemini CLI 中转站配置使用教程

    体验AI代码助手 代码解读 复制代码 cd new-project/ gemini > 为我编写一个 Discord 机器人,使用我提供的 FAQ.md 文件回答问题 分析现有代码
    发表于 02-10 17:29

    探索RISC-V在机器人领域的潜力

    应用,特别是机器人操作系统领域的可行性。MUSE Pi Pro以其强大的K1 AI CPU和官方对主流开源软件栈的积极适配,成为了一个非常有吸引力的选择。 二、 硬件初窥:性能小钢炮 MUSE Pi Pro
    发表于 12-03 14:40

    高精度机器人控制的核心——基于 MYD-LT536 开发板的精密运动控制方案

    ISP多媒体接口,适合构建机器人视觉-运动融合系统,实现工件识别与动态定位。 3. 支持闭环控制与误差校正 可结合高分辨率编码器反馈数据,运行机器人闭环控制算法; 利用AI 协处理
    发表于 11-14 15:48

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    。· 利用开发板上的MIPI CSI1和CSI2接口,完整接入8路摄像头,实现了所有通道的视频预览与采集,为机器人构建了全方位的视觉感知系统。卓越性能表现:· CPU占用率:34%· DDR占用率:50
    发表于 10-29 16:41

    小萝卜机器人的故事

    经过我的申请, 马老师发放了, 小萝卜机器人的, 开发权限, 原来的小萝卜公司, 因为经营不善倒闭, 作为科研产品, 几个技术对此惋惜, 自掏腰包, 要让小萝卜机器人, 再生, 每次听到小萝卜说
    发表于 10-23 05:24

    如何在NVIDIA Isaac Lab中使用Newton训练四足机器人

    物理在机器人仿真中发挥着至关重要的作用,它为机器人在真实环境中的行为及交互提供了精准的虚拟呈现基础。借助仿真器,研究人员和工程师能够以安全、高效且经济的方式训练、开发、测试和验证
    的头像 发表于 10-13 11:10 2410次阅读
    如何在NVIDIA Isaac Lab中使用Newton<b class='flag-5'>训练</b>四足<b class='flag-5'>机器人</b>

    机器人竞技幕后:磁传感器芯片激活 “精准感知力”

    支撑机器人竞技能力的核心力量,深刻改变着竞技机器人的能力边界。 磁传感器芯片为机器人运动提供 “精准导航”。在动态平衡系统中,像昆泰芯 KTH71 系列磁传感器芯片,通过检测地磁场与
    发表于 08-26 10:02

    工业机器人的特点

    的基础,也是三者的实现终端,智能制造装备产业包括高档数控机床、工业机器人、自动化成套生产线、精密仪器仪表、智能传感器、汽车自动化焊接线、柔性自动化生产线、智能农机、3D 打印机等领域。而智能制造装备中工业
    发表于 07-26 11:22