0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器人:AI大模型终端落地的第三大方向?

Felix分析 来源:电子发烧友网 作者:吴子鹏 2024-03-24 10:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)前有AI落地难,如今AI大模型的落地也遇到了一些挑战。虽然各大企业推出了非常多的行业垂直大模型,不过这些模型基本上还是基于云端去实现。在终端,目前AI智能手机和AI PC是最热门的两大应用。

我们简单看一下AI智能手机行业,已经有数家厂商推出了配置在手机端的大模型。以vivo的蓝心大模型为例,可以通过抓取屏幕中的内容,智能且直接地完成日程添加的操作,使用户体验更为便捷。还有荣耀MagicOS 8,大模型让荣耀手机能够捕获用户的意图。在AI PC方面,道理大抵是相通的。

那么,除了原本就比较智能且出货量较大的智能手机和PC之外,AI大模型还有什么终端方向值得去探索呢?OpenAI 给出的答案是机器人

把ChatGPT装进机器人的大脑

近日,机器人初创公司Figure发布了自己第一个OpenAI大模型加持的机器人demo。视频内容显示,当一个1.7米左右的机器人被植入GPT大模型之后,智能化水平显著提升,不仅能够和人类无违和对话,而且也具有非常强的动手能力。

根据demo内容,这个搭载GPT的机器人能够非常准确地描述自己所见的内容,比如面前的苹果和杯子,以及演示人员手部的动作。并且,当演示人员让这个机器人递些吃的东西过去时,它能够在几乎不需要反应时间的情况下将苹果递给演示人员。这个demo显示出,搭载GPT的机器人已经具有非常高的“意识自主性”,虽然有些对话需要时间反应,不过他最终都能够做出正确的举措。

据悉,机器人初创公司Figure拥有一个豪华的技术团队,创始人Adcock重金从波士顿动力、特斯拉、谷歌等公司挖了大量的人才。再加上有了GPT的加持,Figure 01机器人可以自主做计划、执行任务、有记忆、听懂人话,离具身智能的程度更近一步。

上一个引起行业广泛关注的机器人是VIMA(Vision-and-Language Navigation with Multi-Modal Transformers)。VIMA由李飞飞教授及来自斯坦福大学、加州理工、清华大学和英伟达的几位学者组成的团队联合打造,是一个使用多模态提示执行各类任务的机械操作系统。根据介绍,VIMA是一个带有机械臂的LLM,可以接受多模态提示词,单个的文本、图像、视频或这些信息的结合。

太平洋证券曾在研报中指出,虽然当前人形机器人的智能AI系统还不够成熟,但当前ChatGPT的出现已展现了生成式AI具备较强理解和生成对话能力,结合OpenAI投资人形机器人赛道,以及特斯拉等巨头的入局,看好未来人形机器人更快商业化落地。

无疑,Figure 01机器人展示出当下具身智能机器人的最新进展。具身智能机器人要求机器人能够像人类一样与环境交互、感知、规划、决策、行动、执行任务。英伟达创始人黄仁勋在 ITF World 2023 半导体大会上就大谈特谈具身智能。他认为,具身智能是能理解、推理、并与物理世界互动的智能系统,是人工智能的下一个浪潮。

相信随着AI大模型技术越来越成熟,这种大模型和机器人的融合会更加成熟,到时候机器人可能会无缝融入人类社会。

大模型融入机器人的挑战

不过,憧憬是美好的,过程总是很艰辛。针对AI大模型和机器人的融合,当前还有很多困难需要克服,就像Figure 01机器人一样,它还有很多细节问题无法很平滑地处理。

在2023年底举办的中国信通院人工智能论坛上,很多专家就谈到了AI大模型的终端落地难题,其中一些问题实际上也是适用于机器人行业的。

比如,第一个是算力和存储问题,当AI大模型在云端训练时,相对算力还是比较充沛的,不过当部署到终端的时候,模型受限于算力和存储能力的显著下降就需要做瘦身。这就牵连出第二个问题,由于实际应用经验严重匮乏,目前大部分AI大模型的瘦身都是“拍脑袋式”的,这也是为什么Figure 01机器人在一些问题上应对非常好,在一些问题上却需要很久的推理思考。因此,在硬件问题上,成本就会是个大麻烦,成本太低的话,AI大模型受影响就会非常严重,成本太高的话就无法广泛普及。

第二个是数据的问题,以机器人来说,最终落地到终端会有比较明确的场景。然而,就需要利用这类场景数据对AI大模型进行二次训练,如何对这些数据进行高质量清洗,另外如何微调数据以达到更好的部署效果,这些都是巨大的挑战,因为有太多经验空白区。有人会问,竟然要求具身智能,要像人类一样,那么不是应该具有广泛的知识吗?理想形态当然是这样,甚至是机器人在一些能力上超过人类,但是受限于硬件,短期看这是不现实的。

第三个是仿真和部署的问题。我们都知道,具身智能的机器人需要和物理世界接触并融入物理世界。这就遇到了一个问题,智能体是基于虚拟仿真环境进行设计的,不过智能体部署之后,现实世界要复杂很多,如何将虚拟世界和物理世界耦合是一个更大的挑战。这不仅要求智能体模型具有非常好的可扩展性和成长性,还需要一个强大的通用智能本体平台。可能有人已经想到了硬件性能冗余,不过考虑到可靠性和成本问题,单纯性能冗余明显是不够的,特定场景通用走向社会性通用的过程中,硬件平台架构创新是非常关键的。

目前,头部企业实现AI大模型和机器人融合的方式有一些差异性。微软公司使用ChatGPT大型语言模型 (LLM) 将人的语言快速转换为机器人的高层控制代码,然后转化为机器人的控制;谷歌PaLM-E模型则是一种视觉路线,能够观察物理实体世界的信息,由大模型进行分析理解,再将决策结果反馈至物理世界;特斯拉则是打通FSD和机器人的底层模块,实现一定的算法复用,特斯拉利用大规模的数据集训练模型,可以提高算法在复杂环境下的性能,并认为自动驾驶的本质就是机器人。

从结果来看,目前AI大模型+机器人已经实现了一些功能,但是离通用智能和规模部署还有一段路要走。

结语

AI大模型如何在终端落地?这是一个困扰行业的问题,将本身就智能的智能手机和PC升级,这当然是一个路径。不过,具身智能的机器人会有更大的想象空间,当然这条路道阻且长。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    31402

    浏览量

    223560
  • AI大模型
    +关注

    关注

    0

    文章

    404

    浏览量

    1038
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国产人形机器人测试设备突围:如何拿下AI 终端的 “入场券”

    ,测试设备将迎来黄金发展期。北京沃华慧通测控技术有限公司坚持技术创新、场景深耕、生态协同,才能拿下AI 终端的 “入场券”,推动中国人形机器人产业实现从 “跟跑” 到
    的头像 发表于 03-27 11:12 1261次阅读
    国产人形<b class='flag-5'>机器人</b>测试设备突围:如何拿下<b class='flag-5'>AI</b> <b class='flag-5'>终端</b>的 “入场券”

    再谈低温烧结银的应用:从春晚四家机器人出镜的幕后推手说起

    领域的极限测试,证明其可支撑商业化落地。 2国产化加速:SHAREX善仁新材国产厂商已实现30℃无压烧结银AS9338的批量应用,打破海外垄断,成本下降 50%+。 3产业爆发:机器人+新能源+第三
    发表于 02-17 14:07

    全国首台套牵引式AI智能激光除草机器人签约落地

    农业发展指明了方向。当日,全国首台套牵引式AI智能激光除草机器人在黑龙江省正式签约落地,以实际行动响应国家战略部署,开启智能农机赋能现代农业的新篇章。
    的头像 发表于 02-04 14:36 669次阅读

    机器人装上“全能心脏”:TAC-3000 Pro如何破解多场景落地难题?

    且适应性强的控制器,成为机器人能否稳定落地于多样场景的关键。 多场景落地中的大挑战 在实际部署中,机器人控制系统常面临
    的头像 发表于 12-25 18:07 1135次阅读
    给<b class='flag-5'>机器人</b>装上“全能心脏”:TAC-3000 Pro如何破解多场景<b class='flag-5'>落地</b>难题?

    大晓机器人发布开悟3.0,国产世界模型机器人拥有“超级大脑”

    电子发烧友网综合报道,当前,人工智能正加速从数字世界向物理世界延伸,具身智能成为AI演进的关键方向。大晓机器人董事长王晓刚表示,当前越来越多人意识到具身智能的瓶颈不在硬件,而是对世界的理解,大晓
    的头像 发表于 12-25 09:25 2759次阅读
    大晓<b class='flag-5'>机器人</b>发布开悟3.0,国产世界<b class='flag-5'>模型</b>让<b class='flag-5'>机器人</b>拥有“超级大脑”

    探索RISC-V在机器人领域的潜力

    SLAM等轻量级算法时表现出了不错的性能,CPU占用率在可接受范围内。整个系统响应及时,证明了MUSE Pi Pro完全有能力作为小型移动机器人的“大脑”。 四、 其他功能浅尝 • AI模型部署
    发表于 12-03 14:40

    RK3576机器人核心:屏异显+八路摄像头,重塑机器人交互与感知

    ,以其"屏异显"和"八路摄像头"的强悍能力,为机器人开发者提供了前所未有的强大算力平台。米尔电子基于其MYD-LR3576
    发表于 10-29 16:41

    巡检机器人落地攻略:RK3576驱动12路低延迟视觉

    ,边走边看、实时回传、异常即告警。周机器人上电跑通:前后左右与顶部共 10~12路1080P 摄像头接入,基于米尔 RK3576开发板 完成 硬件编解码 + RTSP/SRT 低延迟推流;端到端延迟
    发表于 10-24 16:53

    小萝卜机器人的故事

    经过我的申请, 马老师发放了, 小萝卜机器人的, 开发权限, 原来的小萝卜公司, 因为经营不善倒闭, 作为科研产品, 几个技术对此惋惜, 自掏腰包, 要让小萝卜机器人, 再生, 每次听到小萝卜说
    发表于 10-23 05:24

    工业机器人的特点

    者的基础,也是者的实现终端,智能制造装备产业包括高档数控机床、工业机器人、自动化成套生产线、精密仪器仪表、智能传感器、汽车自动化焊接线、柔性自动化生产线、智能农机、3D 打印机等领域。而智能制造装备中工业
    发表于 07-26 11:22

    盘点#机器人开发平台

    地瓜机器人RDK X5开发套件地瓜机器人RDK X5开发套件产品介绍 旭日5芯片10TOPs算力-电子发烧友网机器人开发套件 Kria KR260机器人开发套件 Kria KR260-
    发表于 05-13 15:02

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    视觉巡线,展示了如何从数据采集、模型训练到机器人部署的完整流程。 值得注意的是,深度学习模型的实时性对机器人计算资源提出了较高要求,优化模型
    发表于 05-03 19:41

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    ROS的全称:Robot Operating System 机器人操作系统 ROS的 目的 :ROS支持通用库,是通信总线,协调多个传感器 为了解决机器人里各厂商模块不通用的问题,让机器人快速开发
    发表于 04-30 01:05

    大象机器人携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    识别联调。 进迭时空致力于为智能机器人提供完整全栈优化的RISC-V AI软硬件解决方案,第一代RISC-V AI CPU芯片K1已完成AI视觉感知、
    发表于 04-25 17:59

    【「零基础开发AI Agent」阅读体验】+初品Agent

    模型落地的重要方向,也是AI技术的下一个风口。 因此该书适于对AI感兴趣的读者,尤其是Agent的学习者与开发者,如想要提升工作效率的职场
    发表于 04-22 11:51