0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT已能操控机器人,工程师连代码都不用写

新机器视觉 来源:量子位 2023-03-27 11:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当我还在跟ChatGPT吹牛尬聊时,有人已经在拿它操控机器人了。

不是别人,正是OpenAI的金主爸爸、不久前刚拿ChatGPT“重新发明搜索引擎”的微软。

472743b0-cbdd-11ed-bfe3-dac502259ad0.png

到目前为止,开发者调教机器人不仅技术门槛高,还道阻且长:

工程师需要在工作流程回路中,不断手写新代码和规范来纠正机器人行为;另外,操控不同的机器人可能需要不同的编程语言和环境。

4749d088-cbdd-11ed-bfe3-dac502259ad0.png

而在ChatGPT的帮助下,工程师甚至不用手写代码——直接用人话描述想做什么,AI就能自动翻译成机器语言。

47859e56-cbdd-11ed-bfe3-dac502259ad0.png

这意味着,一方面专业人士与机器人的交互效率起飞;另一方面,技术门槛也降低一大截,外行人甚至也能参与调试,创造出更多使用方法。

举个简单的例子:让无人机自动检查货架。

首先,操作者只需用自然语言给ChatGPT提出要求;然后,AI就能自动翻译成代码,并指挥无人机行动。(还可以规定无人机的飞行路径。)

47ab8562-cbdd-11ed-bfe3-dac502259ad0.gif

难怪特斯拉前AI主管Andrej Karpathy会调侃:

最新的热门编程语言是英语。

47f419f8-cbdd-11ed-bfe3-dac502259ad0.png

一个AI指挥多种机器人

实际上,ChatGPT会玩儿的花样可多了。

比如,一位操作者跟AI说:“我渴了,请帮我找个喝的。”

此时AI并不会直愣愣地就去找水了,而是会很机灵地反问:

请问你想喝哪种?这里有好几种饮料,比如椰子水、可乐等等。

48077476-cbdd-11ed-bfe3-dac502259ad0.png

当然操作者也不是吃素的,他并未直接告诉AI选哪个,而是说:“我刚从健身房回来,请帮我找个健康点儿的饮料。”

然后更神奇的操作就开始了:

AI先是猜测他想喝椰子水,然后自己噼里啪啦写出一段代码(甚至还有注释):

4827039a-cbdd-11ed-bfe3-dac502259ad0.gif

写完就自己指挥无人机去找椰子水:

483a13a4-cbdd-11ed-bfe3-dac502259ad0.gif

除了无人机,ChatGPT还能轻松操控别的小机器人,包括摄像头、机械臂等等。

比如让摄像头在房间里找出能加热午饭的东西。

4878dddc-cbdd-11ed-bfe3-dac502259ad0.gif

还有指挥机械臂拼出一个微软的Logo。(悄悄夹带私货)

48c23a7c-cbdd-11ed-bfe3-dac502259ad0.gif

看到这些,有网友脑洞大开,有人发问:

他们是不是正在建立无所不能的天网?

49382ade-cbdd-11ed-bfe3-dac502259ad0.png

还有人甚至调侃称,AI可能连发射核弹的指令都会写:

49512cc8-cbdd-11ed-bfe3-dac502259ad0.png

不过话说回来,其实离网友说的这些还差得远,毕竟现在还是需要人类参与的。

怎么实现的?

从前文可以看出,这只灵活的AI不仅与人交流畅通无阻,而且和机器也能快速沟通。

这主要得益于微软团队专门开发的一系列API和高级函数库。

49716844-cbdd-11ed-bfe3-dac502259ad0.png

他们没有让ChatGPT背后的语言大模型(LLM),生成某固定种类的代码;因为机器人是个多元化领域,这样可能会在不同场景下涉及大量微调。

而在新颖的操作框架下,不同机器人,都有自己对应的特定函数库。

——一个AI,就能适应不同的对象、不同的任务。

一方面,这些函数库,能够连接到机器人控制系统中管理底层硬件,以及执行基本运动的代码和功能模块。

另一方面,为了让ChatGPT也能遵循函数库的规则,预定义函数命名就很关键。清晰的函数名,能让各API之间建立良好的功能连接,最终生成高质量的回答。

其中一项要求,就是所有API名称必须描述整体功能行为。例如,detect_object(object_name) 函数可以在内部链接到OpenCV函数或计算机视觉模型。

设计好库和API后,微软给ChatGPT编写了一个文本提示(prompt),描述目标任务,并明确说明函数库中哪些函数可用;另外,这还能规定ChatGPT生成代码用哪种编程语言。

4995e1f6-cbdd-11ed-bfe3-dac502259ad0.png

值得一提的是,AI生成内容效果,和人为提示的质量呈正相关。为此,微软还开发了一个协作开源平台PromptCraft,任何人都能在此分享不同类机器人的Prompt策略。

49bf6e4a-cbdd-11ed-bfe3-dac502259ad0.png

到此,幕后部署基本完成,然后用户就能通过“说人话”间接操控机器人了。

如果想要检查AI生成的代码是否有Bug,随时都能在聊天框直接检查,或通过模拟器测试,人类可以用自然语言指导AI进行修正。

另外,还能到等到用户对解决方案满意为止,再在将ChatGPT生成代码部署到机器人上。

最后,如果是你,会想用ChatGPT操控机器人做些什么呢?

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30637

    浏览量

    219805
  • 编程语言
    +关注

    关注

    10

    文章

    1960

    浏览量

    39008
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10095

原文标题:ChatGPT已能操控机器人,工程师连代码都不用写,网友:微软在搞天网?

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    高精度机器人控制的核心——基于 MYD-LT536 开发板的精密运动控制方案

    ”应用提供了强大的硬件支撑。 五、结语 “高精度机器人控制”是智能制造时代的核心竞争力。 米尔 MYD-LT536 开发板凭借强大的计算能力、丰富的工业接口与成熟的系统生态,能够帮助工程师快速搭建高精度
    发表于 11-14 15:48

    小萝卜机器人的故事

    代替, LED, 有大佬感兴趣, 一起关注和讨论代码, 这个机器人知名度不高, 可是是机器人的原型, 如果开放接口, 定位和无线充电, 也不失为未来的礼物。 让我们为小萝卜工程师的,
    发表于 10-23 05:24

    硬件工程师的 “鄙视链” 新动向:代码的,凭啥瞧不起画图的?

    “  在海外硬件工程师的世界里,一场关于设计灵魂归属的“圣战”已悄然打响。一边是信奉“所见即所得”、手握鼠标精雕细琢的“画图派”;另一边,则是高举“代码即真理”、用键盘召唤电路的“码派”。这不
    的头像 发表于 08-06 11:21 3266次阅读
    硬件<b class='flag-5'>工程师</b>的 “鄙视链” 新动向:<b class='flag-5'>写</b><b class='flag-5'>代码</b>的,凭啥瞧不起画图的?

    工业机器人的特点

    的基础,也是三者的实现终端,智能制造装备产业包括高档数控机床、工业机器人、自动化成套生产线、精密仪器仪表、智能传感器、汽车自动化焊接线、柔性自动化生产线、智能农机、3D 打印机等领域。而智能制造装备中工业
    发表于 07-26 11:22

    人形机器人背后的“灵魂导师”:工程师示教的价值与富唯智能的实践

    示教不是对机器的妥协,而是对人机协同的深度赋能。正如训练吴广所言:“要把机器人当作伙伴”——工程师输入的不仅是数据,更是让机器理解物理世界
    的头像 发表于 07-05 16:15 609次阅读
    人形<b class='flag-5'>机器人</b>背后的“灵魂导师”:<b class='flag-5'>工程师</b>示教的价值与富唯智能的实践

    工业通信界的“月老”:CC\\-Link IE和DeviceNet如何牵起机器人的“红线”

    。 某机械制造企业就曾遇到过“通信尴尬”。新购入的工业机器人只支持CC-Link IE,而车间里的传感器、执行器等老设备还在用DeviceNet网关协议,导致“新老设备”各说各话。工程师引入协议转换方案后
    发表于 06-12 14:35

    机器人遇上“语言障碍”:CCLINKIE转Profinet的“破冰外挂”来啦\\!

    在汽车焊装车间的技术角,工程师小陈的笔记本记满了“跨协议难题”:当搭载Profinet的库卡机器人遇上CCLINKIE总线的三菱PLC,数据交互像隔着玻璃喊话——PLC发送的坐标指令要“绕地球半圈
    发表于 06-04 14:31

    STM32+Android实现的智能家政机器人电路代码论文及项目源码

    STM32+Android实现的智能家政机器人电路代码论文及项目部分截图:
    发表于 05-28 21:22

    盘点#机器人开发平台

    地瓜机器人RDK X5开发套件地瓜机器人RDK X5开发套件产品介绍 旭日5芯片10TOPs算力-电子发烧友网机器人开发套件 Kria KR260机器人开发套件 Kria KR260-
    发表于 05-13 15:02

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    ROS的全称:Robot Operating System 机器人操作系统 ROS的 目的 :ROS支持通用库,是通信总线,协调多个传感器 为了解决机器人里各厂商模块不通用的问题,让机器人快速开发
    发表于 04-30 01:05

    工业机器人设计工程师必备指南免费下载

    德州仪器(TI)的模拟和嵌入式技术以及参考设计在开发智能、自主和协作的机器人方面发挥着关键作用。通过这些技术,工程师可以构建多种类型的工业机器人,实现精确的电机控制、差异化的传感技术和边缘处理功能
    的头像 发表于 03-20 18:58 1148次阅读
    工业<b class='flag-5'>机器人</b>设计<b class='flag-5'>工程师</b>必备指南免费下载

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    需要专业程序员进行繁琐的编程工作,这种方式不仅效率低下,还限制了机器人的应用场景。例如,在我们大学工程实训课程中使用的数控机床,需要人为设定起点、终点、移动方向和移动距离等参数,自动化程度非常有限。而
    发表于 12-29 23:04

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    研读《具身智能机器人系统》第7-9章,我被书中对大模型与机器人技术融合的深入分析所吸引。第7章详细阐述了ChatGPT for Robotics的核心技术创新:它摒弃了传统的分层控制架构,创造性地
    发表于 12-24 15:03

    【「具身智能机器人系统」阅读体验】+初品的体验

    的快速发展,相关人才的需求也在不断增加,通过阅读该书可以帮助大家系统性地了解和分析当前具身智能机器人系统的发展现状和前沿研究,为未来的研究和开发工作提供指导。此外,本书还可以为研究人员和工程师提供具体
    发表于 12-20 19:17

    《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

    与环境持续互动来优化决策策略。书中还进一步讨论了强化学习的基本原理,包括状态空间、动作空间、奖励函数的设计,以及策略网络的训练方法。 具身智能机器人系统是一个多学科知识交叉的复杂工程体系。每个子系统都
    发表于 12-19 22:26