0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI 发了一个支持 ESP32 的 Realtime API SDK

KiCad 来源:KiCad 作者:KiCad 2024-12-21 11:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

昨晚 OpenAI 正式发布了 o3 模型,AI 圈一片沸腾。作为电子工程师的我挠了挠头,好像和我没什么直接的关系倒是 OpenAI 的另一个小发布,让我很感兴趣:一个可以在 LinuxESP32 上使用的 Realtime API SDK。

bb0aa66e-bf4c-11ef-902f-92fbcf53809c.png 对,就是上面这个项目,刚发布没多久,文档都几乎没有。感兴趣的小伙伴可以自己去看一下: https://github.com/openai/openai-realtime-embedded-sdk 这个 SDK 能干嘛?

这个 SDK 主要是给嵌入式硬件设计的,目前只支持乐鑫的 ESP32s3。以下是经过验证的两个开发板:

Freenove ESP32-S3-WROOM

Sonatino - ESP32-S3 Audio Development Board

其它的 ESP32-S3 硬件理论上也能跑,只是没有经过验证。 当然如果你只想玩一下,也可以不用任何硬件,直接在 Linux 上运行。

SDK 基于 OpenAI 最新的 WebRTC,可以提供低延时的语音对话服务。Altman 在发布会上演示的 AI 实时语音对话、打断等就是基于 WebRTC。感兴趣的小伙伴可以看一下 WebRTC 的介绍:

https://platform.openai.com/docs/guides/realtime-webrtc

bb23b7b2-bf4c-11ef-902f-92fbcf53809c.png

配置完成后build一下,然后烧录到 ESP32S 的固件里即可。接下去就可以直接调用 API 了。这种方式简化了硬件调用实时语音,甚至视觉识别的方法,典型的应用有:

陪伴类的玩具

可穿戴设备

智能音箱/语音助手

国内有平替吗?

如果用不了 OpenAI,国内其实也有类似的服务,比如火山引擎的 RTC:

https://www.volcengine.com/product/veRTC

字节推出的显眼包2.0用的就是 RTC 服务:

在上周的“2024火山引擎冬季Force原动力大会”上,已经有不少硬件厂商展示了基于 RTC 的产品demo。其中有一个品牌“Haivivi”做了现场演讲,分享了他们的理念和创业经历。虽然只是一个“可以对话”的玩具,却有别于传统的智能音箱,得到了很多用户的认可。我在现场也体验了一下RTC的效果,延时在2~5秒之间,基本可以满足实时对话的要求。

字节的产品经理也提到了嵌入式的 SDK,但没有详细公布支持的硬件型号,估计还处于测试阶段。但毫无疑问,ESP肯定是合作伙伴之一。

“端插件”是什么?

专题论坛中还提到了“端”插件的概念。简单说就是把硬件的功能(比如调节音量、驱动电机等)以插件的形式注册在大模型的平台,端侧的硬件只要收集用户的输入,传输到大模型后由模型进行数据处理并根据解析的结果调用“端”插件执行硬件端的动作。

bb5cb26a-bf4c-11ef-902f-92fbcf53809c.jpg

这种范式有可能降低硬件端的成本(因为端侧不再需要算力,只要做输入、输出及信息交互),并有可能降低开发的时间(可以很快添加语音识别、图像识别等功能,因为不用基于硬件开发,可以直接丢给模型处理)。这里的潜台词是:类似语音交互、图像识别的任务,大模型一定比本地的硬件做的好。当然前提是要能接受数据传输和处理的延时,另外数据安全也是需要考虑的因素之一。

结束语 人工智能技术尤其是大模型和AIGC正以前所未有的速度迅猛发展,它们的影响力已经渗透到各个行业,包括电子硬件领域。作为电子硬件工程师,我们站在技术革新的前沿,面临着前所未有的机遇与挑战。我们必须深入思考,如何将AIGC等前沿技术与硬件设计相结合,以实现创新突破。打造出更智能、更高效、更符合市场需求的产品,从而在激烈的市场竞争中占据有利地位。

注意:如果想第一时间收到 KiCad 内容推送,请点击下方的名片,按关注,再设为星标。

常用合集汇总:

和 Dr Peter 一起学 KiCad

KiCad 8 探秘合集

KiCad 使用经验分享

KiCad 设计项目(Made with KiCad)

常见问题与解决方法

KiCad 开发笔记

插件应用

发布记录

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • API
    API
    +关注

    关注

    2

    文章

    2473

    浏览量

    67003
  • SDK
    SDK
    +关注

    关注

    3

    文章

    1111

    浏览量

    52003
  • ESP32
    +关注

    关注

    27

    文章

    1222

    浏览量

    22320
  • OpenAI
    +关注

    关注

    9

    文章

    1249

    浏览量

    10271
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    亚马逊 Alexa Connect Kit SDK for Matter 现已支持乐鑫 ESP32-C6

    ESP32-C3之后,亚马逊AlexaConnectKit(ACK)SDKforMatter现已支持乐鑫信息科技(688018.SH)ESP32-C6,为设备制造商新增款经认证的平
    的头像 发表于 04-15 18:04 372次阅读
    亚马逊 Alexa Connect Kit <b class='flag-5'>SDK</b> for Matter 现已<b class='flag-5'>支持</b>乐鑫 <b class='flag-5'>ESP32</b>-C6

    亚马逊Alexa Connect Kit SDK for Matter现已支持乐鑫信息科技ESP32-C6

    ESP32-C3 之后,亚马逊 Alexa Connect Kit (ACK) SDK for Matter 现已支持乐鑫信息科技 (688018.SH) ESP32-C6,为设备
    的头像 发表于 04-14 09:47 308次阅读

    ESP32/ESP8266开发板单向多对ESP-NOW无线通信

    本实验通过ESP-NOW无线通信协议实现多个ESP32/ESP 8266开发板向ESP32开发板发送数据。例如可以应用于从多个远程传感器上收集数据。
    的头像 发表于 03-30 10:14 173次阅读
    <b class='flag-5'>ESP32</b>/<b class='flag-5'>ESP</b>8266开发板单向多对<b class='flag-5'>一</b><b class='flag-5'>ESP</b>-NOW无线通信

    ESP32开发板单向点对点ESP-NOW无线通信

    本例程通过两ESP32开发板实现单向点对点ESP-NOW无线通信,ESP32开发板作为Se
    的头像 发表于 03-19 09:21 304次阅读
    <b class='flag-5'>ESP32</b>开发板单向点对点<b class='flag-5'>ESP</b>-NOW无线通信

    ESP32/ESP8266开发板单向对多ESP-NOW无线通信

    通过ESP-NOW无线通信协议实现ESP32开发板向多个ESP32/ESP 8266开发板发送数据。
    的头像 发表于 03-13 09:23 280次阅读
    <b class='flag-5'>ESP32</b>/<b class='flag-5'>ESP</b>8266开发板单向<b class='flag-5'>一</b>对多<b class='flag-5'>ESP</b>-NOW无线通信

    无需安装!在浏览器里就能玩转ESP32/ESP8266,这个神器绝了!

    使用教程)ESP32-运行网页服务器(WebServer)-实用篇介绍扔掉繁琐的桌面软件,浏览器搞定所有ESP开发调试需求温馨提示私信:ESPConnect即可获取
    的头像 发表于 01-10 10:01 1374次阅读
    无需安装!在浏览器里就能玩转<b class='flag-5'>ESP32</b>/<b class='flag-5'>ESP</b>8266,这个神器绝了!

    乐鑫科技ESP-AMP框架详解!两款已支持ESP32-P4C5开发板推荐!启明云端乐鑫科技代理

    在多核嵌入式开发中,如何实现任务的高效分工与跨核通信,直是开发者关注的重点。ESP-AMP作为专为ESP32系列打造的非对称多处理框架,现已支持主核运行FreeRTOS、从核运行裸机
    的头像 发表于 12-18 18:02 1929次阅读
    乐鑫科技<b class='flag-5'>ESP</b>-AMP框架详解!两款已<b class='flag-5'>支持</b>的<b class='flag-5'>ESP32</b>-P4C5开发板推荐!启明云端乐鑫科技代理

    ESP8266和ESP32开发板常见的2种下载方式

    ESP32ESP8266是性价比很高而且使用较为广泛的的Wi-Fi模块,在物联网(IoT)领域的DIY项目中可以首先考虑这2款产品。 两款芯片都属于32位处理器。ESP32是低功耗双核80MHz
    的头像 发表于 11-10 20:30 1365次阅读
    <b class='flag-5'>ESP</b>8266和<b class='flag-5'>ESP32</b>开发板常见的2种下载方式

    乐鑫ESP32-C6和ESP32-C61究竟该如何选择?文读懂本质区别

    设备互联;ESP32-C61则专注Wi-Fi6和蓝牙5 LE的高效终端性能,支持PSRAM扩展和增强安全功能,适合高性能单设备。
    的头像 发表于 10-28 14:17 2631次阅读
    乐鑫<b class='flag-5'>ESP32</b>-C6和<b class='flag-5'>ESP32</b>-C61究竟该如何选择?<b class='flag-5'>一</b>文读懂本质区别

    专为 ESP32-P4C5 核心板打造的高效开发利器

    SDK+详尽文档,新手秒上手,高手效率翻倍!双芯片设计,释放澎湃性能ESP32-P4C5核心板采用乐鑫科技的ESP32-P4+ESP32-C5双芯架构!·ESP32-P
    的头像 发表于 08-11 18:19 1372次阅读
    专为 <b class='flag-5'>ESP32</b>-P4C5 核心板打造的高效开发利器

    ESP32-运行网页服务器(Web Server)-实用篇

    在前篇文章《ESP32-运行网页服务器(WebServer)-入门篇》,我们介绍了ESP32运行网页服务器(WebServer)的原理,然后我们基于ESP32实现了
    的头像 发表于 07-28 18:05 4032次阅读
    <b class='flag-5'>ESP32</b>-运行网页服务器(Web Server)-实用篇

    ESP32开发板元件资料

    ESP32开发板元件
    发表于 07-21 14:47 17次下载

    ESP32-P4—具备丰富IO连接、HMI和出色安全特性的高性能SoC

    和IO连接特性等方面提出的更高需求。 卓越性能: ESP32-P4搭载RISC-V双核处理器,主频高达400MHz,支持单精度FPU和 AI扩展,可满足所有必要的算力需求。它还集成了
    的头像 发表于 06-26 09:59 2297次阅读
    <b class='flag-5'>ESP32</b>-P4—具备丰富IO连接、HMI和出色安全特性的高性能SoC

    如何获取 OpenAI API Key?API 获取与代码调用示例 (详解教程)

    OpenAI API Key 获取与使用详解:从入门到精通 OpenAI 正以其 GPT 和 DALL-E 等先进模型引领全球人工智能创新。其 API 为开发者和企业提供了强大的 AI
    的头像 发表于 05-04 11:42 1.8w次阅读
    如何获取 <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b> Key?<b class='flag-5'>API</b> 获取与代码调用示例 (详解教程)

    乐鑫ESP32-H4:支持 802.15.4 和 Bluetooth 5.4 (LE) 的低功耗 SoC

    乐鑫信息科技(688018.SH)推出的ESP32-H4,继ESP32-H2后进步丰富了公司的802.15.4和BluetoothLE产品矩阵。这款融合了802.15.4和Bluetooth5.4
    的头像 发表于 04-24 18:08 2291次阅读
    乐鑫<b class='flag-5'>ESP32</b>-H4:<b class='flag-5'>支持</b> 802.15.4 和 Bluetooth 5.4 (LE) 的低功耗 SoC