0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让大模型“开口说话”,启英泰伦重塑AI玩具交互新体验!

启英泰伦 2025-04-11 18:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2025年,AI玩具已成为全球消费科技领域最炙手可热的赛道之一。DeepSeek的崛起,显著降低了大模型的部署成本和门槛,成功点燃了整个行业以及资本市场对端侧AI落地的热情,进一步推动了AI玩具的热潮。

从市场需求来看,AI玩具正在重新定义儿童陪伴与教育的方式,不仅满足“玩”的基本需求,而且,通过智能“拟人化”交互可为儿童提供丰富的情绪价值。数据显示,2024年全球AI玩具市场规模已达181亿美元,并以16%的年复合增长率持续扩张,预计2033年将突破600亿美元。越来越多的厂商正在积极布局AI玩具领域,然而,如何在激烈的市场竞争中脱颖而出,打造一款功能全面、用户体验卓越的差异化产品,成为企业成功突围的关键。

离在线语音大模型方案演示


启英泰伦深耕智能语音行业十年,现重磅推出AI玩具离在线语音大模型方案,相比行业现有方案具有以下五大优势

01

语音唤醒,自然交互与隐私保护兼得

目前,大部分AI玩具还需要依赖触摸按键发起对话,交互生硬,影响用户体验;或者持续监听数据上传云端泄露用户隐私,难以获得家长信赖。

而本方案通过融入基于DNN的端侧 VAD (语音活动检测)算法,可直接通过语音唤醒,避免了复杂的操作。AI玩具实时检测用户语音输入,仅在检测到有效语音时才上传大模型进行云端处理,兼顾自然交互与隐私保护。

02

实时性强,交互流畅

延迟是影响用户体验的关键因素。当语音交互延迟超过1秒时,用户将感觉到明显的滞后感,会显著降低交互流畅性和增加用户焦虑情绪。

本方案通过基于DNN的端侧VAD算法及深度降噪算法,将语音数据处理部署到芯片端,能够保证传到云端的是经过处理的、高质量的语音数据,避免云端处理冗余数据及大规模计算任务带来的响应延迟,满足儿童与设备实时互动需求。

03

高识别准确度,适应复杂噪声环境

目前,大部分AI玩具缺乏语音降噪功能,导致在嘈杂环境中语音识别准确率低,儿童需重复指令,影响使用体验。本方案采用基于DNN的深度降噪技术,具备更强的自适应性和泛化能力,能够在不同的噪音环境中保持优异的降噪效果,为云端大模型提供了更干净的语音,极大提升了云端大模型的语音识别准确率。

04

随时打断,提升交互效率

目前,大部分AI玩具必须等待回答结束后才能响应新的指令,交互效率低。本方案基于回声消除技术,结合VAD算法,可有效抑制回声,实现实时打断功能,让儿童无需漫长等待即可继续进行语音指令输入,保障了用户体验的流畅性与即时性。

05

指向性交互,打造沉浸式人机互动体验

一般AI玩具缺乏对声源方向的感知,无法与用户建立自然的关注互动,互动体验单一。本方案基于DNN声源定位算法,可实现多场景下的指向性交互,设备可感知儿童的声音方向并主动“看向”用户或向用户方向移动,模拟真实互动场景,增强互动的自然性与趣味性。

1c8bc88a-16c0-11f0-9434-92fbcf53809c.png

AI玩具离在线语音大模型方案功能框图启英泰伦现已推出适用于CI1302、CI1303、CI1306离线AI语音芯片和CI2305、CI2306 AI语音Wi-Fi Combo芯片的AI玩具离在线语音大模型方案。

CI1302、CI1303

基于该芯片,启英泰伦提供基于DNN的本地语音唤醒及语音识别、语音深度降噪、端点检测、命令词自学习、回声消除,另还提供Speex、Opus数据压缩、MP3流媒体播放等功能。启英泰伦提供前端功能SDK,用户可基于自主选型的WIFI进行云端开发。

1ca4f83c-16c0-11f0-9434-92fbcf53809c.png


该方案采用单麦克风,对结构要求相对较低,适用于各类AI玩具。

CI1306

基于该芯片,启英泰伦提供基于DNN的本地语音唤醒及语音识别、语音深度降噪、端点检测、声源定位、回声消除,另还提供Speex、Opus数据压缩、MP3流媒体播放等功能。启英泰伦提供前端功能SDK,用户可基于自主选型的WIFI进行云端开发。

1cc2eaa4-16c0-11f0-9434-92fbcf53809c.png

该方案采用双麦克风,可实现声源定位,适用于需要指向性交互的AI玩具、桌面宠物等。

CI2305、CI2306

基于该芯片,启英泰伦提供语音和WIFI相关功能。语音功能包括基于DNN的本地语音唤醒及语音识别、语音深度降噪、端点检测、声源定位、回声消除,另还提供Speex、Opus数据压缩、MP3流媒体播放等功能。WIFI功能包括录音数据和播放数据转发、BLE蓝牙配网、产品部分功能逻辑,支持TCP/MQTT/UDP网络传输协议。启英泰伦提供芯片对接云平台服务商的SDK,用户可基于此SDK进行端上功能开发。

1cdb801e-16c0-11f0-9434-92fbcf53809c.png

该方案集成WIFI,可降低整个方案的成本。包括单麦克风、双麦克风两种方案,双麦克风可实现指向性交互。

启英泰伦AI玩具离在线语音大模型方案,基于启英泰伦神经网络语音芯片,支持OTA升级,也可用于智能家电、AI教育、养老陪护、机器人等产品,全面解决行业痛点,为厂商提供极具竞争力的差异化解决方案。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38103

    浏览量

    296624
  • 交互
    +关注

    关注

    1

    文章

    73

    浏览量

    15290
  • 启英泰伦
    +关注

    关注

    1

    文章

    57

    浏览量

    1682
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4967
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI在此10 成立10周年啦!

    成立十周年十年在科技奔腾不息的长河中不过一瞬但对于中国AI语音产业而言这十年却是一段从无到有的波澜壮阔的岁月十年前一句“你好”,可能
    的头像 发表于 11-25 09:29 349次阅读
    <b class='flag-5'>AI</b>在此10 <b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>成立10周年啦!

    扬方案】基于扬RK3588的移动AI数字人,助力智能交互新体验

    在数字化浪潮席卷的今天,人机交互的边界不断被打破。移动AI数字人通过深度融合的人工智能、高拟真图像渲染以及人机交互能力,重塑人机交互新形态。
    的头像 发表于 10-16 17:29 1038次阅读
    【<b class='flag-5'>启</b>扬方案】基于<b class='flag-5'>启</b>扬RK3588的移动<b class='flag-5'>AI</b>数字人,助力智能<b class='flag-5'>交互</b><b class='flag-5'>新体验</b>

    喜报 | 获得2025年成都市企业技术中心认定!

    近日,成都市经济和信息化局公布了2025年度市级企业技术中心认定名单,(国家专精特新“小巨人”企业)凭借在人工智能语音芯片领域的持续技术创新与产业贡献,正式认定为“成都市企业技
    的头像 发表于 09-28 17:10 799次阅读
    喜报 | <b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>获得2025年成都市企业技术中心认定!

    语音播报芯片:产品“开口说话”的秘密

    个语音播报,收款24元等等。不知道大家发现没有会“说话”的产品越来越多了,不仅仅是声音播放,还可以进行语音交互也就是大家说的AI对话芯片,下面小编将会带大家一起了解语音播报背后的那些芯片。  
    的头像 发表于 09-28 09:28 382次阅读
    语音播报芯片:<b class='flag-5'>让</b>产品“<b class='flag-5'>开口说话</b>”的秘密

    二次元玩具开口说话”!N9400 芯片为你的周边注入灵魂

    还在为二次元周边玩具缺乏互动感发愁?想手办、盲盒、扭蛋自带角色原声却被成本卡住?广州九芯电子——深耕电子芯片15年的源头工厂,带着爆款语音播放芯片N9400来了!专为二次元玩具厂家量身定制,用硬核
    的头像 发表于 08-13 14:03 526次阅读
    <b class='flag-5'>让</b>二次元<b class='flag-5'>玩具</b> “<b class='flag-5'>开口说话</b>”!N9400 芯片为你的周边注入灵魂

    信而×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    流量透视:构建业务数字孪生,数据“开口说话”l 过分布式探针无死角采集全网L2-L7层全流量数据。l 结合深度报文解析(DPI)技术,实时构建精准的业务流量数字孪生。l 无论HTTP接口调用异常
    发表于 07-16 15:29

    亮相成都人工智能专场路演,发布具身智能新战略!

    "语音入口"到"机器人大脑":端侧AI芯片的三步跃迁在路演中,介绍了公司面向具身智能的端侧AI
    的头像 发表于 06-06 17:56 945次阅读
    <b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>亮相成都人工智能专场路演,发布具身智能新战略!

    涂鸦WuKong AI 2.0开发框架发布!情绪感知+多模态交互,重新定义AI玩具新体验

    一、AI玩具市场潜力有多强?随着AI模型能力的发展和成本的降低,全球玩具市场迎来新的发展机遇。尤其是2025年春节后,国内电商平台的
    的头像 发表于 03-27 20:30 1392次阅读
    涂鸦WuKong <b class='flag-5'>AI</b> 2.0开发框架发布!情绪感知+多模态<b class='flag-5'>交互</b>,重新定义<b class='flag-5'>AI</b><b class='flag-5'>玩具</b><b class='flag-5'>新体验</b>

    移远通信智能模组全面接入多模态AI模型重塑智能交互新体验

    随着千行百业数智化进程的不断加速,多模态AI模型的应用需求不断攀升,图像、语音、视频等多样化的交互方式正逐渐成为推动行业变革的新动力。   3月20日,全球物联网整体解决方案供应商移远通信宣布,其
    发表于 03-21 14:12 426次阅读
    移远通信智能模组全面接入多模态<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>,<b class='flag-5'>重塑</b>智能<b class='flag-5'>交互</b><b class='flag-5'>新体验</b>

    移远通信智能模组全面接入多模态AI模型重塑智能交互新体验

    随着千行百业数智化进程的不断加速,多模态AI模型的应用需求不断攀升,图像、语音、视频等多样化的交互方式正逐渐成为推动行业变革的新动力。3月20日,全球物联网整体解决方案供应商移远通信宣布,其全系
    的头像 发表于 03-20 19:03 665次阅读
    移远通信智能模组全面接入多模态<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>,<b class='flag-5'>重塑</b>智能<b class='flag-5'>交互</b><b class='flag-5'>新体验</b>

    新品发布|联合启明云端推出离在线语音大模型方案

    数据及大规模计算任务带来的响应延迟。其根本原因在于缺乏一颗强计算性能的端侧语音处理芯片。近日,联合启明云端正式推出WT01C202-AI
    的头像 发表于 03-11 14:07 1000次阅读
    新品发布|<b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>联合启明云端推出离在线语音大<b class='flag-5'>模型</b>方案

    移远通信AI玩具整体解决方案全面升级:融合火山引擎RTC大模型,打造实时交互新体验

    2月20日,全球领先的物联网整体解决方案供应商移远通信宣布,其AI玩具整体解决方案已实现全面的完善和升级。该方案深度融合火山引擎AI模型能力,集无线通信模组、音频算法、物联网平台和收
    发表于 02-21 09:50 500次阅读
    移远通信<b class='flag-5'>AI</b><b class='flag-5'>玩具</b>整体解决方案全面升级:融合火山引擎RTC大<b class='flag-5'>模型</b>,打造实时<b class='flag-5'>交互</b><b class='flag-5'>新体验</b>

    移远通信AI玩具整体解决方案全面升级:融合火山引擎RTC大模型,打造实时交互新体验

    2月20日,移远通信宣布,其AI玩具整体解决方案已实现全面的完善和升级。该方案深度融合火山引擎AI模型能力,集无线通信模组、音频算法、物联网平台和收费管理平台于一体,可为
    的头像 发表于 02-20 19:06 899次阅读
    移远通信<b class='flag-5'>AI</b><b class='flag-5'>玩具</b>整体解决方案全面升级:融合火山引擎RTC大<b class='flag-5'>模型</b>,打造实时<b class='flag-5'>交互</b><b class='flag-5'>新体验</b>

    佛山市市委常委、政法委书记陈小坚一行到考察调研

    2月10日,佛山市市委常委、政法委书记陈小坚一行到考察调研,深入了解
    的头像 发表于 02-11 17:07 1725次阅读
    佛山市市委常委、政法委书记陈小坚一行到<b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>考察调研

    新推出多意图自然说,重塑离线人机交互新标准!

    智能语音识别技术作为人机交互领域的一场革命性突破,正逐步重塑我们与智能设备的交互方式。近期,
    的头像 发表于 01-03 16:01 846次阅读
    <b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>新推出多意图自然说,<b class='flag-5'>重塑</b>离线人机<b class='flag-5'>交互</b>新标准!