0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

讯飞超拟人交互API上线

讯飞开放平台 来源:讯飞开放平台 2025-07-10 15:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“快点!导航去最近的医院!”,当你焦急地对车载助手说到。

“好的,正在为您规划路线……”,传统AI在几秒后,以平淡语气回应。一个真正AI应该迅速回应,以沉稳语气说到:“好的,已为您规划最快路线,预计12分钟到达。请小心驾驶!”

让AI感知用户情绪,从冰冷服务进化成为心意相通的助手,这并非存在于《Her》或《钢铁侠》等科幻电影。大模型加持的语音交互全新升级,能够轻松应对多轮对话,而且实现情绪响应和个性定制。

2024年8月,科大讯飞发布了星火极速超拟人交互技术,在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现巨大突破,让语音交互速度变得更快,能够感知你话语里的喜怒哀乐并用合适的情绪回复,还可根据需要让超拟人的声音变换节奏、大小,甚至切换不同的角色声音和性格对话。

现在超拟人交互API正式上线讯飞开放平台,面向开发者开放调用。通过接入相应的API,开发者无需从零开始搭建复杂架构,即可实现用户与AI的实时语音互动,构建契合业务场景的AI实时对话能力,提供高效流畅的沟通体验。从游戏NPC、虚拟助手到智能客服与数字导游,语音交互的想象边界正在被重新定义。

01秒级响应,双商在线的超拟人交互

作为人类与AI交流的最主要入口,语音交互已渗透至我们的日常工作生活中:叫音箱播放指定音乐、让扫地机器人定时工作、对车载系统喊一句“导航回家”。AI游戏陪玩、AI虚拟陪伴、AI口语陪练等,各种AI应用对语音交互的需求也呈爆发式增长。

然而,在实际使用中,传统语音交互仍存在明显痛点:

响应迟缓:动辄数秒的延迟,打断对话节奏,带来强烈的割裂感。

情绪单一: 机械化的语调,缺乏情感温度,难以建立真正的连接。

语境缺失: 难以理解言外之意,导致交互中断或理解错位。

大模型时代下,当我们从技术层面分析传统语音交互体验不佳的原因会发现,传统语音交互如同一个需要分布处理的流水线:语音输入后,先由“语音识别”车间转成文字,再交由“大模型”车间思考回复文本,最后由“语音合成”车间将文字朗读出来。这个串联过程不仅步骤繁琐,且每个环节都存在延迟,累加起来,3秒的响应时间已是常态。

同时,文本是其中传递信息的载体,在语音转文字再转语音的过程中,语音的很多情感、副语言信息甚至是环境信息都会丢失,导致语音交互系统只能针对语音的文本内容进行回应,会忽略我们在语音中本身真实的情感、语气等元素。

在许多关键场景中,延迟意味着无法用,甚至危险。如:导航指令若晚几秒反馈,用户可能已错过路口;与智能客服沟通时,频繁的“空白加载”足以让用户不耐烦地挂断电话。大模型的“聪明”,只有搭配“实时”的响应,才能成为真正有温度、有价值的交互智能。正如智能手机时代的流畅滑动是用户接受触屏的关键,「实时」是AI接口从“尝鲜”走向“常用”的门槛。

星火极速超拟人交互则跨文本和音频模态,采用了统一神经网络直接实现语音到语音的端到端建模:

1语音通过音频编码器得到音频表征后,通过适配器与文本语义表征进行对齐;

2对齐完成之后的内容输入多模LLM,预测输出表征;

3经过音频解码器后,最终输出情绪自然、节奏准确的合成语音。

星火极速超拟人语音交互技术框架图

相比于传统的交互系统,统一的模型大大提升了整体的响应和打断速度,人与AI的交互也从你问我答的“微信语音模式”,切换到了实时响应的“微信通话模式”。

但反应迅速只是第一步,没有情感的交互依旧是“冷冰冰”的机器。如何让语音交互更有温度?

在星火极速超拟人交互系统中,基于端到端框架之上,融入了多维度语音属性解耦表征训练,将内容、情感、语种、音色、韵律等属性进行解耦,进行对比学习和掩码预测。不仅实现了内容识别更准、情感等属性感知度更高,还可以更便捷进行定制,方便系统快速落地。

02“快、准、真”,打造下一代AI语音应用

基于语音交互技术的突破,面向开发者开放的超拟人交互API具有三大核心优势:

同时,讯飞开放平台还为开发者提供了详细开发文档,方便开发者们快速上手并了解超拟人交互API 的各项功能特色、调用过程中的常见错误。

03多场景快速落地,成本低至0.1元/分钟

超拟人交互API的上线,不仅为开发者提供了一种新的语音应用开发范式,降低了开发门槛,也让开发者能够更加聚焦应用创新和场景落地,以更天马行空的想象力,创造出更具“生命力”的AI应用。

文旅场景

结合故事演绎和RAG(检索增强生成),AI可以作为数字导游为游客介绍景点,在特定场景下与游客进行角色扮演互动,让游客“沉浸于”历史。

游戏场景

基于角色人设,模型与玩家互动时,可以自动生成符合该角色价值观、人生经历、语气的对话,让虚拟角色栩栩如生。

智能助手场景

可自由设定AI助理各种不同的人设,并以符合人设的背景、语气与用户互动,为每个用户打造独一无二的AI助理。

智能玩具场景

通过生动复刻各类IP角色,并以角色特有的性格、口吻与儿童互动,建立强烈的情感链接与代入感。

为进一步降低高质量语音交互的落地门槛,让开发者“轻装上阵”,在API调用成本上,讯飞开放平台也提供了极具诚意的产品价格:每分钟交互成本低至0.1元,这意味着,仅需用一杯咖啡的钱,就能让应用与用户“畅聊”数小时。

此外,通过企业认证,开发者还可“解锁”有效期3个月,长达10小时的免费试用,实现对产品的快速验证。

从OpenAI、微软、谷歌等AI巨头,到Character AI 的新锐AI创业公司,语音交互正成为AI应用公司最强大的突破口之一。科大讯飞凭借在语音技术领域持续二十余年的深耕,在这一赛道上有着强大的技术实力和市场竞争力。

IDC发布的报告显示,2024年上半年,中国人工智能语音语义整体市场规模为 72.3 亿元人民币,同比增长18%,科大讯飞市场份额在主要厂商中位居第一,持续引领行业发展。

现在,借助讯飞开放的超拟人交互API,开发者可以轻松打造真正“能听会说、情感在线”的AI应用,提高产品竞争力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41115

    浏览量

    302606
  • 科大讯飞
    +关注

    关注

    19

    文章

    866

    浏览量

    63938
  • 交互技术
    +关注

    关注

    0

    文章

    38

    浏览量

    12985

原文标题:首次开放,讯飞超拟人交互API上线!

文章出处:【微信号:讯飞开放平台,微信公众号:讯飞开放平台】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科大桌面智能助理Loomy正式发布

    Loomy是推出的基于 AstroncClaw 打造的桌面级助理,主打本地办公场景Skills,同时支持用户自定义的SkillHub,面向全球生态开放共享。
    的头像 发表于 03-18 11:03 1190次阅读

    智文产品完成重磅升级

    2026年伊始,当智能体成为人人可用的数字生产力,智文完成重磅升级。全新打造的「智能演练」与「AI演示官」,首次实现“写、练、演”一体化的表达链路,重塑AI PPT全流程,让每个观点都能被从容讲述、生动传递。
    的头像 发表于 01-08 16:41 1012次阅读

    科大设立子公司:加码AI与集成电路业务布局

    电子发烧友网综合报道,人工智能领军企业科大近日再添新动作,正式成立山东沂信息科技有限公司。该公司成立于2025年12月19日,注册地位于临沂市,法定代表人为柳升华,注册资本5000万元
    发表于 12-29 08:53 1911次阅读

    星辰Agent平台入选36氪WISE 2025年度焦点产品

    近日,凭借在企业应用落地方面的卓越表现,星辰Agent平台成功入选“36氪 WISE2025年度焦点产品”。
    的头像 发表于 12-17 11:47 864次阅读

    2025科大全球1024开发者节精彩回顾

    当全球产业格局和竞争形态重塑之时,AI将如何发展?11月6日,在第八届世界声博会暨2025科大全球1024开发者节发布会上,科大董事长刘庆峰以《更懂你的AI》为主题,给出了清晰
    的头像 发表于 11-10 11:51 1154次阅读
    2025科大<b class='flag-5'>讯</b><b class='flag-5'>飞</b>全球1024开发者节精彩回顾

    科大发布星火X1.5及系列AI产品

    11月6日,第八届世界声博会暨2025科大全球1024开发者节发布会上,科大以《更懂你的AI》为主题发布
    的头像 发表于 11-10 11:49 1140次阅读

    教你如何使用API

    。在网络环境中,API使得应用程序能够彼此交互。在软件或硬件中,API使得不同的组件能够互相操作。 在编写代码调用API之前,你需要了解API
    的头像 发表于 11-09 17:48 1504次阅读

    思必驰助力吉利银河M9首发拟人情感智能体Eva

    近日,吉利汽车旗下AI科技大六座SUV一吉利银河M9正式上市,思必驰协同吉利汽车研究院提供全链路语音语言交互技术及中枢大模型架构,助力打造拟人的“Eva情感智能体”。
    的头像 发表于 10-29 14:07 1100次阅读

    利用苏宁易购 API 接口,实现苏宁易购店铺线上线下库存一体化

    线上商城和线下实体店的库存系统无缝整合,从而避免缺货、卖等问题,优化客户体验。 第一步:理解苏宁易购API接口的基本框架 苏宁易购API接口基于RESTful架构,支持多种数据交互
    的头像 发表于 09-01 16:57 885次阅读
    利用苏宁易购 <b class='flag-5'>API</b> 接口,实现苏宁易购店铺线<b class='flag-5'>上线</b>下库存一体化

    星火X1升级版正式上线

    今天,基于全国产算力训练的深度推理大模型——星火X1升级版正式上线
    的头像 发表于 07-30 14:12 2198次阅读
    <b class='flag-5'>讯</b><b class='flag-5'>飞</b>星火X1升级版正式<b class='flag-5'>上线</b>

    API如何加速电商新功能上线

    显著加速新功能上线。本文将逐步解析API如何实现这一目标,并提供实用示例。 1. API的基本概念与作用 API(Application Programming Interface)是
    的头像 发表于 07-18 10:21 605次阅读
    <b class='flag-5'>API</b>如何加速电商新功能<b class='flag-5'>上线</b>

    API让电商“”起来,告别手动操作

    ,让您轻松告别繁琐的手动操作。本文将一步步解析如何利用API实现电商流程的自动化,帮助您的业务“”起来。我们将从基础概念入手,逐步展示实际应用,并提供一个简单的代码示例,确保您能快速上手。 什么是API及其在电商中的
    的头像 发表于 07-16 10:31 546次阅读
    <b class='flag-5'>API</b>让电商“<b class='flag-5'>飞</b>”起来,告别手动操作

    打破交互困局:科大这样出手

    十年深耕,科大智能交互如何引领未来
    的头像 发表于 06-17 11:50 1331次阅读
    打破<b class='flag-5'>交互</b>困局:科大<b class='flag-5'>讯</b><b class='flag-5'>飞</b>这样出手

    科大加速东南亚企业的人工智能应用

    日前,科大飞在新加坡成功举办合作伙伴峰会暨创新产品发布会。这场汇聚关键合作伙伴、行业先驱和技术领袖的盛会,不仅集中展示了科大最新AI创新成果,更彰显了以人工智能推动企业业务转型的决心。 活动
    的头像 发表于 05-06 09:39 1045次阅读

    星辰Agent开发平台发布

    随着以星火X1和DeepSeek-R1为代表的深度推理模型实现阶跃式突破,模型自主规划使用工具能力得到极大提升。在复杂任务拆解、多工具协同领域,AI Agent正展现出类人的认知决策和任务处理水平,标志着AI Agent规模化应用时代加速到来。
    的头像 发表于 05-06 09:34 1754次阅读