0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于语音云3.0开启全自然交互的分析和应用

讯飞开放平台 来源:djl 2019-10-08 15:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在北京国家会议中心举行的“语音点亮生活——科大讯飞智能家庭语音产品发布会”圆满结束,现场展示了以智能语音为核心交互方式的智能硬件产品(智能电视、智能音响和车载),还发布了功能更全的灵犀3.0,同时以打造全自然交互平台为目标的语音云3.0也亮剑发布会。
语音云3.0给开发者们带来了更多更炫的能力,开启全自然交互必备利器。下面小云带您一起走进发布会现场去揭开语音云3.0的神秘面纱。

一.基础能力持续升级:稳固人机交互

自2010年推出全球首个智能语音交互的语音云平台开始,四年来科大讯飞不断突破智能语音技术极限,开放平台接口,语音云提供的能力更加丰富和个性。语音云3.0在语音识别、语音合成、语音唤醒等能力上持续优化升级,带来了诸多改进和提升。


1.持续领跑的语音识别
面对语音信息量大、方言种类多、环境噪声大、同音多义词众多等技术难题,科大讯飞持续优化:
1)抗噪:通过”前端+本地+云端“的降噪方式,形成了讯飞独特的”净音“方案;
2)方言:首推方言识别引擎,并率先用于讯飞输入法中,目前已支持粤语、东北话、天津话、四川话等十种方言,更多方言还在陆续开放中;
3)发音人:采用发音人自适应技术,实现个性化识别;
4)响应速度:运算优化,响应时间140ms,业内全面领先等等;
科大讯飞最先将DNN(深度神经网络)技术应用于语音识别中,120KM/H车速环境下,识别率依旧超过85%,是全球唯一一家在如此高速环境下保持高识别率的语音技术供应商,同时在奔驰和通用全球语音评测中荣获第一名。
2. 随叫随到的语音唤醒
低功耗、小尺寸、高唤醒率、低误唤醒率以及多唤醒词定制等优势让您随心所定。在小米2S上运行一天耗电量不超过0.4%,在嘈杂环境下,唤醒率超过97%,24小时误唤醒不超过1次,业界绝对领先。
3. 惟妙惟肖的语音合成
支持多语种多音色,同时提供特色音库、个性化音库和音色转换接口,让您随心所选,定制您的个性化合成,想用林志玲的声音为您服务,有何难?

二.创新能力加速布局:开启全自然交互

除了基础能力持续升级外,语音云3.0还在人脸识别、声纹识别、自然语音理解、手势识别、大数据分析、变现等方面加速布局,构建全自然交互平台,打造语音生态体系。
1. 明察秋毫的人脸识别
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。讯飞语音云联合香港中文大学开放世界领先的人脸识别技术,准确度超过99%,超越Facebook、FBI.

2. 得手应心的手势识别
基于视觉的手势识别,让人机交互更加随心自然。
3. 能理解会思考的超脑计划
讯飞超脑计划组长江辉教授说:基于类人神经网络的认知智能引擎的讯飞超脑计划研究,预期成果是实现世界上第一个中文认知智能计算引擎!

4. 倾听用户的语音大数据分析
透过对语音大数据的分析,可以形成用户精确画像,实现效果评测,进行产品优化改进。
5.增值变现服务助力开发者获得稳健收益
语音云团队不断探索,整合移动优质增值资源开放了个性化彩铃服务,聚合业内领先移动广告服务商开放了广告业务,集成携程、高德等优质信源提供LBS变现服务,为开发者提供各种资源保障,让其专注于产品的同时,获得稳健收益,同时各种变现能力还在不断开拓与开放中。

三.加速梦想:亿元开发者扶持计划

移动互联网是实现梦想的绝佳时代,实现梦想不仅需要技术支撑,更需要资源和资金支持,为了帮助广大语音开发者快速实现梦想,讯飞开启了亿元开发者扶持计划,只要您有好的想法,好的创新产品,讯飞开发者扶持计划都将是您实现梦想的强力助推器!

四.开发者大赛:鼓励开拓创新

语音云开发者大赛作为语音产业的重要赛事,对鼓励开拓创新有重要的产业价值。当前,加盟语音云的合作伙伴超过40000家,其中高德、GlassX和争渡凭借产品创新、行业价值和智能语音交互带来的实用性,从诸多参赛作品中脱颖而出,最终进入大赛前三甲。

语音云3.0,全自然交互开放平台,助力各类应用实现创新腾飞的必备利器,开启的不仅是智能语音交互,更是集手势识别、人脸识别等能力于一体的全自然交互。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    55

    文章

    11350

    浏览量

    110434
  • 智能语音
    +关注

    关注

    11

    文章

    829

    浏览量

    50340
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    声智科技语音交互插件上线ClawHub

    核心突破:填补生态空白近日,声智科技自主研发的语音交互插件,包含ASR(自动语音识别)与TTS(语音合成)正式通过ClawHub官方审核并接入服务;与此同时,声智自研的LLM(大语言模
    的头像 发表于 04-08 17:55 1127次阅读

    新品 | Echo Pyramid,智能语音交互底座

    EchoPyramid是一款面向智能语音交互应用的功能底座。专为M5Stack的Atom/AtomS3/AtomS3R系列主控设计,即插即用,快速构建具备高性能音频交互能力的语音设备。
    的头像 发表于 03-06 16:51 2573次阅读
    新品 | Echo Pyramid,智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>底座

    探索Renesas VK - RA8M1 V2语音套件:开启边缘语音交互新旅程

    探索Renesas VK - RA8M1 V2语音套件:开启边缘语音交互新旅程 引言 在当今科技飞速发展的时代,边缘语音用户界面的应用越来越
    的头像 发表于 12-29 09:45 572次阅读

    MediaTek揭秘AI语音交互背后的关键技术

    从智能音箱到智能家居,以及更常见的手机 AI 助手等使用场景中,语音已经成为可以解放双手,更自然、更直接的交互方式。用户希望 AI 助手不仅能听得见,更能听得懂、听得快、听得准。
    的头像 发表于 12-28 15:28 1297次阅读

    端到端语音交互革命:百度智能联合地瓜机器人,重塑AI陪伴体验

    电子发烧友网报道(文/莫婷婷)随着大模型技术的迅猛发展,人机交互正经历从“工具式响应”向“拟人化陪伴”的深刻变革。在这一进程中,语音交互作为最自然的人机沟通方式。   百度智能
    发表于 12-01 01:07 1835次阅读
    端到端<b class='flag-5'>语音</b><b class='flag-5'>交互</b>革命:百度智能<b class='flag-5'>云</b>联合地瓜机器人,重塑AI陪伴体验

    【内测活动同步开启】这么小?这么强?新一代大模型MCP开发板来啦!

    噪,无惧嘈杂环境 云端接入小聆AI,轻松实现个性化定制 搭载领先大模型链路技术:小聆AI 智能语音交互方案 集成情绪感知与表达 :支持情感发音人;支持声音复刻,实现个性化定制 独家人声滤噪:基于声纹
    发表于 09-25 11:47

    “芯”声代,智未来—VS680本地语音交互系统 #语音交互 #芯片

    语音交互
    深蕾半导体
    发布于 :2025年09月17日 10:59:30

    端到端语音交互数据 精准赋能语音大模型进阶

    模型在多轮对话、噪声环境及语义理解方面表现不佳。 相较于传统数据集仅关注语音-文本的单点转写,端到端语音交互数据集强调在真实多轮对话场景下的维度信息保留。 其核心特征体现在三方面:其
    的头像 发表于 09-11 17:17 834次阅读

    语音机器人交互系统:核心技术与应用挑战

          语音机器人交互系统是融合多学科技术的复杂工程,其核心目标是实现人与机器间的自然、流畅语音对话。该系统已广泛应用于智能客服、智能家居、企业助手等场景,其技术架构主要包含以下几
    的头像 发表于 09-02 11:08 980次阅读

    广州唯创电子常用语音芯片解析:赋能智能语音交互的多场景应用

    语音芯片作为智能设备实现语音交互的核心部件,已广泛应用于家居、车载、医疗、工业等领域。广州唯创电子凭借多年的技术积累,推出多系列功能各异的语音芯片,满足不同场景下的
    的头像 发表于 08-28 08:41 1012次阅读
    广州唯创电子常用<b class='flag-5'>语音</b>芯片<b class='flag-5'>全</b>解析:赋能智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>的多场景应用

    再掀语音交互革命,广和通AI解决方案加速机器人听觉进化

    ”。面对机器人等新一代智能终端对AI语音交互的新需求,广和通深度整合硬件SoC平台与AI语音算法,通过端协同方案,助力机器人听觉突破噪声与理解瓶颈,增强
    的头像 发表于 08-26 17:44 1031次阅读

    七牛发布灵矽 AI:600ms超低延迟,重塑智能硬件语音交互新范式

    8 月 15 日,七牛正式发布灵矽 AI —为新一代智能硬件而生的语音交互新范式,让智能硬件不仅会“说话”,更能听懂情绪、自然交流。这不仅是语音
    的头像 发表于 08-15 15:33 979次阅读
    七牛<b class='flag-5'>云</b>发布灵矽 AI:600ms超低延迟,重塑智能硬件<b class='flag-5'>语音</b><b class='flag-5'>交互</b>新范式

    思必驰天穹3.0交互更自由随心

    作为屋智能语音交互系统,天穹3.0基于思必驰中枢大模型构建,融合了链路语音
    的头像 发表于 07-01 14:44 995次阅读

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    通过网络连接云端服务器进行快速检索和分析,然后利用语音合成技术将答案以自然流畅的语音反馈给用户。同时,借助开发板的网络连接功能,语音机器人还
    发表于 05-28 11:36

    智能座舱:车载语音交互测试内容

    随着汽车智能化的飞速发展,车载语音交互系统已从早期的辅助功能逐渐演变为智能座舱的核心交互方式之一。驾驶者通过语音指令即可轻松完成导航设置、音乐播放、电话拨打,甚至车辆部分功能的控制,这
    的头像 发表于 04-24 15:29 2375次阅读
    智能座舱:车载<b class='flag-5'>语音</b><b class='flag-5'>交互</b>测试内容