0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

思必驰的“人工智能技术”即“人工智能交互系统”

思必驰 来源:djl 作者:思必驰 2019-08-05 16:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

回忆近年语音技术的发展历程,早年主要谈的是“合成”,再过些年开始着重谈“识别”,那时所谓语音技术的含义就是“识别+合成”。直到我们真正要把语音技术运用到智能硬件上的时候才发现,很多情景下光靠“识别+合成”已经彻底不够用了,我们开始需要的是“人性化的”拥有交互智能的语音技术。

讲到“人工智能”,所有的公司都在讲一个字“脑”, 那么同样都在说“脑”,思必驰的智能语音和别人做的有什么不同呢?

大家都知道IBM的超级计算机“深蓝”,它下棋可以赢国际象棋大师,但它只能算是一个计算机而不是一个机器人。因为对一个机器人来说,单独模块的优秀不是它的全部,它还要具备一个完整的从局部智能到整体智能的一整个人工智能系统,才算是一个机器人。这也就是为什么我们做的东西叫“对话系统”,不叫“语音识别”。

思必驰的“人工智能技术”,不只拥有以上依“脑”而生的技术模块,更重要的是,我们将这些模块协调整合和联合运用,使其成为一整个“系统”,即“人工智能交互系统”。

我们面临的技术挑战,大体上就这三类;首先要感知准确,就是识别率要高;其次准确理解用户的意图,给出正确的反馈;而后当反馈发生错误时,可以纠正。

先从“感知”即语音识别率入手。在移动互联时代,我们有两个非常重要的点,可以极大的优化我们的语音识别率。一块是“大数据”,另一块就是“深度学习”。

思必驰的“人工智能技术”即“人工智能交互系统”


思必驰的人工智能语音系统经过自优化的“深度学习”和大数据计算之后已经被调教成国际上最好的语音识别技术之一,识别率已经到了95%以上。其语音技术仅靠在单麦,和后台算法支持情况下就可以做到国际一流的识别准确率。在抗噪技术领域,思必驰的最新结构化抗噪语音识别技术刷新了国际噪声标准测试库记录,取得目前世界最好成绩。模型算法的优化突破,使思必驰仅用软件就可以达到以往采用语音降噪芯片才能达到的效果,大幅提升了识别率,降低了成本。

在交互的大前提“感知”做好之后,个性化语音合成输出也是近年来的一个“渐痛点”。思必驰抛弃了传统语音采用的笨拙拼接合成技术,而采用最新的基于统计的参数化语音合成方法,不仅实现了模型规模的大幅压缩,缩小了语音文件的体积,语音连贯性的大幅提升,同时也允许更自由的个性化的语音训练。(目前思必驰已经完成一些名人的声音合成,基本能够保证与真人语音相差无几。)

思必驰的“人工智能技术”即“人工智能交互系统”

“等周二许春来到苏州后约他一点钟在九寨沟喝茶”,究竟说的是许春来到苏州后请许春去喝茶,还是这个人来了许春约他去喝茶。这对机器来讲是一个不小的挑战。语义的解析不等于语义的理解。我们怎么解决这个事?一次性的交互是很难的,我们认为从键盘、鼠标到麦克风是不够的,必须要有脑子去思考去判断。很多情况下,由于识别一点点不准确,后面的整个任务变得没办法完成。语音识别在硬件里面想要用,必须和后端某些东西结合在一起,就是我们说的认知技能。

思必驰的“人工智能技术”即“人工智能交互系统”

达成认知智能需要解决几个方面的问题,一个是静态认知,这一项我们已经通过深度学习和大数据的运算做的很好了。但是在现实场景下,即便拥有高识别度的静态认知也是不够的,还需要会动态认知,即交互过程中,智能硬件能通过用户不断反馈来学习,甚至主动询问,并最终完成任务。不仅如此,在动态认知的交互过程中,我们还要让系统可打断,在打断时还可以做回声消除,可以做部分理解,然后还可以在部分理解的基础上多轮交互,并对信息进行筛选理解。动态认知之后是进化认知,是让系统能够做到用得人越多,学得越好。


(发布会中演示的“语音纠正”功能,实录)

思必驰的“人工智能技术”即“人工智能交互系统”

思必驰已完成了一个真正可使用的系统级对话技术框架,一个真正具有认知能力的人机交互界面,不只提升识别率,更实现了深度理解和智能反馈,以及支持任性语音输入的对话交互架构,做到了真正的智能交互。我们相信,智能硬件时代已经到来,而感知层面的适配技术与认知层面的对话技术,则是人机交互的未来。

思必驰的目标是希望能够专注于智能语音交互技术的研发,我们自己不做硬件,但是我们会支持,我们特别希望做的事情就是所谓的用户体验的深度优化和深度结合。我们希望通过用户体验深度优化,支持产业创新,最后希望和各位开发者一起共同成长。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92681
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261510
  • 思必驰
    +关注

    关注

    4

    文章

    373

    浏览量

    15882
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    微软与新思科技分享智能人工智能技术的行业影响

    (Agentic AI)技术的行业影响,以及未来跨界合作的前景。此次圆桌讨论不仅展现了双方的战略协同,以及他们在开发市场领先解决方案方面的共同努力,也勾勒出人工智能是如何驱动工程、电信、制药等行业变革的新蓝图。
    的头像 发表于 11-30 09:48 224次阅读

    任务型对话算法通过国家备案

    近日,国家网信办公开发布第十四批境内深度合成服务算法备案信息,任务型对话算法正式通过备案。这是
    的头像 发表于 11-20 10:33 560次阅读

    声音转换算法通过国家备案

    近日,国家互联网信息办公室公告第十三批深度合成服务算法备案信息,声音转换算法通过备案,这也是
    的头像 发表于 09-18 14:05 684次阅读

    一鸣智能客服大模型通过生成式人工智能服务备案

    近日,江苏网信发布新一批生成式人工智能服务备案信息,其中,由控股子公司准自主研发的一鸣
    的头像 发表于 09-16 18:08 963次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:23

    亮相2025世界人工智能大会

    近日,2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC2025)在上海盛大开幕。本届大会以“智能时代 同球共济”为主题,全方位呈现了全球AI技术突破、产业变革与治理实践的
    的头像 发表于 07-31 17:41 734次阅读

    亮相2025人工智能产品应用博览会

    7月28日-30日,2025人工智能产品应用博览会在苏州国际博览中心举行。本次活动以“智无界·慧共生”为主题,汇聚了全球AI领域的精英企业和创新技术,旨在推动AI技术的突破与商业落地,赋能金融、文旅
    的头像 发表于 07-28 17:48 599次阅读

    何维率一行莅临调研

    现场,董事长、CEO高始兴介绍了的业务布局与落地应用情况。
    的头像 发表于 04-24 15:36 682次阅读

    开售RK3576 高性能人工智能主板

    ,HDMI-4K 输出,支 持千兆以太网,WiFi,USB 扩展/重力感应/RS232/RS485/IO 扩展/I2C 扩展/MIPI 摄像头/红外遥控 器等功能,丰富的接口,一个全新八核拥有超强性能的人工智能
    发表于 04-23 10:55

    亮相2025日本东京人工智能

    4月15-17日,NexTech Week 2025日本东京人工智能展览会在东京国际展览中心举行,本届展会汇集AI、区块链和量子计算等先进技术和综合领域,汇聚人工智能相关研究、应用、设备和服务等相关的各种展览产品。
    的头像 发表于 04-16 16:37 1055次阅读

    柳州市领导莅临调研考察

    创新成果落地等主题开展专题调研。此次调研聚焦思智能语音交互、大模型技术融合及产业链协同等领域的发展成效,并深入了解企业需求,鼓励企业加
    的头像 发表于 03-24 16:37 1086次阅读

    智慧路灯如何应用人工智能技术

    叁仟智慧路灯通过整合人工智能(AI)技术,显著提升了城市的智能化程度,为城市管理工作带来了诸多便利。以下将详细阐述叁仟智慧路灯在应用人工智能技术方面的几个关键领域: 一、
    的头像 发表于 03-07 09:18 795次阅读
    智慧路灯如何应用<b class='flag-5'>人工智能技术</b>

    亮相2025年苏州市“人工智能+”创新发展推进大会

    近日,2025年苏州市“人工智能+”创新发展推进大会暨人工智能赋能新型工业化深度行(苏州站)活动隆重举行,专家学者、产业大咖、金融精英齐聚苏州,共商“人工智能+”融合创新。作为人工智能
    的头像 发表于 02-17 16:16 893次阅读

    什么是嵌入式人工智能

    嵌入式人工智能是指将人工智能技术应用于嵌入式系统中的一种技术。嵌入式系统是嵌入到其他设备或系统
    的头像 发表于 12-11 09:23 1519次阅读
    什么是嵌入式<b class='flag-5'>人工智能</b>