0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

揭秘语音交互:个性化AI打造“数字化的你”

章鹰观察 来源:高通 作者:侯纪磊博士 2018-07-18 15:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从更精美的照片、更高的安全性到更自然的用户界面(UI),人工智能AI)正以无缝的方式更多地丰富我们的生活。高能效和个性化是Qualcomm AI Research的核心研究领域,因为它们对于下一代无处不在的智能用户体验而言不可或缺。终端侧AI正在支持虚拟助理的发展,而个性化正成为今天的虚拟助理和未来真正个人助理之间的主要差异。

AI驱动语音交互革命

语音是我们一直期盼的变革性交互方式,它可以提供用户与终端间的自然交互,而无需任何手部操作。先进的语音交互具有始终开启、对话式、个性化和私密的特征,可支持我们进行高效且自然的对话。从智能手机智能音箱到扩展现实(XR)设备和汽车,语音交互正在众多产品种类中日益发展和普及。

要实现端到端的语音交互体验,其中需要多个组件的支持(见图1)。语音交互的流程是这样的:首先麦克风采集语音信号,然后是语音预处理、语音激活、语音识别和自然语言理解,最终是终端通过语音合成的方式响应用户。由此可见,端到端的语音交互是个多步骤的复杂流程。

图1:语音交互的功能组件。

为什么今天语音交互变得如此普及?一个重要因素是,机器学习已经点燃了语音交互的革命。机器语音识别的准确率正不断逼近95%,达到与人类准确率相当的水平。当机器准确率不能达到人类的水平,整个语音交互过程就没法做到对话式的自然高效交流,因此用户体验会有显著下降。机器学习技术可应用于几乎所有的语音交互组件之上,从而提升各方面及整体的交互体验。

终端侧的语音交互至关重要

因计算、内存和功率的限制,主要语音交互组件(如自动语音识别和自然语言处理)传统上都由云端AI所支持。但是,终端侧处理具有众多独特的优势,包括更快的响应速度、更高的可靠性和更好的隐私保护。尤其是在私密性方面,今天的消费者渴望把数据掌握在自己手中,并且有权选择是否将数据发到云端进行处理或存储。因此,更多在终端上进行处理并为云端功能提供补充,这是目前行业的重要趋势之一。而其中的主要挑战在于,需要在移动终端的功耗和散热限制下运行并实现复杂的语音交互功能。

图2:语音交互的主要组件正向终端侧迁移。

Qualcomm正积极应对这项挑战,并把低功耗的终端侧AI应用于语音交互组件之上。以下是几个例子:

1、语音降噪将带噪语音处理成清晰语音并输出,这在嘈杂环境中尤其重要。Qualcomm AI Research正在开发一个降噪深度学习模型,该模型与传统方法相比有显著的性能提升,并具有较高效率可在助听器这样非常受限的处理能力、功耗和散热条件下运行。

2、 自动语音识别将语音转录为文本。测试表明,深度学习技术可在移动终端上实现顶级的语音识别准确率。Qualcomm AI Research已经完成了一个深度学习声学模型的训练并使其适应每个用户的口音和环境,从而提高个性化程度。

今天,终端侧的语音交互已经成为现实。Qualcomm AI Research已经可以在终端侧实现整体的端到端语音交互处理,并在2018年的CES大会上演示了智能家居中的端到端语音交互体验。在适应口音和环境后,这项演示对特定领域的指令集已经可以实现超过95%的意图理解准确率。

个性化成就真正的虚拟助理

真正的虚拟助理是在终端里面有一个“数字化的我”。因此,它需要分析个人信息并不断学习用户偏好,从而成为真正了解用户的数字助理。情境式智能是实现个性化的必备条件,而实现情景式智能需要融合多种终端侧传感器的数据(如麦克风、摄像头和陀螺仪)及其他终端侧和终端外数据(见图3)。

图3:情境式智能融合多种传感器和个人信息。

增强个性化的一大好处在于,它能够推动个人助理进一步发展并兼具响应性和主动性。真正的个人助理不仅能够在用户提问时提供个性化的答案,还能基于情境分析进行自主决策和无提示对话。

为进一步提升虚拟助理的个性化程度,Qualcomm AI Research正对终端侧的“AI agent”展开研究,它有望从所有传感器数据中不断学习个人信息,最终实现直观行动。AI agent的关键功能包括情境式融合及学习,这最终将支持个性化响应并丰富我们的生活。初步研究结果已展现出终端侧个性化的远大前景。个性化不仅将提升虚拟个人助理的用户体验,而且将丰富我们生活的方方面面。这项技术将变革众多行业,不断推动行业创新。

(本文内容来自Qualcomm高级总监兼AI研究项目负责人侯纪磊博士的署名博客)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2578

    文章

    55895

    浏览量

    795873
  • AI
    AI
    +关注

    关注

    91

    文章

    42239

    浏览量

    303288
  • 机器学习
    +关注

    关注

    67

    文章

    8571

    浏览量

    137464
  • 语音交互
    +关注

    关注

    3

    文章

    365

    浏览量

    29255
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    申矽凌与高通合作打造个性化智能穿戴体验

    申矽凌近日宣布,公司正与高通技术公司合作,在其Snapdragon Wear Elite平台上实现微型高精度温度传感。此举正值业界致力于通过新一代智能可穿戴设备实现传感领域能够更好地理解用户需求,提供主动服务,并带来高度个性化的体验。
    的头像 发表于 03-09 13:51 4062次阅读

    广州唯创电子WT588F02B-C015语音芯片:内置丰富资源,如何助力客户实现个性化产品定制?

    在智能浪潮席卷全球的今天,语音芯片作为人机交互的核心器件,其重要性日益凸显。面对市场上琳琅满目的产品,如何选择一款既能满足基础功能,又能支持个性化定制的
    的头像 发表于 03-09 08:47 509次阅读
    广州唯创电子WT588F02B-C015<b class='flag-5'>语音</b>芯片:内置丰富资源,如何助力客户实现<b class='flag-5'>个性化</b>产品定制?

    数字化的基础是什么

    数字化的基础是多个关键要素的有机结合,这些要素共同构成了数字化技术、应用和生态的底层支撑。其核心基础可归纳为以下五个层面: 1. 数据:数字化的核心资产 数据采集与生成 :通过传感器、物联网设备
    的头像 发表于 02-04 17:53 1424次阅读

    构筑企业数字化中心,助力企业数字化转型

     企业数字化转型已是大势所趋  在数聚股份看来,现在应该没有人再怀疑企业数字化转型的必要性,企业数字化转型已经成为关系到企业生死存亡的课题。不转型,
    的头像 发表于 01-29 20:49 1047次阅读
    构筑企业<b class='flag-5'>数字化</b>中心,助力企业<b class='flag-5'>数字化</b>转型

    芯导科技AI智能交互硬件方案介绍

    AI智能交互硬件是通过集成人工智能技术(如大语言模型、多模态交互、机器学习等),赋予传统玩具智能交互能力的新型产品。其核心特点是‌拟人化
    的头像 发表于 12-03 17:00 2785次阅读
    芯导科技<b class='flag-5'>AI</b>智能<b class='flag-5'>交互</b>硬件方案介绍

    广州唯创电子WTR096A-16S语音芯片:丰富IO口实现个性化定制功能详解

    设计,为多行业提供了全新的定制化解决方案。本文将深入解析该芯片如何通过丰富的IO口实现个性化功能,满足用户对智能、人性产品的需求。二、强大的硬件支持:IO口的多样
    的头像 发表于 11-12 08:42 727次阅读
    广州唯创电子WTR096A-16S<b class='flag-5'>语音</b>芯片:丰富IO口实现<b class='flag-5'>个性化</b>定制功能详解

    【内测活动同步开启】这么小?这么强?新一代大模型MCP开发板来啦!

    噪,无惧嘈杂环境 云端接入小聆AI,轻松实现个性化定制 搭载领先大模型全链路技术:小聆AI 智能语音交互方案 集成情绪感知与表达 :支持情感
    发表于 09-25 11:47

    蘑菇街 API 接口:开启时尚电商个性化推荐新潮流

    在当今数字化时代,时尚电商平台正经历着前所未有的变革。蘑菇街作为中国领先的时尚社交电商平台,凭借其创新的 API 接口,正在引领个性化推荐的新潮流。这篇文章将逐步解析蘑菇街 API 接口的核心
    的头像 发表于 09-04 15:19 890次阅读

    利用小红书电商 API 接口,实现小红书店铺商品推荐个性化

    据、商品信息和交互行为。通过合理利用这些接口,店铺可以实现高度个性化的商品推荐系统,从而精准匹配用户需求。本文将逐步介绍如何基于小红书电商 API 实现这一目标,涵盖技术原理、实现步骤和实际应用,确保内容真实可靠。 1. 理解小红书电商 API 接口
    的头像 发表于 08-27 15:31 1376次阅读
    利用小红书电商 API 接口,实现小红书店铺商品推荐<b class='flag-5'>个性化</b>

    唯创四大语音芯片方案,赋能电动车仪表智能语音播报、个性化音效定制、蓝牙音频连接等多模态交互,满足

    电动车准备上班,刚刚启动时仪表只是冷冰冰地显示着电量和时速数字。没有任何声音提醒,没有任何个性化体验,只会机械地工作着。当电量不足时,可能因为没注意到而半路抛锚
    的头像 发表于 08-22 11:54 1066次阅读
    唯创四大<b class='flag-5'>语音</b>芯片方案,赋能电动车仪表智能<b class='flag-5'>语音</b>播报、<b class='flag-5'>个性化</b>音效定制、蓝牙音频连接等多模态<b class='flag-5'>交互</b>,满足

    企业如何用SD-WAN节省50%网络成本?揭秘数字化转型的网络新基建

    #企业如何用SD-WAN节省50%网络成本?揭秘数字化转型的网络新基建>一条软件定义的网络高速公路,正在为成千上万企业开辟数字化转型的快车道,同时将网络运营成本拦腰斩断。在数字化转型浪
    的头像 发表于 08-13 10:32 2041次阅读
    企业如何用SD-WAN节省50%网络成本?<b class='flag-5'>揭秘</b><b class='flag-5'>数字化</b>转型的网络新基建

    复杂装备研发设计中利用数据实现大规模个性化定制

    在复杂装备研发设计中,利用数据实现大规模个性化定制已成为提升企业竞争力、满足多样市场需求的关键路径。其核心在于通过数据驱动的个性化需求识别、模块设计、柔性生产、智能决策及闭环反馈,
    的头像 发表于 08-06 17:17 944次阅读

    利用API提升电商用户体验:个性化推荐系统

      在当今竞争激烈的电商环境中,个性化推荐系统已成为提升用户粘性和转化率的核心工具。通过API(Application Programming Interface)集成,电商平台能够高效接入先进
    的头像 发表于 07-14 14:45 853次阅读
    利用API提升电商用户体验:<b class='flag-5'>个性化</b>推荐系统

    2025年电商API发展趋势:智能个性化

    ​ 引言 随着数字经济的深化,电商API(应用程序接口)已成为连接平台、商家与用户的核心枢纽。2025年,在人工智能与大数据驱动下,电商API将加速向 智能决策 与 个性化服务 演进,重构用户
    的头像 发表于 07-11 14:26 809次阅读
    2025年电商API发展趋势:智能<b class='flag-5'>化</b>与<b class='flag-5'>个性化</b>

    声纹解锁个性化!启明云端硅思物语AI平台让设备“认准的声音”

    启明云端依托旗下硅思物语AI平台,通过声纹采集技术,在ESP32-S3潮玩手办伴侣上构建的个性化智能助手的真实落地应用场景。声纹采集:的声音就是“生物密码”什么是声纹?声纹如同指
    的头像 发表于 06-17 18:02 1945次阅读
    声纹解锁<b class='flag-5'>个性化</b>!启明云端硅思物语<b class='flag-5'>AI</b>平台让设备“认准<b class='flag-5'>你</b>的声音”