0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

腾讯数字生态大会上AI语音助手+X的无限可能 人机交互的下一站

脑极体 来源:脑极体 作者:脑极体 2020-09-14 17:31 次阅读

日本声优(配音演员)花泽香菜官宣结婚的那一天,不少宅男都直呼“爷青结”(爷的青春结束了)。互联网上被奉为“大众情人”的男神/女神,哪个不是声形并茂的存在?

“颜控”如人类的情感就是如此不讲道理。所以尽管科技厂商们都努力将AI助手的声音“打扮”得亲切可人,但距离真正进入用户心扉还远远不够。尤其是对于智能家居、养老照护等重要语音落地场景来说,情感色彩的缺位就更加显现出不足了。

而近期,许多能说会道的AI人物,也逐步进入我们的视野。比如《时代周刊》刊发了一张马丁·路德·金的“肖像照片”,“他”还会在沉浸式展览《游行》中,重现马丁·路德·金的经典演讲《我有一个梦想》。

在许多岗位上,AI语音助手也开始被赋予真人一样的外貌,能够通过眼神、表情、动作进行自然流畅的表达。比如疫情期间许多办公楼里,都引入了数字人来执行测温任务,让这一行为更具温情,不再是机器语音例行公事一般冷冰冰的提醒。

腾讯全球数字生态大会上,一位来自《镜双城》动画番剧里的女主角那笙,就跟现场观众打起了招呼——“原本我只能出现在动漫世界里,现在的我能够读懂你、听懂你,还有自己的小个性、小脾气哦~”

一副娇俏少女的模样,让这样的“女神”成为自己的导游、助理、客服、老师等等,听起来就十分令人神往,是腾讯云小微和AI lab共同打造的数字虚拟人,也成为腾讯云小微“数字助手”解决方案的“颜值担当”。

当然,让人类与数字助理自然相处,其中既受限于理性的技术发展周期因素,也会受到人类虚无缥缈的情感左右。那么作为一种另辟蹊径的实现方式,腾讯云小微所打造的形象化AI助手,其想象空间到底来自哪里?又将把AI语音技术引向怎样的下一站?

“颜控”企业的出现,折射出哪些现实需求

智能语音助手早已在许多商业场景中落地,比如拨打客服电话时的语音服务,亦或是会为儿童朗读绘本的智能音箱。那为什么大家突然又开始“看脸”了呢?

其实,从智能语音助手中广泛存在的手机/音箱等产品的交互尴尬,就可以解开这个问题。

首先是打开频率。许多主打智能语音功能的硬件(比如音箱),只有在刚拿到手的新鲜劲里,或者是网络上又出现了“调戏”语音助手的段子,才会想起来跟它们对话。背后的关键原因是语音助理所能承载的工具性需求,大部分都已经被智能手机等设备完成的很好了,只能作为“备胎”被偶尔提起。

二是情感联系。语音交互是即忘形式的,这就决定了它无法承载更具私密性、情感性的交互活动。我们会让语音助手帮我们打开电视、启动扫地机器人,但跟它进行充满情绪色彩、大段大段地闲聊?估计大部分用户都会产生抵触心理。就算自己不介意,被其他人撞到抱着一个音箱喃喃自语也很难不引起误会不是……

三是技术瓶颈。伴随着NLP技术的进步,语音助手已经能很不错地完成声纹识别、多轮对话、语义理解等复杂任务了,但距离自然交流显然还有一定的差距。动不动就“我听不懂”“难倒我了”,娱乐消费产品会被弃之高阁,万一企业不小心聘用了这种“智障型”AI助理为消费者提供服务,难以达到普通用户期盼的准确无误、近似真人的交互效果,带来的就可能是订单的损失和品牌口碑的下跌。

针对这些AI语音助手在产业端、市场端的落地尴尬,存不存在可能的解决之道呢?从“工具人”转变为“数字人”,让用户从“声控”转变为“颜控”,就是腾讯数字生态大会上给出的一个十分吸睛的解题思路。

让用户跟AI多聊两句,数字助理需要具备哪些超能力?

“如果那笙哪里做的不对,主人不要嫌弃我我有在努力呢”——试问听到这种对话,你还会吐槽语音助手偶尔出现的小失误,甚至还有点想反思自己是不是过于吹毛求疵了呢?

沿着这个思路,我们可以看到形象化之后,腾讯云小微在数字助手领域都打造出了哪些超能力:

1.语音+视觉交互,借助腾讯系海量IP打造出各种形象、生动、贴近现实需求的形象,提升交互频率,从而真正有效地减轻人类工作负担。比如疫情期间,就有老师表示希望有分身到每个学生身边指导他们,而数字助理的拟人化交互恰好可以完成这一任务;

2.丰富的知识体系,利用知识图谱与深度学习技术,数字助手可以快速调用海量信息,完成问答、资讯等服务,再通过拟人化的形象输出给用户,人们会在服务过程中对技术产生一定的包容和理解。为故宫打造的清朝内阁大学士“福大人”,就担任起了知识渊博的游览助手;

3.个性化情感关系:智能语音助手等新鲜事物的核心受众群以年轻人为主,而随着国漫崛起,年轻人对标新立异的虚拟形象更感兴趣。而对于渴求增长与变化的企业来说,与其按部就班地在声音世界里打转, 尤其是在线上化业务增多,用户的交互频率和方式增长的情况下,年轻市场也需要新的服务形态来被重新激活;

此外,伴随着产业数字化程度的推进,企业想要在数据洪潮中传达出具象的品牌形象,新的视觉载体是不可或缺的。消费者的行为和决策链路也在数字世界中变得更加隐蔽、复杂,如何保持黏性,建立用户与品牌的情感连接也成为应有之义……

上述种种,或许都可以通过一个人格化、陪伴式的“数字助理”,来触发全新的可能性。

AI语音的下一站,开启人机交互的“宁静时代”

技术领域有个名词叫“宁静技术”,简单来说就是通过对用户的情景感知能力,最小化用户的注意力,让人机交互变得隐匿和不可见(invisible)。

就像进入电梯间之后按下楼层键一样,已经成为现代人潜移默化的惯性动作,谁还记得曾经按电梯也是一种职业,甚至需要考证呢。

而人机之间的语音交互,也正在从“好像有点尴尬”进入到自然而然地唤起阶段。接下来,就是要让这种已经在一些场景(比如客厅)成为习惯的事,隐匿到更大的社会空间之中,让AI助手能够在更广阔的商业世界里与人们自然顺畅地进行交流。

这既是技术发展的必然趋势,也离不开科技企业们的不断努力。以腾讯云小微AI语音助手为例,就已经在出行、文旅、教育等等领域开始落地。

之所以能达成这一成就,首先来自于腾讯在语音技术上核心技术链的深耕。

通过ASR、NLP、TTS等技术,对声音进行降噪、文本转化、语义理解,这一才能让AI助手能够在复杂环境中依然能够识别不同的方言或者口音。

想要达成和真人一样的交流,机器还需要听得懂,才能避免“所答非所问”的情况,来真正帮助用户解决问题,成为一个业务能力强大的“数字员工”。因此腾讯除了在语义技术方面发力之外,还十分重视知识图谱的建构。等于为AI搭建了一个先验的知识库,让它能够及时调动庞大的知识储备,更好地理解用户言语的意图,来显示出“智商很高”的样子。

除此之外,数字员工的“情商”也很重要。利用利用个性化、沉浸式的TTS语音合成技术,再结合虚拟人技术,将对话内容以多模态、多层次的形式表达出来,就能很好地通过表情、动作传达出语言的情绪,让用户更加可感、可知。

而这一整个技术体系要真正落地,一方面需要打通数据闭环,从而训练出更可靠、精准的对话模型。因此腾讯云小微团队也建构了一套系统工程。从没有数据怎么办开始,系统地钻研数据如何打通,推动数据共享,到缺失数据的采集,系统化地为客户规划了基于数据智能化目标的数据采集和信息化建设方案。

另外,数字助理的最终目标不是“卖萌”,而是帮助企业提质增效,推动数字生产力变革,达成体验/服务到业绩/留存的真实转化。因此要具备统筹全局、贯穿业务周期的能力。所以也需要对企业的全业务场景进行覆盖,来保证无论是简单的问题咨询,还是复杂的业务流程办理,抑或只是想跟数字员工闲聊谈心,背后的语音技术解决方案都能够通过正确响应来满足用户所需、企业所想。在这一点上,腾讯云小微也通过流式语义+语义VAD技术,让AI在极低时延的情况下也能边听边思考。

也正是“数据+业务”的双重闭环,形成了数字助理进入产业规模化的能力谱系,得以为企业智能化转型全程护航。

AI语音助手+X=无限可能

毫无疑问,数字化、智能化潮流的全面喷发,未来会有更多的数字助理、AI助手被纳入到人类的工作环境当中。对于广大普通人来说,数字助理的能力蝶变真的有现实意义吗?

答案是肯定的。可以预期的是,至少有几种社会生活会被革新:

一是文旅导游。一场疫情让旅游行业元气大伤,而防疫的“持久战”也决定了限人限流会成为一段时期依赖的常态,如何在这样的情况下依然保持甚至超越原有的服务质量,将基础讲解工作交给数字员工,就是一个不错的选择。未来走进景区,打开手机,也许就是一个数字导游引领我们游览,实时讲解,互动答疑;

二是家居场景。你的家里有多少智能音箱在等着落灰?年迈的父母呼唤语音助手的名字时是否还是会感到一丝尴尬?而一旦语音助手有了数字形象,被赋予拟人化色彩之后,一切可能都会变得不同。从原本的一问一答,到有情感、更自然的交流,大概率会有不少人开始发帖“我觉得家里的AI助理才是我爸妈亲生的”。

三是教育产业。一进九月临近教师节,家长群们总少不了“送礼物担心老师不收,不送礼物担心孩子得不到关照”的年度讨论,而现实中,确实存在老师无法针对学生进行一对一特定辅导、难以记住所有学生的学情状况、教学压力大等情况。能化身虚拟老师的“数字助手”,无疑就是妥妥的多赢,老师们得以从机械工作中解放出来,学生们也能得到实时、个性化的辅导,而家长们也不用发愁怎样才能在AI眼里刷存在感了。

三是智能营销。对于企业来说,数字助手不仅仅是一位德智体美劳全面发展的优秀员工,还可以是辅助商业营销决策的“超级智囊”。举个例子,一些汽车小白用户,通过互联网的消费行为偏好分析,进而设计出一些“傻瓜式”产品功能,比如一键询问维修、一键呼叫客户、智能导航、辅助驾驶等等,而这些用户洞察,基于腾讯云小微所处的数字生态都可以转化为车机企业争取潜在用户好感度的关键武器。

一个能听会说、知识全面,又善于表达、喜怒形于色的数字员工,拥有的可能性还有很多。不难发现,不仅企业需要重新认知数字助理所带来的价值红利,想要扩大数字助理的商业价值与应用边界,还需要一套体系化的平台性技术解决方案,来降低各行各业引入数字员工的门槛及成本。

从这一点来看,数字生态大会上所展示的人机交互技术前景与商业宏图,不是一种偶然,而是腾讯云小微从长期实战与技术研发中生长出来的确定性。

腾讯云小微扳动了一下技术齿轮,人与机器如同精密仪器适配一样,在某个瞬间发出“咔”的一声,于是我们知道,一个全新的产业世界大门,开启了……

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1131

    浏览量

    54760
  • AI
    AI
    +关注

    关注

    87

    文章

    26449

    浏览量

    264063
  • 腾讯
    +关注

    关注

    7

    文章

    1620

    浏览量

    49157
  • 腾讯云
    +关注

    关注

    0

    文章

    190

    浏览量

    16617
  • 语音助手
    +关注

    关注

    7

    文章

    224

    浏览量

    26608
收藏 人收藏

    评论

    相关推荐

    人机交互的三个阶段 人机交互的常用方式

    交互经历的三个阶段:命令行界面交互阶段、图形用户界面交互阶段、自然和谐的人机交互阶段。
    的头像 发表于 03-13 17:25 806次阅读

    人机交互技术有哪几种 人机交互技术的发展趋势

    的几种形式: 图形用户界面(GUI):图形用户界面是目前最为常见的人机交互技术形式。它通过图形化的方式展示信息,用户可通过鼠标、键盘等设备进行操作。GUI简单直观,易于学习使用,适用于大众用户。 语音交互技术:
    的头像 发表于 01-22 17:47 1130次阅读

    情感语音识别技术在人机交互中的应用与展望

    一、引言 随着人工智能技术的不断发展,人机交互已经渗透到日常生活的方方面面。情感语音识别作为人机交互中的关键技术之一,能够通过分析人类语音中的情感信息实现更加智能化和个性化的
    的头像 发表于 11-22 10:40 327次阅读

    情感语音识别在人机交互中的应用与挑战

    一、引言 情感语音识别是近年来人工智能领域的研究热点之一,它能够通过分析人类语音中的情感信息实现更加智能化和个性化的人机交互。本文将探讨情感语音识别在
    的头像 发表于 11-15 15:42 229次阅读

    情感语音识别技术在人机交互中的应用与挑战

     一、引言 随着人工智能技术的不断发展,人机交互已经成为了研究的热点之一。情感语音识别技术作为人机交互中的重要组成部分,能够通过识别人的语音情感,实现更加智能化和个性化的
    的头像 发表于 11-09 15:27 377次阅读

    什么叫人机交互人机交互是什么意思?

    界面设计:设计人机交互界面的结构、布局、内容和控件,以实现直观、易用性、反馈等要求。界面设计需要兼顾美观性、实用性和易用性,简洁、明了的界面布局可以让用户快速定位需求和完成任务。
    的头像 发表于 08-26 11:39 2589次阅读

    人机交互的发展历程

    人机交互在20世纪60年代初期开始发展,当时计算机还处于高昂的价位,且操作系统的发展还非常有限。最早的人机交互界面是通过命令行交互实现的。当用户输入命令后,计算机会给出相应的响应。这样的交互
    的头像 发表于 08-26 11:36 2594次阅读

    人机交互的多种可能 人机交互的三种方式

    除了视觉界面,触觉界面也是一种重要的人机交互方式。触觉界面使用触摸技术,例如触摸屏、手势识别和数字板等,让用户可以与计算机进行更自然的交互。这种交互方式可以为用户提供更多的控制和个性化
    的头像 发表于 08-26 11:34 3705次阅读

    人机交互设计原则是什么 人机交互常用的交互方式

    人机交互设计原则是指为了提高用户体验和效果,指导设计师在设计用户界面和交互过程中应遵循的一系列原则。以下是一些常见的人机交互设计原则:   1. 可用性(Usability):设计应简单、直观易用
    发表于 08-16 15:14 2356次阅读

    人机交互的重要接口是什么 人机交互方式有哪五种

     人机交互的重要接口是指人类用户与计算机系统之间进行交互和沟通的方式和工具。以下是几个常见的人机交互接口:   1. 图形用户界面(GUI):图形用户界面是通过图形、图像和图标等视觉元素来呈现信息
    的头像 发表于 08-15 14:16 6049次阅读

    增强现实是人机交互技术吗

    增强现实是人机交互技术吗 增强现实是一种涵盖多种应用程序和技术的科技,可以改变我们的感知和与现实世界交互的方式。它是将虚拟世界的数字信息与真实世界融合在一起的技术。相比于传统虚拟现实技术,增强现实
    的头像 发表于 08-12 15:27 633次阅读

    面部表情识别在人机交互中的应用

    随着人工智能技术的不断发展,人机交互已经成为了人们生活中不可或缺的一部分。面部表情识别作为人机交互的重要组成部分,有着广泛的应用场景和价值。本文将探讨面部表情识别在人机交互中的应用,包括情感识别
    的头像 发表于 08-02 18:03 627次阅读

    涂鸦智能打造专业家庭智能生活助手,实现人机交互升级

    近年来,智能家居设备的品类不断拓展,同时,人们对AI与智能家居的联动愈发憧憬。自然语言交互是未来人机交互的主要趋势之一,其关键在于使AI具备主动理解信息的能力,让用户的
    的头像 发表于 07-18 10:37 362次阅读
    涂鸦智能打造专业家庭智能生活<b class='flag-5'>助手</b>,实现<b class='flag-5'>人机交互</b>升级

    情感语音识别数据的重要性及其在人机交互领域的应用

    随着人工智能技术的迅猛发展,情感语音识别作为一种重要的人机交互技术,逐渐引起了广泛关注。本文将探讨情感语音识别数据的重要性,并介绍其在人机交互领域的应用。通过分析和理解人类的情感状态,
    的头像 发表于 06-24 03:47 663次阅读

    人机交互的方式有哪些?

    人机交互的方式有多种多样,以下列举出比较常见的方式
    的头像 发表于 06-08 15:12 5148次阅读
    <b class='flag-5'>人机交互</b>的方式有哪些?