0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能伴侣虚拟机器人小冰的技术解读

电子工程师 2018-06-17 22:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

三百六十行,行行出状元。在众多行业中有这么一个行业迎来了一位“新人”——微软小冰。

作为一款人工智能伴侣虚拟机器人的小冰,去了歌唱界。不仅发表个人单曲,还参与作词作曲,经历了五次迭代的微软小冰,现在已经成为一个会作曲会唱歌的全能型艺人。

▌作曲写诗写词样样精通

2017 年,微软出版了一本由小冰原创的诗集《阳光失了玻璃窗》,这是第一部 100% 由人工智能创造的诗集。在写诗之后,小冰还创作不同类型的文体,填词,唱歌,发表个人单曲等。

据介绍,小冰创作的基本原理有两大块,一块是他需要学习前人的作品,包括上千位诗人的诗集、上千万行歌词等等。第一步,训练深度神经网络的模型;第二步,有了一定的模型之后,需要给她一个触发源,工程师们称为创作冲动。

创作冲动有不同的方式,给出一张图片或文字,基于图片里的元素或文字内容的理解去创作,例如知乎上的海量回答,学习知乎预料大数据作为触发源,基于一个训练好的模型,生成对应的歌词。

值得注意的是,在小冰发布的单曲中,还听到有模拟真人呼吸的声音,据微软(亚洲)互联网工程院微软小冰首席语音科学家栾剑表示,主要是因为考虑到大众的习惯,没有换气可能会让人听着感觉很累,因为有些时候发烧友会跟着哼唱,没有呼吸换气的地方,会觉得不太舒服。

在技术上实现呼吸换气主要分为两个模块,第一个模块,首先要预测什么地方会有呼吸的声音,第二个模块,怎么样把呼吸的声音生成出来。

关于第一个,人类有两种呼吸,一个是这个歌到了一个休止符,在语意的地方需要一个停顿;还有一种,这首歌可能节奏很快,中间没有任何的停顿,这时候人类的歌手必须要在某个地方换一下气,不然的话,人类的肺活量支撑不了。

关于换气的声音,其实换气的声音有点类似于人类的声音,它就是一种没有声带振荡的声音,我们可以把他作一种中文语言系统以外的一种新的发言的因素去建模。

▌最早实现全双工对话

在 2016 年的 9 月份,微软小冰就开始真正的给人类打电话,到目前为止,打了超过 60 万通电话。在通话过程中会增加“嗯”、“啊”这样的语气词,给人的感觉更像真人,并且做到了全双工对话,可以互相打断,真正做到双方互动的聊天。

另外,小冰运用的领域是一个很开放的领域。她实际上跟用户在沟通的过程中话题,内容,都是可以双方提出来的。不仅是小冰抛出一个话题,就限定在这个话题里聊,而是随时可以根据对方抛出的新话题去聊。

据栾剑介绍,小冰这种开放领域的聊天难度上会更大一些。首先上下文大篇幅的语义理解在业界和学术界都是一个很难的课题,比如在写诗的时候,有时候的用词比较古怪,或者语句之间不太通顺,但实际上可能存在有一种潜在的逻辑。

也遇到了一个技术的瓶颈,语意理解像是一个黑盒子,这个黑盒子,会收入一些内容也会反馈一些内容,反馈的内容给人的感觉好像是理解了,但实际上他是不是真正理解了,是没有办法判断的。

人也是这样,在实际对话过程中,更多的是先给个输入,然后给个输出,再根据这个输出来判断他是不是真正理解了,但实际上这里面是有一定的套路存在的,你去判断他是不是理解,可能是很困难的,因为里面并没有一个那么直观的东西存在。

AI 的三个层次:运算智能、感知智能、认知智能

第一层,运算智能,像算盘一样;

第二层,感知智能,能够感知到一个物品是什么;现在大多数的 AI,包括语音、图象等还是停留感知智能层次上;

第三层,认知智能;像人一样,知道是什么,还知道为什么这样,还可以推理,这个层次较难。

说到底,AI 的创造力和人类的创造力之间有什么差别呢?

微软(亚洲)互联网工程院人工智能创造事业部副总经理袁晶表示,人的左脑更加偏向于计算;人的右脑是偏向创造力,发散思维,现在希望用计算的方式,让 AI 用左脑的方式去模拟右脑的行为。

换句话讲,这种创造在人里面只有顶尖的艺术家才能干,但是放到 AI 上,就相当于可以简化这个学习和训练的过程了。

相当于说,让她去拟合人类创作者的创作过程,并且能以这样的能力去帮助普通人去做一些创造,因为每个人都想去做一些创作的行为,只不过说限于自己的能力,AI 能够做到相当于他的助手,帮助普通人,享受创作的乐趣。比如她可以和你一起为你新出生的孩子、或你的恋人写首情诗,也可能为你爸爸的生日创作一首歌曲等。

▌未来小冰将尝试更多内容领域的创作

袁晶表示,未来会渐渐让小冰去尝试往内容生成的领域做一些探索,可能半年一年,很多别的公司或者机构,也会跟随这个趋势去做类似这样的事情。

在袁晶看来,人工智能在内容领域有一些新的能力或者突破可能将会是未来的一个方向,所以也会往这个方向不断的去做一些尝试,包括声音、文字、图像等三个方面,AI 未来会充当协助角色,帮助人类的创作者,去更好更快更高效的创作内容。

首先 AI 创造的成本是很低的,要比人类的创造成本低很多。比如读故事,当我们找配音员去读这个故事,他可能要付出一定的成本,但是如果声音的模型训练好了之后可以大批量的生成,成百上千个小时的大量的用户,所以他的成本会摊薄到很低。

小冰的声音技术里面增加了一些韵律和风格的变换,使得她可以去模仿人类创作者,在各种场景下面做各种不同的演艺。而机器人可以非常真实的模拟人声,让很多人有各种各样的顾虑。

栾剑表示,小冰声音的生成和使用的过程都是严格受控的,将来提供服务的时候,模型本身,以及合成的引擎本身,另外,小冰之前给人类打电话已经打了60万个,小冰都会先申明身份,明确告诉用户我们是微软小冰。微软设有专门的人工智能的委员会,防止人类利用人工智能技术去做伤害他人和社会的事情。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30627

    浏览量

    219703
  • 人工智能
    +关注

    关注

    1813

    文章

    49772

    浏览量

    261710

原文标题:微软小冰作词又作曲,网友:要出道的节奏吗?

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    物理人工智能面临的安全风险

    具备通用人工智能的人形机器人距离真正进入我们的日常生活还有数年时间,但特定应用领域的机器人早已问世。从亚马逊物流中心的机器人车队,到手术室的外科手术
    的头像 发表于 11-17 10:54 667次阅读
    物理<b class='flag-5'>人工智能</b>面临的安全风险

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软硬件平台
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软硬件平台
    发表于 08-07 14:23

    深圳龙岗设立全国首个人工智能机器人)署

    据深圳龙岗发布,2025年5月21日,深圳市龙岗区召开人工智能机器人发展大会,正式揭牌成立全国首个人工智能领域政府直属机构——龙岗区人工智能机器
    的头像 发表于 05-22 18:07 387次阅读

    工业机器人工作站的建设意义

    在现代工业生产中,工业机器人工作站的建设已成为提升生产效率和产品质量的关键举措。随着自动化技术的不断发展,工业机器人工作站不再局限于单个机器人的作业,而是通过整合工装夹具、多台
    发表于 03-17 14:49

    虹科亮相第六届粤港澳机器人人工智能大会

    日前,第六届粤港澳机器人人工智能大会在广州番禺开幕。本次大会以「聚焦人工智能与产业发展」为主题,旨在推动粤港澳大湾区机器人人工智能领域的
    的头像 发表于 03-10 16:37 912次阅读

    成都华微与具身科技深化人工智能机器人领域合作

    近日,成都华微与四川具身人形机器人科技有限公司(具身科技)在成都高新区四川人工智能实验室展开会谈,双方围绕机器人智慧大脑与精密控制两大关键核心方向展开交流,在芯片层面达成深度合作意向,携手开启
    的头像 发表于 02-28 16:58 971次阅读

    人工智能机器学习以及Edge AI的概念与应用

    人工智能相关各种技术的概念介绍,以及先进的Edge AI(边缘人工智能)的最新发展与相关应用。 人工智能机器学习是现代科技的核心
    的头像 发表于 01-25 17:37 1595次阅读
    <b class='flag-5'>人工智能</b>和<b class='flag-5'>机器</b>学习以及Edge AI的概念与应用

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    近年来,人工智能领域的大模型技术在多个方向上取得了突破性的进展,特别是在机器人控制领域展现出了巨大的潜力。在“具身智能机器人大模型”部分,作
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    人工智能机器人技术和计算系统交叉领域感兴趣的读者来说不可或缺的书。这本书深入探讨了具身智能这一结合物理机器人
    发表于 12-28 21:12

    【「具身智能机器人系统」阅读体验】1.全书概览与第一章学习

    非常感谢电子发烧友提供的这次书籍测评活动!最近,我一直在学习大模型和人工智能的相关知识,深刻体会到机器人技术是一个极具潜力的未来方向,甚至可以说是推动时代变革的重要力量。能参与这次活动并有机会深入
    发表于 12-27 14:50

    从市场角度解读机器人核心关键技术

    从讲机器人发展史--机器人技术层面上升到从场景从市场来谈人工智能机器人核心关键技术的阶段了。对于
    的头像 发表于 12-25 15:20 1151次阅读
    从市场角度<b class='flag-5'>解读</b><b class='flag-5'>机器人</b>核心关键<b class='flag-5'>技术</b>

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    嵌入式人工智能(EAI)将人工智能集成到机器人等物理实体中,使它们能够感知、学习环境并与之动态交互。这种能力使此类机器人能够在人类社会中有效地提供商品及服务。 数据是一种货币化工具 数
    发表于 12-24 00:33

    【「具身智能机器人系统」阅读体验】+初品的体验

    动态互动的。 该理论强调智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器学习、
    发表于 12-20 19:17

    《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

    ,互联网行业占成熟经济体的GDP增长的21%,世界经济正面向数字经济转型的大趋势。具身智能机器人集成人工智能、高端制造、新材料等技术,其核心在于通过
    发表于 12-19 22:26