第六代微软小冰发布，对话引擎、全双工语音和实时视觉相融合-电子发烧友网

第六代微软小冰正式发布，相比与以往的低调，此次微软小冰六代的发布会现场格外盛大。

小冰是微软亚洲研究院在2014年5月在中国推出的人工智能聊天机器人，也是知名的虚拟形象之一，如今已进化到第六代。此外，小冰还改头换面，彻底抛弃了以前的形象，并且由 2D 变成了 3D（如下图所示）。

第六代小冰核心对话引擎与交互感官的升级

小冰项目负责人李笛介绍，微软的目标就是让小冰成为一个高情商的机器人：从有趣、到有情绪、到能探测、到能占据主动。微软最新推出了全新的共感模型，它融合了共感模型的对话引擎、全双工语音和实时视觉三个类别的全新感官。

共感模型是一种基于生成模型的对话引擎。微软在去年的第五代小冰发布会上，首次正式完成生成模型的产品化，该模型的特点，通俗地说，就是小冰可以自创她的回应，而不需要从已有的对话语料库中检索而得。在生成模型的基础上，共感模型能够进一步提高小冰对于对话内容、领域和节奏的控制力，也即小冰可以通过自创回应，来牵引对话向她所希望的方向进行。微软宣布已经完成共感模型的测试，今日起，共感模型将在微软小冰所覆盖的五个国家正式上线。

在去年八月份举行的第五代小冰发布会上，微软宣布已完成全双工语音（Full Duplex Voice）交互感官的产品化，并在打电话和智能音箱设备两个场景中落地。

微软在今年发布会上宣布开始公开测试的这个新感官，是融合了共感模型的对话引擎、全双工语音和实时视觉三个类别的全新感官。微软在发布会现场放置了用于体验的测试设备。在该测试设备中，小冰可以通过视觉、语音的实时连续交互，指挥用户完成面容检测，并可在上述过程中进行开放域的对话。微软预计该感官将于一年内完成全部产品化工作。

第六代小冰在人工智能创造（AI Creation）方面的技术和产业化进展

微软认为，利用人工智能技术，学习人类并进行与人类质量水平相当的内容创造，是重要的、但目前尚未被行业注意到的未来趋势。目前，微软小冰已通过人工智能技术，实现了诗歌和金融等领域的文本内容生成、歌曲及有声读物等领域的有声内容生成，以及电视电台节目和可交互式电台等串流内容领域的生成工作，并分别完成了不同程度的落地。

2018年6月，微软（亚洲）互联网工程院成立人工智能创造事业部，旨在进一步推动微软小冰在人工智能创造这一内容领域的生产线搭建及产业化落地等工作。

微软还发布了新的第四版人工智能歌曲DNN模型，从而展示了微软在这一领域领先于世界的技术优势。与前三个版本的技术相比，第四版能够进一步快速合成与人类歌手质量相当的歌曲，并能够使人工智能小冰自由吸收多数人类歌手的演唱技巧，融会贯通，在演唱过程中达成更加成熟的演绎。此外，该技术还能够完整吸收并复制特定人类歌手的全部演唱特质（嗓音、韵律等），使小冰能完全代替原人类歌手完成新作品的创作。目前，微软在这一领域的技术研究和产品化，均居于全球领导地位。

微软宣布与多个领先的大众文化公司合作，已经完成部分人类歌手的人工智能化工作。在发布会上，微软演示了最新版本的小冰在唱歌上取得的成绩。

第六代小冰的Dual AI战略

小冰产品负责人彭爽解释道：“在这样一个半开放生态环境上，一方面我们会直接负责产品体验，也就是说我们会直接把控最具体的、直接和用户接触的产品细节，另一方面我们又不封闭在一个自有平台上，而是走出去接触，甚至直接融入到第三方平台上，这样就形成了一个完整的半开放生态环境。”

具体来说，微软会根据已有合作伙伴的实践，将该战略的实施分为三个部分：首先，微软提供小冰的整体框架能力，帮助合作伙伴平台的自有AI。其次，微软小冰作为该合作平台的辅助AI，融入该平台生态。第三，微软通过技术、产品与运营，围绕该合作平台的差异化特点，推出合作的应用和产品。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉