0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

雷军:小爱同学5.0背后的人工智能

璟琰乀 来源:IT之家 作者:懒猫 2020-11-25 12:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在本月上旬举办的 2020 小米开发者大会上,小米发布发布小爱同学 5.0 版本。

小米集团副总裁、集团技术委员会主席崔宝秋此前表示,小爱同学将从过去的语音助手升级为智能生活助手。

IT之家了解到,今日上午,小米创办人,董事长兼 CEO 雷军发文表示,小爱同学激活的设备数已经达到达 2.28 亿,月活已经达到 7840 万,累计唤醒 617 亿次,“小爱同学也成为目前行业内唯一一个拥有大规模落地场景的语音助手”。

以下为《雷军:小爱同学 5.0 背后的人工智能》全文:

在月初举办的 MIDC 开发者大会上,我们发布了最新一代的小爱同学——小爱同学 5.0。全新的小爱同学带来了五大升级,覆盖了囊括影音娱乐、生活服务、信息查询、出行路况等 8 大领域 1400 + 技能,成为大家生活中离不开的智能生活助手。

从 2017 年 3 月 21 日,“小爱同学”第一次与大家见面,到现在仅仅 4 年时间,小爱同学激活的设备数已经达到达 2.28 亿,月活已经达到 7840 万,累计唤醒 617 亿次,小爱同学也成为目前行业内唯一一个拥有大规模落地场景的语音助手。

新一代小爱同学 全新五大升级

新一代小爱同学的 5 大升级包括:全场景智能协同、对话式主动智能、定制化情感声音、多模态融合交互和智慧学习好助手。

小爱同学 5.0 全场景智能协同

目前,拥有 5 件及以上连接小米 AIoT 平台的设备用户已达 560 万。随着用户家中的智能设备越来越多,使用和操作也变得更加复杂。全场景智能协同就是让小爱同学 5.0 成为控制家中众多 IoT 设备的大脑,当你发出一条需求指令时,小爱同学会进行统一决策,家中多个设备进行协同配合,达到 “再多设备,都能化繁为简”的效果,是当之无愧的 “智能生活助手”。

想要达到智能协同,这其中需要解决的问题非常复杂。不仅要根据设备距离、活跃状态、形态等综合条件判断,自主选择出设备能力最能满足当前语义需求的设备,甚至还需要预测用户潜在的设备控制需求,适时主动的作出提醒和建议。

截止 2020 年 6 月,使用协同唤醒的总用户数已达 94.4 万,同时唤醒的拦截次数已达 9.4 亿。

小爱同学 5.0 对话式主动智能

有别于传统移动互联网 APP 或信息流被动猜测用户的形式,对话式主动智能产品形态是小爱同学以自己的方式和节奏与用户互动沟通,像人一样发起问题来增进对用户的了解。

主动对话本身就是高级智能的体现,它意味着人工智能不仅仅存在于与用户互动的短暂过程中,而是在更长的时间内不断的进行思考和计算,需要像人一样,拥有 “记忆”。

小爱同学 5.0 通过强大的自然语言处理技术,主动学习其中关于用户的知识,从而建立记忆。这有赖于小米自然语言处理技术(MiNLP)的深厚积累,MiNLP 目前已迭代到 3.0 版本,支持 30 多个业务场景,日调用次数达 80 亿。

在记忆的存储方面,小爱同学云端大脑会为用户建立多维度的个人画像,实现全设备个人信息互联互通。小爱同学的所有功能,会对内共享这些关于用户的 “记忆”,每次交互结合个人画像进行计算,产生出面向用户个人的个性化结果。

小爱同学 5.0 定制化情感声音

为了满足用户提出的,可以跨越地理、时间阻碍,随时随地就可以得到陪伴感的 “情感诉求”,小爱同学定制声音项目应运而生。

定制化情感声音的实现,不是仅依靠常规声音处理技术就可以做到的。首先需要能够对用户音频数据进行预处理。然后是提取关键声学特征,区别不同音色在频谱上的表现。最后是通过定制合成音库训练的基础模型,进行自适应学习,最终才能可实现只需少量的用户录音,就能取得很好的合成效果。

除了定制声音功能以外,小爱同学 5.0 针对粤语也进行了深度的优化,并在 8 月份开启了粤语在音箱上的内测。本月中旬,我们已正式启动在手机及电视上小爱同学粤语功能的内测,预计在月内,小爱同学粤语功能将陆续开放到所有音箱上。

小爱同学 5.0 智慧学习好助手

小爱同学 5.0 将学习作为一个重要的升级模块,整合了海量的优质的 K12 网课资源,精选 1000 + 网课视频资源,与读书郎、义方教育等 35 家优质资源方达成了合作,并拉通了电视 / 音箱 / 手机教育会员同步。

课程表是学生学习中最基本的一个工具类需求。我们把课程表与小爱同学结合在一起,打造了一个拥有国内首发 AI 拍照导入课程功能等先进人工智能技术加持的 AI 课程表。

另外一大工具,就是翻译。为了让翻译更高效、更精准,小爱同学团队在文本前处理模块进行了优化,包括基于语言规则和模型的文本顺滑技术、融合上文内容的实时文本纠错算法、基于多语言预训练模型的实时语义断句算法等。

小爱同学 5.0 多模态融合交互

为了让小爱同学与用户之间进行更自然的沟通,我们做了更智能的多模态融合交互,可以通过声音、肢体语言、信息载体(文字、图片、音频、视频)、环境等多种方式与智能设备进行交流。打破了传统 PC 式的键盘输入和智能手机的点触式交互,定义了下一代智能产品和人的专属交互模式。

新一代小爱同学背后 是小米 AI 能力的长期积累

小米集团拥有非常丰富的业务线,包含了硬件产品、电商和新零售以及互联网业务。小米的人工智能不仅仅体现在小爱同学上,还拥有非常广泛的应用领域,比如计算机视觉技术、计算机语音技术和机器学习技术等。经过这几年的努力,我们的 AI 已经建立了比较完整的能力图谱和小米的 AI 能力平台,在此基础上打造了小米的相关应用,包括智能相机、小爱同学、机器翻译等等。强大的智能硬件生态为 AI 能力的快速提升建立了基础,同时 AI 能力又反过来,全面赋能了小米各个业务线。

比如在计算机视觉技术方面,我们做了大量的工作,包括超级分辨率、文档模式 / OCR、魔法换天、魔法分身等。今年,我们的 HDR(高动态范围拍照)也助力小米 10 Pro / 至尊纪念版相机成功获得 DXOMARK 评测世界第一。

我们在计算机语音、机器学习等很多方面也都做了大量的工作,整个集团在人工智能领域的投入,可能远远超过大家的想象。截止 2019 年 12 月 31 日,小米集团共提交专利申请 33000 余件,其中 AI 领域专利申请数量已进入全球互联网企业第一阵营。包括端到端语音识别、就近唤醒、分布式放音、离线翻译等在内的多项技术处于行业一流水平。

同时,我们也在积极引入全球顶尖的研发人才,比如我们成功邀请到了人工智能领域的顶尖专家 Daniel Povey 加入小米。

未来,小米的人工智能会进一步打造核心技术,推进各项 AI 技术的业务落地,给用户打造更好的体验。同时,也会更加的开放,继续加强和高等院校科研院及其企业的合作,将更多更好的 AI 技术开放给社会,为每一个人带来更美好的和智能的生活。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296595
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261514
  • 小米
    +关注

    关注

    70

    文章

    14509

    浏览量

    151179
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能企业深兰科技新总部启用

    金秋时节,张江科学城的创新浪潮格外澎湃。今日,人工智能企业深兰科技以 “智启新程,科创未来” 为主题,在上海市浦东新区环科路 555 弄科贤园 3 号楼全新总部,书写了一场贯穿全日、意义深远
    的头像 发表于 08-25 15:16 824次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:23

    关于人工智能处理器的11个误解

    应用,以及哪些是真实情况而哪些只是炒作,仍存在诸多误解。GPU是最佳的人工智能处理器尽管GPU在人工智能的实现过程中发挥了关键作用,而且如今它们的应用也极为广泛,但将其推
    的头像 发表于 08-07 13:21 874次阅读
    关于<b class='flag-5'>人工智能</b>处理器的11个误解

    芯元智亮相2025世界人工智能大会

    近日,2025年世界人工智能大会(WAIC 2025)正式开幕,芯元智作为行业领先的人工智能感知与边缘计算芯片创新研发企业,再次亮相展会。在这场为期3天的展会上,芯元智以“AI芯赋
    的头像 发表于 08-01 10:41 1334次阅读

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    Ampere如何解决人工智能背后的能源困境

    人工智能已从一项前景广阔的创新成果迅速蜕变,成长为一股强大的力量,正重塑着商业领域的每一个角落以及人们日常生活的方方面面。从革新企业的运营模式,到提升全球消费者的体验,人工智能不再是一种小众技术,而是推动全球变革的关键驱动力。
    的头像 发表于 05-07 10:43 748次阅读

    开售RK3576 高性能人工智能主板

    ,HDMI-4K 输出,支 持千兆以太网,WiFi,USB 扩展/重力感应/RS232/RS485/IO 扩展/I2C 扩展/MIPI 摄像头/红外遥控 器等功能,丰富的接口,一个全新八核拥有超强性能的人工智能
    发表于 04-23 10:55

    光峰科技任人工智能智能制造专业委员会委员

    在当今全球科技竞争日益激烈的时代,人工智能智能制造已成为推动经济发展和产业升级的核心力量。3月20日,深圳上市公司协会人工智能智能制造专委会正式成立,激光半导体技术领
    的头像 发表于 03-21 16:39 598次阅读

    人工智能大模型年度发展趋势报告

    2024年12月的中央经济工作会议明确把开展“人工智能+”行动作为2025年要抓好的重点任务。当前,以大模型为代表的人工智能正快速演进,激发全球科技之变、产业之变、时代之变,人工智能发展迎来新高潮。随着大模型推理、多模
    的头像 发表于 02-13 10:57 1511次阅读
    <b class='flag-5'>人工智能</b>大模型年度发展趋势报告

    西井科技亮相2025年人工智能行动峰会

    近日,为期两天的人工智能行动峰会(2025 AI Action Summit)在法国首都巴黎的大皇宫拉开帷幕。此次峰会吸引全球100多个国家的领导人和科技巨头代表参会,旨在深入探讨人工智能技术的安全
    的头像 发表于 02-12 10:51 867次阅读

    2025年人工智能会发生哪些变化

    2025年人工智能会发生哪些革命性的变化?斯坦福大学以人为中心的人工智能研究所的领先专家表示,2025 年人工智能的一个主要趋势是协作人工智能系统的兴起,其中多个专业代理协同工作,人类
    的头像 发表于 01-21 11:28 1549次阅读

    Embarcadero:人工智能驱动发展我们的期望是什么

    发展的方向。 这是一张在simplified.com上,通过提示“屏幕上有人工智能的笔记本电脑”而生成的人工智能图像。这一实现令人印象深刻,但同样任重道远。图像和电影比文本更难处理。难度超过代码了吗? 当今的人工智能 在远程服务
    的头像 发表于 01-15 10:46 646次阅读

    人工智能推理及神经处理的未来

    、个性化和效率的社会需求,又进一步推动了人工智能技术的集成。此外,不断发展的监管体系,则强调了合乎伦理道德的人工智能、数据隐私和算法透明度的重要性,进而指导人工
    的头像 发表于 12-23 11:18 869次阅读
    <b class='flag-5'>人工智能</b>推理及神经处理的未来