0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Siri的重大改进:为Siri引入机器学习技术

HyiC_iphone_app 来源:未知 作者:李倩 2018-04-19 15:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Apple 的 Siri 可以说是最著名的语音助手之一,其中不必按按钮便能向 Siri 下指令的「Hey Siri」功能也受到许多好评,近日在博客中,Siri 团队除了表示计划运用机器学习持续改进这项功能,也解释了 iOs 设备的 Hey Siri 功能的运作方式,以及未来计划持续改进的目标。

所谓的「Hey Siri」功能,就是让使用者不必按按钮、只需在语音指令前加上 Hey Siri,手机便会自动启动并遵照指示行动。

但 Apple 究竟是怎么做到的?博客文章指出,「Hey Siri」的进化与解决了「关键片语检测」(key-phrase detection)问题相关,同时运用了 DNN 来进行了早期建模工作,并使用了递归神经网络(RNN)来进行多样化的训练与学习。

Siri 团队解释,之所以选择以「Hey Siri」作为触发语,是因为即使在这项功能推出以前,人们在运用按钮呼唤 Siri 也会自然而然的在请求前加上这句话。这原先是一个方便用户的简单决定,但早期的离线实验中,Hey Siri 的简洁和口语性却为开发团队带来额外的挑战。

Siri 团队主要面临的错误辨识挑战为三种,分别为当用户表达类似短句时、当非用户说出 Hey Siri 时,以及最令 Siri 团队头痛的当非用户说出类似短句时。

为了让 Siri 不被类似短句及非用户误导,团队先是将焦点由寻常语音辨识目标的「说话内容」转移至辨识「说话者」的身份,利用说话者辨识(speaker recognition, SR)并结合相关技术来增进侦测关键短句的系统质量。

以目前来说,Apple 会要求首次使用的用户以要求的 5 个短句来语音来完成说话者辨识系统的注册,但除了这种显性注册模式之外,团队也设计了另一种隐性模式(implicit enrollment)的辨识:透过纪录用户一段时间内的语音,进而提高对说话者辨识的稳健性。

当然考量到个人隐私的因素,音频将保留于设备上而并非云端,但这种设计目前仍有一些疑虑存在,如果早期纪录的语音片段并非用户本人,那么设备可能会错误的拒绝用户指令或错误的接受非用户的声音,如此一来功能将变得毫无用处。

展望未来,除了像所有语音辨识系统一样得想办法克服环境噪音的问题,Siri 团队还希望未来用户能不需经过任何训练与注册,在开始使用「Hey Siri」功能后透过用户的许可,透过生活里的指令中便能将语音辨识资料的内容持续增长与更新。

虽然还不清楚这些改动何时会推出,但 Apple 经常会在每年 6 月全球者开发大会上谈到 Siri 的重大改进,相信在不久的未来我们很快就能听到一些好消息。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    67

    文章

    8571

    浏览量

    137447
  • Siri
    +关注

    关注

    4

    文章

    206

    浏览量

    38802
  • 语音助手
    +关注

    关注

    7

    文章

    244

    浏览量

    27669

原文标题:苹果为Siri引入机器学习技术:不再认错主人!

文章出处:【微信号:iphone-apple-ipad,微信公众号:iPhone频道】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    瑞芯微(EASY EAI)RV1126B yolov11-track多目标跟踪部署教程

    的显著进步基础上,YOLO11在架构和训练方法上引入重大改进,使其成为广泛计算机视觉任务的灵活选择。Bytetrack多目标跟踪是一种tracking-by-det
    的头像 发表于 05-11 17:01 6010次阅读
    瑞芯微(EASY EAI)RV1126B yolov11-track多目标跟踪部署教程

    ASPICE 是什么?汽车系统过程改进和能力确定概念(一)

    Determination ,中文译名为汽车软件过程改进与能力评定,在 4.0 版本迭代后,其覆盖范围扩展至 硬件、机器学习等领域 ,“S”的含义从软件变为系统,名称变为Automotive
    发表于 04-02 13:53

    人工智能与机器学习在这些行业的深度应用

    自人工智能和机器学习问世以来,多个在线领域的数字化格局迎来了翻天覆地的变化。这些技术从诞生之初就为企业赋予了竞争优势,而在线行业正是受其影响最为显著的领域。人工智能(AI)与机器
    的头像 发表于 02-04 14:44 793次阅读

    每年10亿美元,苹果与谷歌官宣合作,Gemini大模型注入Siri

    电子发烧友网报道 当地时间1月12日,苹果官宣将与谷歌联手,苹果的人工智能功能提供支持,其中包括今年晚些时候对Siri的一次重大升级。谷歌在其官方博客上表示,苹果已与谷歌达成一项多年合作协议,根据
    的头像 发表于 01-13 14:59 6021次阅读

    机器视觉的核心技术和应用场景

    机器视觉正通过让机器“看见”并解读视觉数据来行业带来变革,进而提升自动化水平、质量控制效率与运营效能。本文将深入探讨机器视觉的技术核心,聚
    的头像 发表于 12-29 16:32 1140次阅读

    穿孔机顶头检测仪 机器视觉深度学习

    顶头状态。 检测顶头算法 引入人工智深度学习技术,通过Keras实现卷积神经网络(CNN),用Numpy实现采集数据的训练,得到符合现场需求的模型,进一步提升检测的准确性和现场的适应性。 应用范围
    发表于 12-22 14:33

    神经网络的初步认识

    如今在机器学习的领域中,有许多方法可以用来解决特定的问题,例如房价预测、邮件分类、文件压缩等。而与我们日常生活关系最密切的应用莫过于计算机视觉(如学校门禁系统)和自然语言处理(如Siri)。这些
    的头像 发表于 12-17 15:05 536次阅读
    神经网络的初步认识

    SOLIDWORKS 2025材料明细表的可视化改进

    2025版本在材料明细表的可视化方面带来了重大改进,这些改进不仅深化了设计师对产品结构的理解,还显著提升了团队协作的效率与准确性。
    的头像 发表于 11-10 10:31 530次阅读
    SOLIDWORKS 2025材料明细表的可视化<b class='flag-5'>改进</b>

    如何在机器视觉中部署深度学习神经网络

    人士而言往往难以理解,人们也常常误以为需要扎实的编程技能才能真正掌握并合理使用这项技术。事实上,这种印象忽视了该技术机器视觉(乃至生产自动化)带来的潜力,因为深度
    的头像 发表于 09-10 17:38 1135次阅读
    如何在<b class='flag-5'>机器</b>视觉中部署深度<b class='flag-5'>学习</b>神经网络

    了解SOLIDWORKS202仿真方面的改进

    随着SOLIDWORKS 2025版本的发布,这款三维CAD和仿真分析软件的再次展现了其在技术创新上的强劲实力。SOLIDWORKS 2025在仿真方面进行了多项重大改进,旨在提升仿真精度、可靠性
    的头像 发表于 09-04 10:36 908次阅读
    了解SOLIDWORKS202仿真方面的<b class='flag-5'>改进</b>

    芯科科技Arduino开发资源重大更新

    Silicon Labs (芯科科技)近期于在线技术社群中发布了面向Arduino Core和Matter库的重大更新,带来了两个关键突破:全面支持Matter 1.4标准,以及人工智能和机器
    的头像 发表于 08-20 15:51 1214次阅读

    德国莫尔利用全新的在线配置器改进了电缆引入装置设计流程

    在线产品,定制电缆引入装置设定了新的基准。murrplastik高级产品经理Till Bergmann表示:莫尔是完全根据客户要求生产多种结构电缆引入装置的公司,特别是机器人和能源链
    发表于 08-20 14:29

    基于RK3576开发板的yolov11-track多目标跟踪部署教程

    的显著进步基础上,YOLO11在架构和训练方法上引入重大改进,使其成为广泛计算机视觉任务的灵活选择。Bytetrack多目标跟踪是一种tracking-by-det
    的头像 发表于 07-25 15:21 2332次阅读
    基于RK3576开发板的yolov11-track多目标跟踪部署教程

    贸泽电子2025边缘AI与机器学习技术创新论坛回顾(上)

    2025年,随着人工智能技术的快速发展,边缘AI与机器学习市场迎来飞速增长,据Gartner预计,2025年至2030年,边缘AI市场将保持23%的复合年增长率。
    的头像 发表于 07-21 11:08 1403次阅读
    贸泽电子2025边缘AI与<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>技术</b>创新论坛回顾(上)

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 3204次阅读