苹果正在努力让Siri等语音技术更容易被语言模式不典型的用户所接受。根据《华尔街日报》的报道,该公司正在研究如何自动检测某人说话是否有口吃。为此,该公司已经从播客中积累了近2.8万个人们说话时有口吃的片段。
这一数据发表在本周的一份苹果研究报告中(PDF链接:https://arxiv.org/pdf/2102.12394.pdf)。
虽然苹果发言人拒绝评论它将如何使用这些数据的发现,但至少该公司计划至少利用其中的一部分来改进语音识别系统。在此期间,苹果在2015年推出的Hold to Talk功能允许用户控制他们希望Siri倾听多长时间。这有助于防止助手在命令完全说出之前打断用户或超时。
虽然文章没有提到,但Siri也可以在macOS和iOS上使用Type to Siri功能来激活和控制。
针对非典型语音模式的训练只是Siri改进的一个研究领域。苹果还在开发系统,可以通过锁定用户独特的语音模式来帮助保护设备的安全。《华尔街日报》还报道了亚马逊和谷歌等其他科技公司如何训练他们的数字助理,以了解更多可能在语音命令方面有问题的用户。
亚马逊在去年12月推出了一个新的基金,允许拥有非典型语音模式的用户训练算法,以识别他们独特的声音。谷歌也在收集非典型语音数据,用于谷歌助手。
责编AJX
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
苹果
+关注
关注
61文章
24613浏览量
208746 -
语音识别
+关注
关注
39文章
1825浏览量
116236 -
语音助手
+关注
关注
7文章
243浏览量
27645
发布评论请先 登录
相关推荐
热点推荐
语音识别芯片的功能与优势有哪些
在智能语音交互快速发展的今天,语音识别芯片作为核心部件,正逐渐成为各类智能设备不可或缺的组成部分。一款优秀的语音识别芯片,不仅决定了设备的智
每年10亿美元,苹果与谷歌官宣合作,Gemini大模型注入Siri
该协议,下一代苹果基础模型(Apple Foundation Models)将基于谷歌的Gemini模型和云技术。 苹果:借Gemini之力,加速AI追赶 长期以来,苹果在AI领域的发展相对滞后,其
端侧大模型上车:从“语音助手”到“车内 AI 智能体”的跃迁革命
生活空间”的可能性。当7B级大模型在车规级芯片上流畅运行,当多模态交互(语音+视觉+传感)成为标配,车载助手已从“被动响应”升级为“主动决策”,成为车内真正的“数字大脑”。这场由端侧大模型驱动的变革,正推动主机厂将“支持7B模型
国产32位MCU语音识别方案
在智能家居、工业控制及便携设备领域,语音交互正成为人机界面的重要发展方向。针对离线语音识别需求,基于国产32位MCU的解决方案日益成熟,其中以CH32V307
【AI语音模组】自制小智管家?安信可Ai-WV01-32S测试体验
项目名:默语小智管家 模组支持: 安信可科技 AI语音模组 作者:安信可论坛用户 molun 这两年, AI 硬件又卷起来了。 语音助手、AI宠物、智能陪伴…… “小智”类AI设备
语音识别芯片有哪些(语音识别芯片AT680系列)
在人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,语音识别芯
什么是离线语音识别芯片(离线语音识别芯片有哪些优点)
指令的识别与响应。无论是在家庭还是嘈杂的工业场合,这一类芯片都可以实现高准确率的智能语音交互,这种离线控制方式为用户提供了极大的便利。
语音识别系统的技术核心:从声音到文字的智能转换
语音识别技术,也称为自动语音识别(ASR),其核心目标是将人类语音信号转换为对应的文本或指令。随着人工智能的发展,
明远智睿SSD2351开发板:语音机器人领域的变革力量
接口则让语音机器人可以连接到互联网,实时获取最新的信息,增强其智能性和交互能力。 在实际应用场景中,以智能客服语音机器人为例。SSD2351开发板可以驱动语音识别模块,准确
发表于 05-28 11:36
苹果正改进Siri等语音助手识别用户是否口吃
评论