0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软是怎么人工审核你的Cortana录音的?

DPVg_AI_era 来源:lq 2019-09-13 16:09 次阅读

继谷歌、苹果、亚马逊、Facebook等科技巨头纷纷被曝出人工收集用户语音数据后,微软也承认了类似做法。根据一份泄密文件,微软承包商的酬劳很低,每小时要处理大约200条数据,而且他们在Cortana录音中听到过很私人的敏感信息

近段时间,包括谷歌、苹果、亚马逊、Facebook等在内的科技巨头纷纷被曝出人工收集用户语音数据。

而最近,微软承认员工和供应商会收听Skype和Cortana的语音数据和录音,来改善微软产品和服务的语音识别、翻译、意图理解等功能。

那么,这些科技巨头雇佣的人工到底做了什么呢?根据一份泄密文件,这些人做的是一些辛苦耗时的重复性工作。

“我为微软所做的大部分工作都集中在注释和转录Cortana命令,”一位微软承包商表示。

关于对这类数据进行分类的使用说明书有几百页,承包商要从令人眼花缭乱的选项中对数据进行分类,以及他们需要遵循的标点符号样式指南。

承包商表示,他们每小时要处理大约200条数据,而且他们在Cortana录音中听到过很私人的敏感信息。文件显示,对于某些工作,承包商需要每小时完成至少200项任务。

任务繁重,报酬很低

这项工作的报酬并不高。每小时只有12-15美元不等。其中要求特别关注触发命令“Hey,Cortana”,注意区分记录不同的语言和口音的发音,包括德语、中文、日语和澳大利亚语,加拿大语和美式英语等。 另外,微软要求将很多发音类似的单词转录为“Cortana”,比如用户的发音是“Cortona”或“Cortina”,也要能够激活Cortana。微软认为,用户的本意就是如此。此外,有些任务需要明确地将与联系人或其他个人信息相关的专有名词大写。” 微软发言人在一封电子邮件声明中表示,“我们一直在寻求提高透明度,帮助客户做出更明智的选择。我们披露的信息表明,我们使用Cortana和Skype Translator的客户内容是为了改进这些产品,我们邀请了第三方专家协助这一过程,并采取措施抹去这些信息,以保护人们的隐私。“ 在媒体曝出微软对Skype翻译功能和Cortana中的用户语音进行审核后,微软更新了其产品隐私政策页面,明确说明了可能会有人收听所收集的音频信息。 其实这些人的主要工作是对用户的语音数据其进行分类。微软要求承包商将每份录音按照“领域”或“主题”来划分。这些包括“日历”、“报警”、“捕获”。其他领域包括游戏,电子邮件、通信、反馈、媒体控制和“订购食品”。还有一个“通用”域,可以放入多个域的通用命令,并向其中添加文档。 每个域都有几个不同的“意图”。比如说“警报”域,包括设置警报、关闭警报、查找警报,更改警报、设置/查找计时器等。 微软的承包商会分析这些Cortana命令,然后确定适当的域/意图。还有一些音频中涉及“双重意图”,即用户要求Cortana一次完成两项任务,对于这些信息,承包商也必须注意。 谷歌、苹果都这么干过,被曝光后已暂停

此前不久,苹果和谷歌的语音助手Siri和Google Assistant都被曝出以人工收集并审核用户语音数据的事件。两家公司在事件曝光后均承认了这一点,并很快宣布暂停人工审核。

今年7月中旬,谷歌宣布Google Assistant录音审核政策在欧盟国家范围内暂停至少三个月,德国的一家隐私监管机构于8月1日启动了对谷歌的调查。 谷歌的一位发言人表示,“在机密音频数据泄露事件曝光后,我们立即暂停了语音助手的人工审核,开始调查。我们目前与德国的隐私保护机构保持着接触,正在对语音的审核方式进行评估,帮助用户理解我们对数据的使用方式。” 谷歌一位产品经理David Monsees表示,谷歌人工审核的语音录音只占全部录音的0.2%。 8月2日,苹果宣布停止由承包商人工审核用户的语音录音,并表示将更新软件,用户可以选择拒绝人工审核选项。 根据苹果的Siri和听写服务条款,用户录制和听写的内容可能会被发送至苹果,包括名字、合约和与用户之间的关系等信息,还包括用户家中支持家庭套件服务的设备、手机上还安装了哪些app等,都在可能被发送的内容之列。苹果对此未予置评。 目前,用户无法通过Siri获取或删除自己的录音;我们可以选择停止使用Siri或删除Apple帐户。然而,苹果的条款表明,如果Siri和dictation都被禁用,苹果将删除用户数据和最近的录音。任何与原始用户无关的东西——包括音频文件、transcripts、用户在提出请求时的位置和性能统计数据——都可用于苹果改进Siri和dictation。

要在Apple设备上禁用iOS 11+中的Siri,需要这样做:

1.设置> Siri & Search 2.关闭“Listen for 'Hey Siri'”和“Press Side Button for Siri”(按侧键唤醒Siri) 3.确认“Turn Off Siri”(关闭Siri)

然后,用户还可以禁止从dictation中录制:

1.单击设置>General(常规)>Keyboard(键盘) 2.关闭“Enable Dictation”(启用听写)并确认 科技进步和用户隐私真的是矛盾吗? 当把Siri、Alexa、Cortana等语音助理放在显微镜下时,语音助理隐私恐慌故事就出现了。它们代表了一种尚未被充分理解的新的AI技术。例如,公众仍然普遍认为,无论是否说出了唤醒词,这些语音助理使用的麦克风总是在听。这种认知是错误的。 现如今,人们对于科技巨头普遍焦虑和不信任,像谷歌、苹果、Facebook、微软、亚马逊这样的巨头都要用我们的对话来训练、改进自家的技术,那我们还能相信科技公司会负责任地管理我们的数据吗?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6250

    浏览量

    103081
  • Facebook
    +关注

    关注

    3

    文章

    1428

    浏览量

    54037
  • 语音识别
    +关注

    关注

    37

    文章

    1635

    浏览量

    111838

原文标题:操作细节曝光:微软是怎么人工审核你的Cortana录音的?

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    微软计划在2024年底前囤积180万人工智能芯片

    微软与OpenAI长期合作开发人工智能,然而在此过程中需投入大量资金以维持行业领先地位。据悉,从2023财年至今,微软在GPU和数据中心建设方面已累计投入约1000亿美元。
    的头像 发表于 04-18 16:05 264次阅读

    微软发布首款人工智能PC

    微软最新发布了旗舰级企业设备——新款Surface Pro 10和Surface Laptop 6,这两款笔记本凭借最新的软件与人工智能功能,强势成为商业笔记本市场中的佼佼者。
    的头像 发表于 03-22 09:46 201次阅读

    晶华电子创业板IPO审核终止

    近日,深圳晶华显示电子股份有限公司(简称“晶华电子”)的创业板IPO审核状态发生变更,由原先的审核中变更为“终止”。据悉,此次终止审核的原因系公司与保荐人主动撤回了上市申请,根据相关规定,深交所决定终止对晶华电子首次公开发行股票
    的头像 发表于 03-14 15:16 324次阅读

    科利德终止IPO审核进程

    大连科利德半导体材料股份有限公司(简称“科利德”)的IPO审核进程已终止。上交所公告显示,由于科利德的保荐人撤销了保荐,因此根据相关规定,上交所决定终止其发行上市审核
    的头像 发表于 03-04 10:47 303次阅读

    鸿蒙开发实战项目:录音变声应用

    没有设置,默认是正常录音的速度,设置完成以后点击开始录音,启动录音功能,点击录音结束后,停止录音录音
    发表于 03-01 17:24

    博世与微软携手探索生成式人工智能应用新领域

    博世正致力于应用生成式人工智能来进一步优化自动驾驶功能。作为此举的一部分,博世和微软正探索合作机会,以充分发挥生成式人工智能潜力。
    的头像 发表于 02-29 10:11 379次阅读
    博世与<b class='flag-5'>微软</b>携手探索生成式<b class='flag-5'>人工</b>智能应用新领域

    嵌入式人工智能的就业方向有哪些?

    。 国内外科技巨头纷纷争先入局,在微软、谷歌、苹果、脸书等积极布局人工智能的同时,国内的BAT、华为、小米等科技公司也相继切入到嵌入式人工智能的赛道。那么嵌入式AI可就业的方向有哪些呢? 嵌入式AI开发
    发表于 02-26 10:17

    录放音语音芯片与采样率:揭秘WT588F02A-16S录音芯片支持的录音采样率

    在数字音频领域,录音芯片和录音采样率是决定音频质量的关键因素。本文将以WT588F02A-16S录音芯片为例,探讨录音芯片和录音采样率之间的
    的头像 发表于 11-30 09:49 234次阅读

    录放音语音芯片与采样率:揭秘WT588F02A-16S录音芯片支持的录音采样率

    在数字音频领域,录音芯片和录音采样率是决定音频质量的关键因素。本文将以WT588F02A-16S录音芯片为例,探讨录音芯片和录音采样率之间的
    的头像 发表于 11-30 09:44 212次阅读
    录放音语音芯片与采样率:揭秘WT588F02A-16S<b class='flag-5'>录音</b>芯片支持的<b class='flag-5'>录音</b>采样率

    语音芯片怎么录音 以及如何选择合适的录音芯片

    语音芯片怎么录音 以及如何选择合适的录音芯片 语音芯片,其中就有一个品类,称之为录音芯片 其实他们是合并在一个芯片里面的,也就是说,录音芯片肯定是又可以录又可以播 但是能播放的语
    的头像 发表于 10-30 15:02 449次阅读
    语音芯片怎么<b class='flag-5'>录音</b> 以及如何选择合适的<b class='flag-5'>录音</b>芯片

    JK405R-SOP16录音芯片ic方案的功能简介,可以内置录音30秒-高采样率

    JK405R是一颗SOP16封装的录音芯片,专用于录音的应用,芯片内置了30秒的录音空间,同时还支持外扩
    的头像 发表于 09-24 09:34 424次阅读
    JK405R-SOP16<b class='flag-5'>录音</b>芯片ic方案的功能简介,可以内置<b class='flag-5'>录音</b>30秒-高采样率

    Llama 2 登陆 Azure 和 Windows,微软与 Meta 拓展人工智能合作伙伴关系

    近几个月来,人工智能创新领域取得的巨大进步掀起了一股变革的浪潮,以重塑行业和工作方式的前景,激发着我们的集体想象力。 日前在微软 Inspire 大会上,Meta 和微软宣布 将在 Azure
    的头像 发表于 07-26 10:35 335次阅读
    Llama 2 登陆 Azure 和 Windows,<b class='flag-5'>微软</b>与 Meta 拓展<b class='flag-5'>人工</b>智能合作伙伴关系

    复杂的舆论场,企业该如何保障内容审核安全?

    权益,内容审核成为了必不可少的一环。 内容审核能够帮助企业及时发现和处理违规信息,降低业务违规风险,提升品牌形象。同时,它也能够提高人工审核效率,减少人力成本,节省业务支出。此外,内容
    的头像 发表于 07-04 14:42 207次阅读

    人工智能黄金时代开启,微软重构对未来和工作的想象

    2023年是具有里程碑意义的一年。在这一年,如同蒸汽机之于工业革命的意义,人工智能已然成为推动世界重构的新生产范式,释放出惊人的生产力和创造力,将改变人们对于未来和工作的想象。正如微软全球CEO
    的头像 发表于 06-16 12:05 222次阅读
    <b class='flag-5'>人工</b>智能黄金时代开启,<b class='flag-5'>微软</b>重构对未来和工作的想象

    微软发布 Azure Linux 正式版

    在内部使用 Azure Linux 两年,并从 2022 年 10 月开始公开预览后,微软本周终于正式提供其 Azure Linux。Azure Linux 是 Azure Kubernetes
    发表于 05-28 08:34