四个顶级人工智能系统的仇恨言论检测能力依然很差-电子发烧友网

尽管人工智能（AI）技术领域在最近取得了进步，但它依然在大多数基本应用上暴露出很多问题。

在一项新的研究中，科学家们对四个顶级人工智能系统的仇恨言论检测能力进行了测试，他们发现所有系统在识别恶意、以及无害言论上都存在着不同程度的问题。

这一结果并不令人吃惊，因为构建可以理解自然语言细微差异的人工智能是一件非常困难的工作。然而，研究人员们诊断问题的方式却是非常重要的。

为了更加精确地找出系统故障的原因，研究人们针对仇恨言论的方方面面制定了 29 种不同的测试，这会让我们更容易地去了解克服系统缺陷的方法。同时，这些测试也正在帮助一项商业服务提升其人工智能的性能。

由牛津大学以及阿兰・图灵研究所科学家所领衔的论文作者们，对 16 家监管网络仇恨言论的非营利组织的雇员进行了采访。

研究团队利用这些采访将仇恨言论划分为了 18 个不同的种类，仅侧重于英语以及基于文本的仇恨言论，其中包括贬损用语、诋毁性文字以及威胁性词汇。

他们还发现了 11 种经常让人工智能监管者产生误判的不含仇恨情绪的情形，其中包括在不冒犯他人的情况下使用脏话、被目标群体所接纳的诋毁性词语，以及引用原始仇恨言论对仇恨言论进行谴责的行为（也被称为反面论证）。

研究人员针对 29 种不同情况中的每一种编写了数十个范例，并且使用了像 “我讨厌【某人】” 以及 “对我来说，你就是个【诋毁性词语】” 这样的 “模板” 语句，从而为七个受保护的群体生成相同的范例集合 —— 这些人都受美国法律的保护而不会遭到歧视。研究人员对被称作 HateCheck 的最终数据集进行了开源处理，该数据集中共含有近 4000 个范例。

之后，研究人员又对两项受欢迎的商业服务进行了测试：谷歌和 Jigsaw 的 Perspective AI、以及 Two Hat 的 SiftNinja。这两个服务都允许客户标记出帖子以及评论中带有仇恨色彩的内容。

Perspective 的用户包括 Reddit 以及像《纽约时报》、《华尔街日报》这样的新闻机构，根据其所处理的有害信息，人工智能服务会对帖子以及评论进行标记，以供人工审查使用。

SiftNinja 的检测标准过于宽松，进而没有识别出几乎所有的变化，而 Perspective 的标准则过于严格。它检测出了 18 个仇恨种类中的大部分，但同时也标记出了许多像被接纳的诋毁性词语以及反面论证这样的不含仇恨情绪的情况。

研究人员在测试谷歌的两个学术模型时也发现了相同的模式，这些模型代表了业界中顶级的语言人工智能技术，它们同时也是其它商业性内容审核系统的基础。学术模型还显示出，受保护群体之间的表现并不相同 —— 有些群体的仇恨程度比其它群体更容易被错误归类。

测试结果指明了当今人工智能仇恨言论检测方面最具挑战性的一个方面：审核太少，没法解决问题；而审核太多，就会删除掉边缘化群体用来强调和保护自己的话语。

牛津大学互联网研究院的博士候选人保罗·罗特格（Paul Röttger）是本篇论文的共同作者。罗特格表示，“突然之间，你就会成为那些在仇恨言论中首当其冲的群体的惩罚者。”

Jigsaw 的首席软件工程师露西·瓦瑟曼（Lucy Vasserman）表示，Perspective 利用人工审查来进行最终决策，进而克服了这些局限性。但是，这种方法无法扩展至更加庞大的平台上。当前，Jigsaw 正在开发一种基于 Perspective 的不确定性的，同时可以对帖子及评论变更优先顺序的系统。该系统可以自动移除带有仇恨色彩的内容，并将边缘信息标记出来。

瓦瑟曼说道，新研究最令人激动的地方在于，它为这种顶尖技术提供了一种细致的评估方式。她还表示，“论文中强调了的许多东西，例如对那些模型来说是一个挑战的被人们所接纳的诋毁性词语。我们早就认识到了它们的存在，但却一直很难对其进行量化处理。” 目前，Jigsaw 正在使用 HateCheck 来更好地了解自身模型间的差异，以及需要继续改进的地方。

学术界也对此次研究的成果感到兴奋。华盛顿大学语言人工智能研究员马丁·萨普（Maarten Sap）表示，“这篇论文为我们评估行业中的系统提供了一个优良且干净的资源，它会让企业和用户不断地去提升自己的系统。”

罗格斯大学社会学助理教授托马斯・戴维森托马斯·戴维森（Thomas Davidson）对此表示认同。戴维森表示，语言模型的局限性以及杂乱无章的语言现象意味着，人们总会在识别仇恨言论的过程中对过松或过紧的问题进行取舍。他还说道，“HateCheck 数据集让这些取舍变得可视化了。”

-End-

原文：

https://www.technologyreview.com/2021/06/04/1025742/ai-hate-speech-moderation/

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
5838

浏览量
103228
人工智能

人工智能

+关注

关注
1775

文章
43717

浏览量
230495

原文标题：测试四个顶级系统，科学家发现AI的仇恨言论审核能力依然很差

文章出处：【微信号：deeptechchina，微信公众号：deeptechchina】欢迎添加关注！文章转载请注明出处。

5G智能物联网课程之Aidlux下人工智能开发

/25611.html *附件：芯片模组外观检测实训.pdf 人工智能 机器人：基于融合系统的机器人仿真实训 38分02秒 https://t.elecfans.com/v/25521.html *附件：机器人

发表于 04-01 10:40

创龙教仪基于瑞芯微3568的ARM Cortex A-55教学实验箱适用于人工智能传感器物联网等领域

采用ARM架构的通用型SoC，主要应用于智能硬件和工业应用。CPU采用四核A55架构处理器，集成Mali G52图形处理器和独立的人工智能NPU处理器。RK3568J支持三屏异显，支持CAN、UART

发表于 03-22 14:29

嵌入式人工智能的就业方向有哪些?

嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下，嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下，众多名企也纷纷在嵌入式人工智能领域布局

发表于 02-26 10:17

如何使单片机与无线供电结合，从而使人工智能脱离电池和线路？

如何使单片机与无线供电结合，从而使人工智能脱离电池和线路

发表于 10-31 06:34

ai人工智能机器人

随着时间的推移，人工智能的发展越来越成熟，智能时代也离人们越来越近，近几年人工智能越来越火爆，人工智能的应用已经开始渗透到各行各业，与生活交融，成为人们无法拒绝，无法失去的一

发表于 09-21 11:09

《通用人工智能：初心与未来》-试读报告

作者给出的结论。整体读下来，可以给我们关于通用人工智能全面的了解。作者也反复强调了通用人工智能与专用智能的区别。尤其是人们错误的认为一堆专用智能堆砌起来就是通用

发表于 09-18 10:02

如何将人工智能应用到效能评估系统软件中去解决

　　如何将人工智能应用到效能评估系统软件中去解决　　华盛恒辉效能评估系统是一种非常实用的管理工具，它可以帮助组织和企业掌握其运营状况，优化业务流程，提高效率和生产力。然而，随着人工智能

发表于 08-30 12:58

手机是人工智能吗

我们来了解一下。首先，我们需要明确人工智能的定义是什么。人工智能最基本的定义是：计算机系统在执行任务时，表现出人类的智能和思维能力，具有感

发表于 08-12 16:58 •2166次阅读

AI 人工智能的未来在哪？

人工智能、AI智能大模型已经孵化；繁衍过程将突飞猛进，ChatGPT已经上线。世界首富马斯克认为AI对人类是一种威胁；谷歌前CEO施密特认为AI和机器学习对人类有很大益处。每个国家对核武器的运用有两面性，可造可控；但AI智能

发表于 06-27 10:48

【书籍评测活动NO.16】通用人工智能：初心与未来

的新一波人工智能正在兴起。自然语言处理、人脸识别、自动驾驶、无人系统等复杂人工智能任务相继取得大的突破，人工智能在很多特定问题（如围棋、《星际争霸》游戏、医疗诊断等）的解决上甚至超过了

发表于 06-21 14:41

【EASY EAI Nano人工智能开发套件试用体验】EASY EAI Nano人工智能开发套件开箱及最快上手教程

EASY EAI Nano人工智能开发套件简介 EASY EAI Nano是广州灵眸科技有限公司的旗舰级硬件产品。基于瑞芯微RV1126 处理器设计，具有四核CPU@1.5GHz与NPU@2Tops

发表于 06-11 13:34

人工智能一例

这句话里边有几个参数？如果x=1则执行a 如果是单计算的话只有1这一个参数。但如果是人工智能的话有如下几个参数，逻辑门，如果则未知数，符号x 常量，1 函数，a 很多复杂的智能都可以如此拆分

发表于 06-10 01:05

【EASY EAI Nano人工智能开发套件试用体验】开箱视频及核心板介绍

今天收到了EASY EAI Nano人工智能开发套件，趁着热乎给大家做个开箱视频，希望各位看官对EASY EAI Nano人工智能开发套件有一个简单的了解，后面也对核心板做一些介绍

发表于 05-31 19:45

【EASY EAI Nano人工智能开发套件试用体验】开箱后硬件了解及上电

总的来说开箱后整个EASY EAI Nano人工智能开发套件还是做工精细，板子设计合理，打开包装盒给人的第一感觉是精美，高大上的一种感觉。 EASY EAI Nano人工智能开发套件，EASY

发表于 05-31 19:35

【EASY EAI Nano人工智能开发套件试用体验】EASY EAI Nano人工智能开发套件开箱及硬件初体验

今天收到了EASY EAI Nano人工智能开发套件，为大家做个开箱及硬件评测。打开快递包装，引入眼帘的是一个设计精美蓝色的大盒子，在盒子里有EASY EAI Nano人工智能开发板、天线、喇叭

发表于 05-31 19:18

搜索历史

四个顶级人工智能系统的仇恨言论检测能力依然很差

评论

5G智能物联网课程之Aidlux下人工智能开发

创龙教仪基于瑞芯微3568的ARM Cortex A-55教学实验箱适用于人工智能传感器物联网等领域

嵌入式人工智能的就业方向有哪些?

如何使单片机与无线供电结合，从而使人工智能脱离电池和线路？

ai人工智能机器人

《通用人工智能：初心与未来》-试读报告

如何将人工智能应用到效能评估系统软件中去解决

手机是人工智能吗

AI 人工智能的未来在哪？

【书籍评测活动NO.16】通用人工智能：初心与未来

【EASY EAI Nano人工智能开发套件试用体验】EASY EAI Nano人工智能开发套件开箱及最快上手教程

人工智能一例

【EASY EAI Nano人工智能开发套件试用体验】开箱视频及核心板介绍

【EASY EAI Nano人工智能开发套件试用体验】开箱后硬件了解及上电

【EASY EAI Nano人工智能开发套件试用体验】EASY EAI Nano人工智能开发套件开箱及硬件初体验