侵权投诉

AI越来越推广普及,我们需注意机器模型中不断涌现的人类偏见

2020-09-24 14:35 次阅读

随着人工智能在企业和社会的应用变得越来越普遍,企业需要注意机器模型中不断涌现的人类偏见。企业可以利用人类的智慧来获取训练算法所需的各种数据和输入。

AI越来越推广普及,我们需注意机器模型中不断涌现的人类偏见

有一些方法可以避免数据集中的偏差。

在训练人工智能(AI)算法时,取决于数据的输入。在业务环境中尤其如此,在这种情况下,人工智能的目的可能是与客户互动,管理自动化系统或模仿人工决策。成果与目标相符至关重要。但是,至关重要的是,企业必须能够解决任何可能歪曲人工智能对指令或请求的响应方式的偏见。

任何新产品的设计和开发阶段都是至关重要的,因为它使企业可以运行测试、识别并消除任何缺陷。如果由于某种原因而忽略了设计缺陷或产品出现故障,则可以快速解决。可以召回有故障的设备,同时可以发布更新和补丁来修复任何软件问题。对于典型的软件版本而言,这一切都很好,但是处理人工智能算法并不是那么简单。

人工智能算法是高度复杂的系统,旨在基于机器学习(ML)执行非常具体的任务。试图消除人工智能投入运行后所产生的任何数量的偏差可能既昂贵又费时;对于“学习”的技术而言,这也违反直觉。在设计和开发阶段采用适当的流程来检测并消除偏差会更加有效。

偏见对企业不利

人工智能的基本目的和功能被引入其基础算法中。如果人工智能要发展出固有的偏差,它将对算法产生不利影响。这可能会严重影响人工智能预期提供的精度和效率,从而限制人工智能满足其商业需求的能力,所有这些都对业务不利。

尽管有开发人员的最佳意图,偏见总能找到一种渗透人工智能算法的方法。与任何学习过程一样,学生也会受到其老师的影响。认可机构的教育范围取决于其课程设置。毫不奇怪,课程越多样化,学生越开明。同样,更大、更多样化的数据集有助于产生更精确、更高效的人工智能算法,从而能够做出更明智的决策。

培训数据和测试结果

每个成功的人工智能算法都建立在训练数据的基础上。但是,采购满足业务要求的数据可能会给物流和间接费用带来巨大挑战,尤其是如果这些要求包括满足大众市场的需求时。

内部开发人员团队,软件工程师和质量保证专家通常来自相同的年龄范围,性别和背景。偏差经常发生在数据收集和数据标记过程中。因此,在构建人工智能算法时,最好不要依赖某一个人或一个小组来提供将用于训练算法的数据。为了正确地训练算法,需要不同类型的数据和输入。

使用为人工智能算法提供与最终服务的客户更接近的人员和体验的暴露能力的模型,将会更有效率。企业可以使用这一模型来训练他们的算法,以响应现实情况,检测出偏差发生的地方并减少其潜在影响。

社区构建的算法

培训数据的成功获取和实施取决于数据本身的数量、质量和多样性。企业获取和处理此数据的唯一方法是利用多样化的参与者。企业需要能够从向其提供特定人口统计信息的社区中进行选择,包括性别、种族、母语、位置、技能、地理位置以及其他适用的过滤条件。

实际上,开发有效的算法需要大量数据。大多数企业没有能力大规模地获取数据。他们需要专用资源的支持才能交付新的软件和服务。最近的一个培训用于媒体和广播服务的智能语音助手的项目需要超过10万种不同的语音。这些话语最终由972个人提供,这些人被远程组装以训练算法。令人难以置信的壮举是,尽管可以在实验室中对语音进行某种程度的模拟,但人工智能仍然需要暴露于各种真实的声音和口音中。

言语训练只是教学大纲的一方面。众包解决方案还可以帮助企业训练人工智能算法以读取手写文档。最近的另一个项目需要数千个手写样本。数量再次成为关键因素,因为该算法需要尽可能广泛的唯一样本。远程聚集了1,000多名参与者,以提供手写文档并满足对各种内容的需求。

公正的结果

删除可能会降低人工智能最终结果准确性的意外偏差很重要。它将永远不会是完美的,但是人工智能会不断学习,并且最好的机器模型是基于大量多样数据集的模型。最好的策略是从提供数量、质量和多样性的池中获取培训数据。如果训练数据没有多样性,该算法将无法识别广泛的可能性,从而使该算法无效。远程社区使企业可以访问此数据,并补充内部开发和测试功能。众包测试可用于训练人工智能算法以研究和识别语音、文本、图像和生物识别,从而为企业提供强大的输出,可满足不同客户群的需求。
责编AJX

收藏 人收藏
分享:

评论

相关推荐

小米有品上架小白智能视频门铃D1套装

近日,小米有品上架由创米科技研发设计的小白智能视频门铃D1套装,正式宣告小米智能家居产品阵列又添一名....
的头像 北京君正 发表于 10-31 10:01 0次 阅读
小米有品上架小白智能视频门铃D1套装

巅峰之作的麒麟9000让Mate40尚未出世便关注度爆棚

史上最强的华为Mate、巅峰之作的麒麟9000、各种强大的影像和AI功能、极具未来感的设计,加之最后....
的头像 lhl545545 发表于 10-31 09:43 15次 阅读
巅峰之作的麒麟9000让Mate40尚未出世便关注度爆棚

技术革新,GCU-LARE实现高性能互联

2020年10月26日,燧原科技正式推出搭载燧原科技云燧T10的PCIe Gen4全互联AI高算力训....
的头像 燧原科技Enflame 发表于 10-31 09:40 18次 阅读
技术革新,GCU-LARE实现高性能互联

第五届中国智慧交通管理产业联盟年会隆重举行

10月27日,由公安部交通管理科学研究所、广东省公安厅交通管理局指导,中国智慧交通管理产业联盟主办,....
的头像 大华股份 发表于 10-31 09:37 27次 阅读
第五届中国智慧交通管理产业联盟年会隆重举行

黄源浩提议建立粤港澳大湾区3D AI视觉技术研究院

为学习贯彻习近平总书记出席深圳经济特区建立40周年庆祝大会和视察广东重要讲话、重要指示精神,贯彻落实....
的头像 奥比中光 发表于 10-31 09:31 33次 阅读
黄源浩提议建立粤港澳大湾区3D AI视觉技术研究院

Cadence将出席2020中国集成电路峰会

Cadence将于10月30-31日出席2020中国(深圳)集成电路峰会,展示应用在AI、高性能计算....
的头像 Cadence楷登 发表于 10-30 17:50 182次 阅读
Cadence将出席2020中国集成电路峰会

图深度学习与曾经风靡一时的流形学习有何关系?

然而,在某些场景下,我们并不能奢求拥有一个作为输入的图。这种情况在许多生物学问题中屡见不鲜,在最好的....
的头像 通信信号处理研究所 发表于 10-30 17:23 153次 阅读
图深度学习与曾经风靡一时的流形学习有何关系?

“新基建”政策升温,“竞标赛”将启

尽管BATH四大巨头在新基建各领域皆有深度布局,但各家的禀赋优势不同,推动新基建的具体思路也不尽相同....
的头像 通信信号处理研究所 发表于 10-30 17:19 241次 阅读
“新基建”政策升温,“竞标赛”将启

“脑内世界模型”是否能与外部物理世界进行正确关联

情绪并非像传统哲学所认为的那样,是与理性相对的感性,是一种多余的心理能力。各类脑损伤研究表明,情绪和....
的头像 通信信号处理研究所 发表于 10-30 17:16 43次 阅读
“脑内世界模型”是否能与外部物理世界进行正确关联

如何使用YOLO框架实现道路车辆拥堵的模型分析

针对当前交通运行出现的拥堵问题,提出一种新型的道路状态判断模型。首先,模型基于YOLOv3目标检测算....
发表于 10-30 17:02 6次 阅读
如何使用YOLO框架实现道路车辆拥堵的模型分析

英特尔欲收购AI领域的SigOpt,以增强竞争力

人工智能是未来数十年人类最重要的技术,因此,AI领域一直是巨头们重点布局的领域之一,最近英特尔也在A....
的头像 电子魔法师 发表于 10-30 16:52 209次 阅读
英特尔欲收购AI领域的SigOpt,以增强竞争力

ZLG M1808 AI核心板提供嵌入式+AI的司机行为检测方案

摘要:司机在驾驶过程中使用手机、抽烟、打哈欠等不良驾驶行为严重威胁乘客人身安全,同时影响乘车体验。如....
发表于 10-30 16:43 159次 阅读
ZLG M1808 AI核心板提供嵌入式+AI的司机行为检测方案

IDC发布2021年及未来全球IT行业的十个预测

日前,国际数据公司(IDC)于公布了其对2021年及未来全球信息技术(IT)行业的预测。预测详细内容....
的头像 如意 发表于 10-30 16:37 165次 阅读
IDC发布2021年及未来全球IT行业的十个预测

AI的十大应用场景,已深度融入北京百姓的生产和生活

全面开放的自动驾驶出租车服务,覆盖京津冀85%交通场景的封闭测试基地,集智慧和绿色于一身的国家级“绿....
的头像 如意 发表于 10-30 16:29 123次 阅读
AI的十大应用场景,已深度融入北京百姓的生产和生活

机器学习技术正面临怎样的挑战?

在他们的研究中,研究人员根据三种不同的课程,给这些机器人一些从简单到极具挑战性的任务。第一种方法不涉....
的头像 我快闭嘴 发表于 10-30 16:16 129次 阅读
机器学习技术正面临怎样的挑战?

阿里云为数字农场推出独特的AI养羊技术

榆林现代农业科技示范区位于榆林市榆阳区。马铃薯、榆阳湖羊是榆阳区的两大规模产业,但急需提升种植和养殖....
的头像 lhl545545 发表于 10-30 16:12 452次 阅读
阿里云为数字农场推出独特的AI养羊技术

围绕人工智能进行的一切各类宣传炒作都是值得的

如今,据大多数研究公司预测,人工智能将在不远的未来发挥越来越重要的作用,因此,以人工智能为核心的各类....
的头像 如意 发表于 10-30 15:50 162次 阅读
围绕人工智能进行的一切各类宣传炒作都是值得的

AI概论:(Part_C)AI是如何学习的(教程)

任务十四:从连连看出发 目标: 1. 前面说明了,许多人认为,在AI领域里的天字第1号术语是:特....
发表于 10-30 15:37 9次 阅读
AI概论:(Part_C)AI是如何学习的(教程)

AI、机器学习如何从物联网设备提取信息?

过去几年,围绕物联网的大部分讨论都集中在连网设备本身——它们是什么、有多少以及如何保护它们。
的头像 如意 发表于 10-30 15:28 96次 阅读
AI、机器学习如何从物联网设备提取信息?

AMD RX 6000系列显卡首次支持硬件光线追踪

AMD昨日晚间发布的RX 6000系列显卡可以说超出了几乎所有人的预料,性能、能效表现几乎无可挑剔,....
的头像 牵手一起梦 发表于 10-30 15:25 167次 阅读
AMD RX 6000系列显卡首次支持硬件光线追踪

【AI学习】AI概论:(Part-C)AI(机器)是如何学习呢?

任务十四:从连连看出发 目标: 1. 前面说明了,许多人认为,在AI领域里的天字第1号术语是:特征(Feature)。 2. 在本任务里...
发表于 10-30 15:24 0次 阅读
【AI学习】AI概论:(Part-C)AI(机器)是如何学习呢?

打造自动驾驶控制系统需要多少个神经元?

打造一个自动驾驶控制系统需要多少个神经元?MIT的科学家告诉你,最少只要19个!方法是向线虫这种初等....
的头像 如意 发表于 10-30 15:20 138次 阅读
打造自动驾驶控制系统需要多少个神经元?

海康威视为何大涨

10月26日,海康威视股价拉升,一度涨停,市值最高突破4000亿元。截至收盘,海康威视报收每股42.....
的头像 旺材芯片 发表于 10-30 15:15 151次 阅读
海康威视为何大涨

基于光的量子属性的拓扑态

光的量子属性首先体现在分立的能量值上。其本征态被称为福克(Fock)态,能量为(n+1/2)hν,其....
的头像 知社学术圈 发表于 10-30 14:38 93次 阅读
基于光的量子属性的拓扑态

NVIDIA云端AI领域成突围口,AMD服务器芯片份额高歌猛进

英伟达收购Arm,AMD收购赛灵思。在收购的背后是巨头对于技术的整合与生态链的布局,也折射出对服务器....
的头像 如意 发表于 10-30 14:38 258次 阅读
NVIDIA云端AI领域成突围口,AMD服务器芯片份额高歌猛进

人工智能和机器学习如何提取重要信息

过去几年,围绕物联网的大部分讨论都集中在连网设备本身——它们是什么、有多少以及如何保护它们。
的头像 电子魔法师 发表于 10-30 14:37 168次 阅读
人工智能和机器学习如何提取重要信息

AI概论:(Part_B)AI头脑+机器人行为(教程)

任务九:让AI自动提取特征 目标: • 在前面各任务里,已经引导AI自我学习,能够基于人们所....
发表于 10-30 14:34 29次 阅读
AI概论:(Part_B)AI头脑+机器人行为(教程)

AI安防市场将迎来黄金期,发展驱动力何在?

往年的10月下旬,正是两年一届的北京安博会盛况空前的节点。作为见证中国安防产业发展的见证者,北京安博....
的头像 如意 发表于 10-30 14:22 166次 阅读
AI安防市场将迎来黄金期,发展驱动力何在?

AI概论:(Part_A)与AI智慧交流(教程)

任务一:电脑+AI(让电脑拥有学习能力) 目标:安装Python和TensoRFlow。安装K....
发表于 10-30 14:17 10次 阅读
AI概论:(Part_A)与AI智慧交流(教程)

今年全球在人工智能系统上的支出将超500亿美元

Uber在过去五年里花了25亿美元,但现在离自动驾驶汽车的交付仍很遥远。
的头像 电子魔法师 发表于 10-30 14:00 193次 阅读
今年全球在人工智能系统上的支出将超500亿美元

AI与医疗结合,助力肿瘤与最佳药物组合相匹配成为可能

医疗技术的发展离不开前沿科技的支持,时下,人工智能也越来越多参与医学的研究与医药的研发。比如,疫情期....
的头像 如意 发表于 10-30 11:31 115次 阅读
AI与医疗结合,助力肿瘤与最佳药物组合相匹配成为可能

AI+医疗,设计癌症联合疗法

医疗技术的发展离不开前沿科技的支持,时下,人工智能也越来越多参与医学的研究与医药的研发。比如,疫情期....
的头像 工程师邓生 发表于 10-30 11:30 75次 阅读
AI+医疗,设计癌症联合疗法

智能传感器行业迎来爆发的新机遇

众所周知,智能制造、智慧工厂离不开智能物流系统,如果没有智能的物流系统来支撑或者是配合,智能制造将难....
的头像 我快闭嘴 发表于 10-30 11:22 157次 阅读
智能传感器行业迎来爆发的新机遇

两大巨头合作推定制智能语音解决方案,加速行业智能化进程

10月29日,首汽约车与亚马逊云服务Amazon Web Services, Inc. (AWS)联....
的头像 如意 发表于 10-30 11:11 126次 阅读
两大巨头合作推定制智能语音解决方案,加速行业智能化进程

或许,人工智能的年龄比你还要大

如今,据大多数研究公司预测,人工智能将在不远的未来发挥越来越重要的作用,因此,以人工智能为核心的各类....
的头像 电子魔法师 发表于 10-30 10:55 180次 阅读
或许,人工智能的年龄比你还要大

科大讯飞将以技术进步来驱动AI的持续发展

他说:“现在所有的发展都离不开核心技术的持续进步和推动,全球的技术竞争格局,也进一步倒逼在源头创新上....
的头像 电子魔法师 发表于 10-30 10:52 328次 阅读
科大讯飞将以技术进步来驱动AI的持续发展

国内首款具有完全知识产权的车规级AI智能驾驶芯片发布

随着汽车智能化的发展,自动驾驶的每次进化都意味着技术的一次革新。但是,自动驾驶除了取决于算法水平的智....
发表于 10-30 10:48 82次 阅读
国内首款具有完全知识产权的车规级AI智能驾驶芯片发布

以AI为基础的药物研发公司成为最受青睐的投资对象

近日,CB Insights 发布了《医疗健康2020 第三季度投融资状况报告》(State Of ....
的头像 DeepTech深科技 发表于 10-30 10:41 120次 阅读
以AI为基础的药物研发公司成为最受青睐的投资对象

高通用5G+AI驱动产业发展新模式

5G商用以来,高通公司不断深耕产业合作,持续助力5G创新应用向多领域拓展。作为5G浪潮下的体育新趋势....
的头像 lhl545545 发表于 10-30 10:33 80次 阅读
高通用5G+AI驱动产业发展新模式

阿里研发全球首个实时翻译直播

近几年来,直播电商到处开花,但绝大多数都是国内的中文直播。如果想买外国电商主播推荐的商品,语言不通怎....
的头像 DeepTech深科技 发表于 10-30 10:28 285次 阅读
阿里研发全球首个实时翻译直播

传苹果5000万美元收购人工智能视觉公司Vilynx

据彭博社报道,苹果公司今年早些时候以 5000 万美元的价格收购了人工智能和视觉初创公司 Vilyn....
的头像 DeepTech深科技 发表于 10-30 10:24 420次 阅读
传苹果5000万美元收购人工智能视觉公司Vilynx

11位作家发起人机联合写作实验

10 月 27 日,由传茂文化和创新工场共同打造,11 位作家首次发起的汉语科幻小说人机联合写作实验....
的头像 DeepTech深科技 发表于 10-30 10:21 84次 阅读
11位作家发起人机联合写作实验

人工智能和机器学习技术能为威胁检测做什么?

最近的一项研究表明,超过90%的安全操作中心正在实施或考虑使用人工智能和机器学习来检测和防御数字威胁....
的头像 我快闭嘴 发表于 10-30 10:18 242次 阅读
人工智能和机器学习技术能为威胁检测做什么?

做芯片要软硬结合

2016 年,第一颗基于可重构计算的人工智能芯片诞生于清华。该成果曾发表在《IEEE 固态电路期刊》....
的头像 DeepTech深科技 发表于 10-30 10:11 133次 阅读
做芯片要软硬结合

走进良渚博物院,5G AR/VR带你一“眼”游千年

在5G浙江省内正式商用当天,中国移动浙江公司与良渚遗址管理区管理委员会联合发布“双5计划”,即利用5....
的头像 lhl545545 发表于 10-30 10:00 162次 阅读
走进良渚博物院,5G AR/VR带你一“眼”游千年

让人工智能模型获得人类的联想能力

一种新的方法正在让人工智能模型获得人类的 联想 能力,甚至能让它识别此前从未见过的事物。 来自加拿大....
的头像 DeepTech深科技 发表于 10-30 09:54 128次 阅读
让人工智能模型获得人类的联想能力

中国联通实现5G无线与固线双接入备份

为了更好实现5G 智选专线功能,全方位满足客户接入需求,在领航者1号产品的基础上增加网管平台接口定制....
的头像 lhl545545 发表于 10-30 09:44 207次 阅读
中国联通实现5G无线与固线双接入备份

机器学习如何解决芯片设计中的NP-hard的问题?

EDA 中的大部分设计问题都属于 NP-hard 问题,由于不存在解决这些问题的多项式时间算法,因此无法通过分析确定最优解决方案...
发表于 09-03 01:15 809次 阅读
机器学习如何解决芯片设计中的NP-hard的问题?

关于机器学习的日志

机器学习日志
发表于 07-08 12:54 119次 阅读
关于机器学习的日志

机器学习小白的总结

机器学习小白第一周自我总结
发表于 07-08 08:27 133次 阅读
机器学习小白的总结

机器学习之周志华完整版

链接: 提取码:2ja8
发表于 06-28 18:46 728次 阅读
机器学习之周志华完整版

吴恩达机器学习之Coursera-week

吴恩达机器学习Coursera-week10
发表于 06-19 11:22 1882次 阅读
吴恩达机器学习之Coursera-week

机器学习笔记之BP推导

机器学习笔记:BP推导
发表于 06-15 17:11 187次 阅读
机器学习笔记之BP推导

斯坦福机器学习公开课笔记之单变量线性回归

斯坦福机器学习公开课笔记 一 --单变量线性回归...
发表于 06-11 13:53 1669次 阅读
斯坦福机器学习公开课笔记之单变量线性回归

机器学习的资源分享

机器学习资源分享
发表于 06-09 16:31 83次 阅读
机器学习的资源分享

机器学习算法分享

机器学习算法(1)——Logistic Regression
发表于 06-09 13:30 78次 阅读
机器学习算法分享