0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI越来越推广普及,我们需注意机器模型中不断涌现的人类偏见

如意 来源:360机房 作者:Harris 2020-09-24 14:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着人工智能在企业和社会的应用变得越来越普遍,企业需要注意机器模型中不断涌现的人类偏见。企业可以利用人类的智慧来获取训练算法所需的各种数据和输入。

有一些方法可以避免数据集中的偏差。

在训练人工智能(AI)算法时,取决于数据的输入。在业务环境中尤其如此,在这种情况下,人工智能的目的可能是与客户互动,管理自动化系统或模仿人工决策。成果与目标相符至关重要。但是,至关重要的是,企业必须能够解决任何可能歪曲人工智能对指令或请求的响应方式的偏见。

任何新产品的设计和开发阶段都是至关重要的,因为它使企业可以运行测试、识别并消除任何缺陷。如果由于某种原因而忽略了设计缺陷或产品出现故障,则可以快速解决。可以召回有故障的设备,同时可以发布更新和补丁来修复任何软件问题。对于典型的软件版本而言,这一切都很好,但是处理人工智能算法并不是那么简单。

人工智能算法是高度复杂的系统,旨在基于机器学习(ML)执行非常具体的任务。试图消除人工智能投入运行后所产生的任何数量的偏差可能既昂贵又费时;对于“学习”的技术而言,这也违反直觉。在设计和开发阶段采用适当的流程来检测并消除偏差会更加有效。

偏见对企业不利

人工智能的基本目的和功能被引入其基础算法中。如果人工智能要发展出固有的偏差,它将对算法产生不利影响。这可能会严重影响人工智能预期提供的精度和效率,从而限制人工智能满足其商业需求的能力,所有这些都对业务不利。

尽管有开发人员的最佳意图,偏见总能找到一种渗透人工智能算法的方法。与任何学习过程一样,学生也会受到其老师的影响。认可机构的教育范围取决于其课程设置。毫不奇怪,课程越多样化,学生越开明。同样,更大、更多样化的数据集有助于产生更精确、更高效的人工智能算法,从而能够做出更明智的决策。

培训数据和测试结果

每个成功的人工智能算法都建立在训练数据的基础上。但是,采购满足业务要求的数据可能会给物流和间接费用带来巨大挑战,尤其是如果这些要求包括满足大众市场的需求时。

内部开发人员团队,软件工程师和质量保证专家通常来自相同的年龄范围,性别和背景。偏差经常发生在数据收集和数据标记过程中。因此,在构建人工智能算法时,最好不要依赖某一个人或一个小组来提供将用于训练算法的数据。为了正确地训练算法,需要不同类型的数据和输入。

使用为人工智能算法提供与最终服务的客户更接近的人员和体验的暴露能力的模型,将会更有效率。企业可以使用这一模型来训练他们的算法,以响应现实情况,检测出偏差发生的地方并减少其潜在影响。

社区构建的算法

培训数据的成功获取和实施取决于数据本身的数量、质量和多样性。企业获取和处理此数据的唯一方法是利用多样化的参与者。企业需要能够从向其提供特定人口统计信息的社区中进行选择,包括性别、种族、母语、位置、技能、地理位置以及其他适用的过滤条件。

实际上,开发有效的算法需要大量数据。大多数企业没有能力大规模地获取数据。他们需要专用资源的支持才能交付新的软件和服务。最近的一个培训用于媒体和广播服务的智能语音助手的项目需要超过10万种不同的语音。这些话语最终由972个人提供,这些人被远程组装以训练算法。令人难以置信的壮举是,尽管可以在实验室中对语音进行某种程度的模拟,但人工智能仍然需要暴露于各种真实的声音和口音中。

言语训练只是教学大纲的一方面。众包解决方案还可以帮助企业训练人工智能算法以读取手写文档。最近的另一个项目需要数千个手写样本。数量再次成为关键因素,因为该算法需要尽可能广泛的唯一样本。远程聚集了1,000多名参与者,以提供手写文档并满足对各种内容的需求。

公正的结果

删除可能会降低人工智能最终结果准确性的意外偏差很重要。它将永远不会是完美的,但是人工智能会不断学习,并且最好的机器模型是基于大量多样数据集的模型。最好的策略是从提供数量、质量和多样性的池中获取培训数据。如果训练数据没有多样性,该算法将无法识别广泛的可能性,从而使该算法无效。远程社区使企业可以访问此数据,并补充内部开发和测试功能。众包测试可用于训练人工智能算法以研究和识别语音、文本、图像和生物识别,从而为企业提供强大的输出,可满足不同客户群的需求。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296443
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51705
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136227
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    复制人类智能的AI---AGI。 走向AGI的五个层次发现阶段: ①L1,聊天机器人:具备基础的对话能力,能够理解和回应简单的文本输入 ②L2,推理者:具备基本的逻辑推理能力,能够分析复杂信息并进行推断
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    载体,关键是能在能量载体的特征长度范围内操纵传输特性。 AI发挥的作用越来越大了,会有替代人类的一天吗?
    发表于 09-17 11:45

    AI输出“偏见”,人类能否信任它的“三观”?

    人工智能(AI)已成为我们不可分割的“伙伴”。从聊天机器人、语音助手到自动翻译,AI不断介入人与人之间的交流和理解。然而,它能做到“客观中立
    的头像 发表于 08-04 13:43 1181次阅读
    <b class='flag-5'>AI</b>输出“<b class='flag-5'>偏见</b>”,<b class='flag-5'>人类</b>能否信任它的“三观”?

    AI的未来,属于那些既能写代码,又能焊电路的“双栖人才”

    的信号:AI真正的未来,不只属于“算法天才”,更属于那些既能写代码,又能焊电路的“双栖工程师”。无论是在AI芯片、智能终端、机器人、边缘计算还是大模型下沉的讨论
    发表于 07-30 16:15

    后摩尔时代:芯片不是越来越凉,而是越来越

    在智能手机、笔记本电脑、服务器,尤其是AI加速器芯片上,我们正在见证一个时代性的趋势:计算力不断攀升,芯片的热也随之“失控”。NVIDIA的Blackwell架构GPU芯片,整卡TDP功耗超过
    的头像 发表于 07-12 11:19 1170次阅读
    后摩尔时代:芯片不是<b class='flag-5'>越来越</b>凉,而是<b class='flag-5'>越来越</b>烫

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    教育等领域发挥着越来越重要的作用。​针对日前前来咨询的广大客户对面向大模型智能硬件的学习需求,我们根据CSK6大模型语音视觉开发板已有功能,整理了一份适合基于本开发板进行教学活动的学习
    发表于 07-04 11:10

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    很高兴又有机会学习ai技术,这次试读的是「零基础开发AI Agent」,作者叶涛、管锴、张心雨。 大模型普及是近三年来的一件大事,万物皆可大模型
    发表于 05-02 09:26

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    AI的演进正在逼近“终端智能涌现”的拐点,从通用模型向场景落地迁移成为关键议题。联发科以“AI随芯,应用无界”为主题召开天玑开发者大会2025(MDDC 2025),不仅聚合了全球生态
    发表于 04-13 19:52

    当我问DeepSeek:为什么传感器技术越来越重要

    为什么传感器技术越来越重要 我们一起来看看     DeepSeek是怎么说的 为什么传感器技术越来越重要?   传感器:数字世界的感官
    的头像 发表于 03-01 15:58 672次阅读

    AI Agent 应用与项目实战》阅读心得2——客服机器人、AutoGen框架 、生成式代理

    ,斯坦福小镇是一个非常有有意思的项目。生成式智能体作为AI领域的革命性突破,向我们揭示了计算机模拟人类行为的无限可能。凭借其创新的技术架构与精密的算法设计,这些智能体能够在虚拟环境
    发表于 02-25 21:59

    智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    AI 技术日新月异的当下,新的模型与突破不断涌现。近期,DeepSeek(深度求索)模型以其卓越性能和亲民成本,迅速在全球开发者圈子里引发热议。作为一款强大的语言
    发表于 02-14 17:42

    科大讯飞推出大模型极速超拟人交互软硬件方案

    随着大模型技术的不断发展,大模型的应用越来越受到行业的重视。如何在智能硬件的语音交互上快速应用和普及
    的头像 发表于 01-16 11:07 1203次阅读

    企业AI模型托管怎么做的

    当下,越来越多的企业选择将AI模型托管给专业的第三方平台,以实现高效、灵活和安全的模型运行。下面,AI部落小编为您介绍企业
    的头像 发表于 01-15 10:10 724次阅读

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    的应用。MAML算法通过二阶优化找到对任务变化敏感的模型参数,实现了快速适应。上下文学习则引入了注意力机制,使模型能够根据当前场景动态调整行为策略。在预训练-微调范式
    发表于 12-24 15:03

    企业AI模型部署攻略

    当下,越来越多的企业开始探索和实施AI模型,以提升业务效率和竞争力。然而,AI模型的部署并非易事,需要企业在多个层面进行细致的规划和准备。下
    的头像 发表于 12-23 10:31 1290次阅读