0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

携手 MLCommons,制定有效且值得信赖的 AI 安全基准

谷歌开发者 来源:未知 2023-12-05 18:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / 技术与社会部 Anoop Sinha 以及 Google Research、Responsible AI 和以人为本技术团队 Marian Croak


标准基准是衡量重要产品质量的公认方法,存在于许多领域。一些标准基准用于衡量安全性:例如,当汽车制造商宣传 "整体安全评分五星" 时,会引用某项基准。机器学习 (ML) 和 AI 技术领域已经存在标准基准:例如,MLCommons Association 运用 MLPerf 基准,来衡量如 Google 的 TPU 等尖端 AI 硬件的速度。然而,尽管围绕 AI 安全已经做了大量工作,目前仍然没有类似的 AI 安全标准基准。


  • MLCommons

    https://mlcommons.org/en/

  • MLPerf

    https://mlcommons.org/en/news/mlperf-inference-storage-q323/

  • AI 安全

    https://blog.google/technology/ai/our-responsible-approach-to-building-guardrails-for-generative-ai/


我们很高兴能够为非营利组织 MLCommons Association 开展标准 AI 安全基准制定的工作提供支持。制定有效且值得信赖的基准,不仅要有先进的 AI 安全测试技术,还需要综合广泛的观点。MLCommons 的工作旨在汇集学术界和业界的专家研究人员来制定衡量 AI 系统安全性的标准基准,并以每个人都能理解的分数呈现。我们鼓励社区的所有成员 (从 AI 研究人员到政策专家)加入我们,为这项工作奉献自己的力量。


  • 加入我们

    https://mlcommons.org/ai-safety



为什么要制定 AI 安全基准?


像大多数先进技术一样,AI 具有带来巨大好处的潜力,但是如果缺乏适当的约束,也可能会导致负面结果。例如,AI 技术可以在各种活动中辅助人类提高生产力 (如提高健康诊断的准确性和研究疾病、分析能源使用情况等)。然而,如果没有足够的预防措施,AI 也可能被用来支持有害或恶意活动,并导致存在偏见或令人反感的响应。

  • 改善健康诊断
    https://blog.google/technology/health/how-ai-can-improve-health-for-everyone-everywhere/
  • 能源使用情况
    https://blog.google/outreach-initiatives/sustainability/google-transportation-energy-emissions-reduction/

通过为不同类别提供标准的安全措施,如有害使用、超范围响应、AI 控制风险等,标准的 AI 安全基准可以帮助社会从 AI 中获益,同时确保采取足够的预防措施来减轻这些风险。最初,新兴的安全基准有助于推动 AI 安全研究,并为负责任的 AI 开发提供信息。随着时间推移和技术成熟,这些基准也可以为 AI 系统的用户和购买者提供信息,最终,可能成为政策制定者的宝贵工具。


在计算机硬件领域,基准 (如 SPECTPC) 现已展现出惊人的能力,让整个行业能够在追求进步的过程中,保持研究、工程甚至营销部门的步调一致。我们相信,标准 AI 安全基准有助于在这一重要领域实现同样的目标。


  • SPEC
    https://en.wikipedia.org/wiki/Standard_Performance_Evaluation_Corporation
  • TPC
    https://en.wikipedia.org/wiki/Transaction_Processing_Performance_Council


标准 AI 安全基准是什么?


在学术研究和企业工作中,人们开展了一系列 AI 安全测试 (如 RealToxicityPromptsStanford HELM 公平性、偏差、毒性测量以及 Google 的生成式 AI 指引)。但是,大多数测试都侧重于为 AI 系统提供提示,并对输出进行算法评分,虽然这是一个有用的开端,但仅限于测试提示的范围。此外,他们通常使用开放数据集进行提示和响应,而这些提示和响应可能已被 (通常是无意中) 纳入训练数据中。


  • RealToxicityPrompts
    https://arxiv.org/abs/2009.11462
  • Stanford HELM
    https://crfm.stanford.edu/2022/11/17/helm.html
  • Google 的生成式 AI 指引
    https://blog.google/technology/ai/our-responsible-approach-to-building-guardrails-for-generative-ai/

MLCommons 提议,按多方利益相关者流程选择测试,并按子集分组,以衡量特定 AI 用例的安全性,并将这些需要有专业技术背景才能理解的测试结果转化为每个人都能理解的分数。MLCommons 建议打造一个集中现有测试的平台,并鼓励开展更严格的测试,以推动先进技术的发展。用户既可以通过在线测试生成和查看分数,也可以借助私人测试引擎的离线测试来访问这些测试。


共同努力下的 AI 安全基准


负责任的 AI 开发者使用多种安全措施,包括自动测试、手动测试、红队测试 (red teaming,其中人类测试人员试图产生对抗性结果)、软件方面的限制、数据和模型最佳实践以及审计。但是,确定是否已采取足够的预防措施可能具有挑战性,尤其是在开发 AI 系统的公司群体不断发展且具有多元化特点的情况下。标准 AI 基准能够提供强大的工具,帮助供应商和用户衡量 AI 安全性,以及鼓励资源生态系统和专注于提高 AI 安全性的专业提供商,推进社区以负责任的方式发展。


同时,如果没有社区参与,就无法制定成熟、有效且值得信赖的 AI 安全基准。这项工作需要研究人员和工程师齐心协力,为安全测试技术提供创新且实用的改进,使测试更加严格高效。同样,企业也需要团结一致,提供测试数据、工程支持和经济支持。AI 安全的某些方面可能具有主观性,要建立得到广泛共识支持的可信基准需要考虑多方观点,包括公众代言人、政策制定者、学者、工程师、数据工作者、商界领袖和企业家的观点。



Google 对 MLCommons 的支持


Google 以 2018 年宣布AI 准则为基础,致力于以安全、可靠和值得信赖的特定标准开发和使用 AI (您可以参阅我们 2019 年2020 年2021 年2022 年的更新)。我们还在关键承诺方面取得了重大进展,这将帮助您大胆且负责任地开发 AI,从而造福所有人。


  • 宣布
    https://blog.google/technology/ai/ai-principles/
  • AI 准则
    https://ai.google/responsibility/principles/
  • 2019 年
    https://ai.google/static/documents/ai-principles-2019-progress-update.pdf
  • 2020 年
    https://ai.google/static/documents/ai-principles-2020-progress-update.pdf
  • 2021 年
    https://ai.google/static/documents/ai-principles-2021-progress-update.pdf
  • 2022 年
    https://ai.google/static/documents/ai-principles-2022-progress-update.pdf
  • 进展
    https://static.googleusercontent.com/media/publicpolicy.google/en//resources/whcommitments.pdf

Google 正在以多种方式支持 MLCommons Association 在制定 AI 安全基准方面所作的工作。

  1. 测试平台:我们联合其他公司提供资金,支持测试平台的开发。
  2. 技术专长和资源:我们不断提供技术专长和资源,例如 Monk 肤色示例数据集,以帮助确保基准设计优良且有效。
  3. 数据集:我们正在为多语言表征偏差以及针对刻板印象危害 (如 SeeGULL 和 SPICE) 的外部测试提供内部数据集。此外,我们还共享以负责任和包容性的方式收集人工注释为重点的数据集,如 DICESSRP

  • Monk 肤色量表示例数据集
    https://skintone.google/mste-dataset
  • SPICE
    https://github.com/google-research-datasets/SPICE/tree/main
  • DICES
    https://arxiv.org/abs/2306.11247
  • SRP
    https://www.kaggle.com/datasets/google/jigsaw-specialized-rater-pools-dataset


未来方向


我们相信,这些基准有助于推进 AI 安全研究,确保以负责任的方式开发和部署 AI 系统。AI 安全属于集体行动问题前沿模型论坛 (Frontier Model Forum) 和 AI 伙伴关系 (Partnership on AI) 等团体也在重要的标准化举措方面发挥着领导作用。我们很高兴从一开始便与这些团体和 MLCommons 一起开展这项工作,也期待通过更多的共同努力,来促进以负责任的方式开发新的生成式 AI 工具。欢迎您持续关注我们,及时获悉更多资讯。


  • 集体行动问题
    https://blog.google/technology/ai/a-shared-agenda-for-responsible-ai-progress/
  • 前沿模型论坛
    https://blog.google/outreach-initiatives/public-policy/google-microsoft-openai-anthropic-frontier-model-forum/
  • AI 伙伴关系
    https://partnershiponai.org/


致谢


非常感谢为这项工作做出贡献的 Google 团队成员: Peter Mattson、Lora Aroyo、Chris Welty、Kathy Meier-Hellstern、Parker Barnes、Tulsee Doshi、Manvinder Singh、Brian Goldman、Nitesh Goyal、Alice Friend、Nicole Delange、Kerry Barker、Madeleine Elish、Shruti Sheth、Dawn Bloxwich、William Isaac、Christina Butterfield。





原文标题:携手 MLCommons,制定有效且值得信赖的 AI 安全基准

文章出处:【微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6259

    浏览量

    111979

原文标题:携手 MLCommons,制定有效且值得信赖的 AI 安全基准

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    贸泽EIT系列新一期,探索AI如何重塑日常科技与用户体验

    AI在消费类和联网设备中的普及,工程师们不断设计出新的系统,使这些技术在实际应用中更加实用、直观值得信赖。 贸泽电
    的头像 发表于 04-21 10:28 186次阅读
    贸泽EIT系列新一期,探索<b class='flag-5'>AI</b>如何重塑日常科技与用户体验

    AI辅助编程设计之道:从Spec到Code工程实践

    大语言模型正在重塑软件开发的日常。从Copilot到各种编程助手,AI生成代码的能力已经渗透到许多开发者的工作流中。但在实际应用中,一个现象值得注意:不少团队在使用AI编程时,陷入了“需求描述-代码
    发表于 03-16 13:33

    如何评估忆联Gen5 eSSD UH812a在AI场景中的性能表现

    随着AI大模型进入万亿参数时代,传统存储性能测试已难以真实反映存储系统在实际训练场景中对成本与效率的核心影响。为此,全球权威AI基准测评组织MLCommons正式推出MLPerf St
    的头像 发表于 02-05 09:56 1418次阅读
    如何评估忆联Gen5 eSSD UH812a在<b class='flag-5'>AI</b>场景中的性能表现

    应对车辆AI安全性挑战,ISO/PAS 8800标准深度拆解

    为确保道路车辆中AI系统的安全性,国际标准化组织以ISO 26262与ISO 21448为基础,并参考ISO/IEC TR 5469,制定了ISO/PAS 8800道路车辆人工智能安全
    的头像 发表于 02-02 16:01 369次阅读
    应对车辆<b class='flag-5'>AI</b><b class='flag-5'>安全</b>性挑战,ISO/PAS 8800标准深度拆解

    借助拼多多API,轻松分析竞品数据,制定差异化策略!

    ​  引言 在竞争激烈的电商环境中,及时了解竞品动态、分析市场格局是制定有效营销策略的关键。手动收集数据不仅效率低下,还容易遗漏关键信息。拼多多开放平台提供的API接口,为我们自动化获取和分析竞品数
    的头像 发表于 12-15 15:20 1046次阅读
    借助拼多多API,轻松分析竞品数据,<b class='flag-5'>制定</b>差异化策略!

    携手共创AI新时代,安谋科技“AI Arm CHINA”战略驱动半导体生态重构

      2025年12月2日,SIIAS香港首届国际半导体峰会隆重召开,安谋科技CEO陈锋以《Together! Empower the AI New Era!》(“携手共进,共创AI未来”)为题发表
    的头像 发表于 12-05 17:44 1272次阅读
    <b class='flag-5'>携手</b>共创<b class='flag-5'>AI</b>新时代,安谋科技“<b class='flag-5'>AI</b> Arm CHINA”战略驱动半导体生态重构

    大华股份荣获福布斯韩国最值得客户信赖的品牌大奖

    近日,大华股份斩获福布斯韩国“最值得客户信赖的品牌——影像保安部门大奖”。作为韩国市场极具公信力的行业标杆奖项,此次殊荣不仅是对大华股份深耕韩国市场、坚持技术创新与服务深耕的高度认可,更是对大华技术硬实力与品牌影响力的权威认证。
    的头像 发表于 11-26 16:28 672次阅读

    关于“实时基准对比测量”与AI再探讨

    qqxjyxjy清风:关于“实时基准对比测量”我还想多问一句。 AI: 已深度思考(用时 14 秒) AI: 好的,用户之前详细讨论了用实时基准对比测量来解决ADA8330增益不确定的
    的头像 发表于 10-14 17:39 653次阅读

    vivo携手Google Cloud推动智能手机迈入AI新时代

    在人们期待更智能、更前瞻手机的时代,vivo 携手 Google Cloud,迅速推出更安全、更前沿的 AI 功能,共同加速创新,推动智能手机迈入智能、无缝、以人为本的 AI 新时代。
    的头像 发表于 09-23 16:54 1709次阅读

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    任务。这套系统为艺术市场、教育行业和内容平台提供了一种实用的工具,有效应对AI生成内容带来的挑战。虽然有些识别会出错,但是还是值得继续优化以及探讨方案的可行性。
    发表于 08-21 13:59

    DXC与7AI携手推出革命性的AI驱动安全运营服务

    基于智能体的新型安全服务通过自主AI智能体降低运营成本,同时加快响应并扩大覆盖范围 2025年,7AI平台已为各安全团队节省22.4万个分析师工时——相当于约112位分析师全年工作量,
    的头像 发表于 08-05 09:30 2933次阅读

    货架倾斜监测:保障仓储安全的关键

    在货架倾斜监测方面,选择合适高品质的无线倾角传感器至关重要,而直川科技的无线倾角传感器凭借其卓越的性能和优势,无疑是众多仓储企业值得信赖的选择,为仓储安全保驾护航,助力现代物流仓储行
    的头像 发表于 07-04 14:36 691次阅读
    货架倾斜监测:保障仓储<b class='flag-5'>安全</b>的关键

    新思科技携手微软借助AI技术加速芯片设计

    近日,微软Build大会在西雅图盛大开幕,聚焦AI在加速各行业(包括芯片设计行业)科学突破方面的变革潜力。作为Microsoft Discovery平台发布的启动合作伙伴,新思科技亮相本次大会,并携手微软将AI融入芯片设计,开发
    的头像 发表于 06-27 10:23 1276次阅读

    威盛电子推出天车安全AI监控方案

    近日,威盛电子宣布推出”威盛天车安全AI监控方案”。该方案基于自主研发的AI技术,集成行人姿态识别、精准防撞预警和智能分区警示等功能,大幅提升桥式起重机(天车)的安全管理效率。目前,该
    的头像 发表于 05-21 13:55 968次阅读

    直播预告 | @5/22 以英飞凌安全芯片为基础,打造可信任的 AI 应用架构

    AI技术快速发展,但数据隐私与系统安全成为企业面临的重大挑战。如何确保数据安全、算法可信与设备完整性,是迈向AI化的关键。大联大品佳集团携手
    的头像 发表于 05-14 14:43 766次阅读
    直播预告 | @5/22 以英飞凌<b class='flag-5'>安全</b>芯片为基础,打造可信任的 <b class='flag-5'>AI</b> 应用架构