0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

携手 MLCommons,制定有效且值得信赖的 AI 安全基准

谷歌开发者 来源:未知 2023-12-05 18:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / 技术与社会部 Anoop Sinha 以及 Google Research、Responsible AI 和以人为本技术团队 Marian Croak


标准基准是衡量重要产品质量的公认方法,存在于许多领域。一些标准基准用于衡量安全性:例如,当汽车制造商宣传 "整体安全评分五星" 时,会引用某项基准。机器学习 (ML) 和 AI 技术领域已经存在标准基准:例如,MLCommons Association 运用 MLPerf 基准,来衡量如 Google 的 TPU 等尖端 AI 硬件的速度。然而,尽管围绕 AI 安全已经做了大量工作,目前仍然没有类似的 AI 安全标准基准。


  • MLCommons

    https://mlcommons.org/en/

  • MLPerf

    https://mlcommons.org/en/news/mlperf-inference-storage-q323/

  • AI 安全

    https://blog.google/technology/ai/our-responsible-approach-to-building-guardrails-for-generative-ai/


我们很高兴能够为非营利组织 MLCommons Association 开展标准 AI 安全基准制定的工作提供支持。制定有效且值得信赖的基准,不仅要有先进的 AI 安全测试技术,还需要综合广泛的观点。MLCommons 的工作旨在汇集学术界和业界的专家研究人员来制定衡量 AI 系统安全性的标准基准,并以每个人都能理解的分数呈现。我们鼓励社区的所有成员 (从 AI 研究人员到政策专家)加入我们,为这项工作奉献自己的力量。


  • 加入我们

    https://mlcommons.org/ai-safety



为什么要制定 AI 安全基准?


像大多数先进技术一样,AI 具有带来巨大好处的潜力,但是如果缺乏适当的约束,也可能会导致负面结果。例如,AI 技术可以在各种活动中辅助人类提高生产力 (如提高健康诊断的准确性和研究疾病、分析能源使用情况等)。然而,如果没有足够的预防措施,AI 也可能被用来支持有害或恶意活动,并导致存在偏见或令人反感的响应。

  • 改善健康诊断
    https://blog.google/technology/health/how-ai-can-improve-health-for-everyone-everywhere/
  • 能源使用情况
    https://blog.google/outreach-initiatives/sustainability/google-transportation-energy-emissions-reduction/

通过为不同类别提供标准的安全措施,如有害使用、超范围响应、AI 控制风险等,标准的 AI 安全基准可以帮助社会从 AI 中获益,同时确保采取足够的预防措施来减轻这些风险。最初,新兴的安全基准有助于推动 AI 安全研究,并为负责任的 AI 开发提供信息。随着时间推移和技术成熟,这些基准也可以为 AI 系统的用户和购买者提供信息,最终,可能成为政策制定者的宝贵工具。


在计算机硬件领域,基准 (如 SPECTPC) 现已展现出惊人的能力,让整个行业能够在追求进步的过程中,保持研究、工程甚至营销部门的步调一致。我们相信,标准 AI 安全基准有助于在这一重要领域实现同样的目标。


  • SPEC
    https://en.wikipedia.org/wiki/Standard_Performance_Evaluation_Corporation
  • TPC
    https://en.wikipedia.org/wiki/Transaction_Processing_Performance_Council


标准 AI 安全基准是什么?


在学术研究和企业工作中,人们开展了一系列 AI 安全测试 (如 RealToxicityPromptsStanford HELM 公平性、偏差、毒性测量以及 Google 的生成式 AI 指引)。但是,大多数测试都侧重于为 AI 系统提供提示,并对输出进行算法评分,虽然这是一个有用的开端,但仅限于测试提示的范围。此外,他们通常使用开放数据集进行提示和响应,而这些提示和响应可能已被 (通常是无意中) 纳入训练数据中。


  • RealToxicityPrompts
    https://arxiv.org/abs/2009.11462
  • Stanford HELM
    https://crfm.stanford.edu/2022/11/17/helm.html
  • Google 的生成式 AI 指引
    https://blog.google/technology/ai/our-responsible-approach-to-building-guardrails-for-generative-ai/

MLCommons 提议,按多方利益相关者流程选择测试,并按子集分组,以衡量特定 AI 用例的安全性,并将这些需要有专业技术背景才能理解的测试结果转化为每个人都能理解的分数。MLCommons 建议打造一个集中现有测试的平台,并鼓励开展更严格的测试,以推动先进技术的发展。用户既可以通过在线测试生成和查看分数,也可以借助私人测试引擎的离线测试来访问这些测试。


共同努力下的 AI 安全基准


负责任的 AI 开发者使用多种安全措施,包括自动测试、手动测试、红队测试 (red teaming,其中人类测试人员试图产生对抗性结果)、软件方面的限制、数据和模型最佳实践以及审计。但是,确定是否已采取足够的预防措施可能具有挑战性,尤其是在开发 AI 系统的公司群体不断发展且具有多元化特点的情况下。标准 AI 基准能够提供强大的工具,帮助供应商和用户衡量 AI 安全性,以及鼓励资源生态系统和专注于提高 AI 安全性的专业提供商,推进社区以负责任的方式发展。


同时,如果没有社区参与,就无法制定成熟、有效且值得信赖的 AI 安全基准。这项工作需要研究人员和工程师齐心协力,为安全测试技术提供创新且实用的改进,使测试更加严格高效。同样,企业也需要团结一致,提供测试数据、工程支持和经济支持。AI 安全的某些方面可能具有主观性,要建立得到广泛共识支持的可信基准需要考虑多方观点,包括公众代言人、政策制定者、学者、工程师、数据工作者、商界领袖和企业家的观点。



Google 对 MLCommons 的支持


Google 以 2018 年宣布AI 准则为基础,致力于以安全、可靠和值得信赖的特定标准开发和使用 AI (您可以参阅我们 2019 年2020 年2021 年2022 年的更新)。我们还在关键承诺方面取得了重大进展,这将帮助您大胆且负责任地开发 AI,从而造福所有人。


  • 宣布
    https://blog.google/technology/ai/ai-principles/
  • AI 准则
    https://ai.google/responsibility/principles/
  • 2019 年
    https://ai.google/static/documents/ai-principles-2019-progress-update.pdf
  • 2020 年
    https://ai.google/static/documents/ai-principles-2020-progress-update.pdf
  • 2021 年
    https://ai.google/static/documents/ai-principles-2021-progress-update.pdf
  • 2022 年
    https://ai.google/static/documents/ai-principles-2022-progress-update.pdf
  • 进展
    https://static.googleusercontent.com/media/publicpolicy.google/en//resources/whcommitments.pdf

Google 正在以多种方式支持 MLCommons Association 在制定 AI 安全基准方面所作的工作。

  1. 测试平台:我们联合其他公司提供资金,支持测试平台的开发。
  2. 技术专长和资源:我们不断提供技术专长和资源,例如 Monk 肤色示例数据集,以帮助确保基准设计优良且有效。
  3. 数据集:我们正在为多语言表征偏差以及针对刻板印象危害 (如 SeeGULL 和 SPICE) 的外部测试提供内部数据集。此外,我们还共享以负责任和包容性的方式收集人工注释为重点的数据集,如 DICESSRP

  • Monk 肤色量表示例数据集
    https://skintone.google/mste-dataset
  • SPICE
    https://github.com/google-research-datasets/SPICE/tree/main
  • DICES
    https://arxiv.org/abs/2306.11247
  • SRP
    https://www.kaggle.com/datasets/google/jigsaw-specialized-rater-pools-dataset


未来方向


我们相信,这些基准有助于推进 AI 安全研究,确保以负责任的方式开发和部署 AI 系统。AI 安全属于集体行动问题前沿模型论坛 (Frontier Model Forum) 和 AI 伙伴关系 (Partnership on AI) 等团体也在重要的标准化举措方面发挥着领导作用。我们很高兴从一开始便与这些团体和 MLCommons 一起开展这项工作,也期待通过更多的共同努力,来促进以负责任的方式开发新的生成式 AI 工具。欢迎您持续关注我们,及时获悉更多资讯。


  • 集体行动问题
    https://blog.google/technology/ai/a-shared-agenda-for-responsible-ai-progress/
  • 前沿模型论坛
    https://blog.google/outreach-initiatives/public-policy/google-microsoft-openai-anthropic-frontier-model-forum/
  • AI 伙伴关系
    https://partnershiponai.org/


致谢


非常感谢为这项工作做出贡献的 Google 团队成员: Peter Mattson、Lora Aroyo、Chris Welty、Kathy Meier-Hellstern、Parker Barnes、Tulsee Doshi、Manvinder Singh、Brian Goldman、Nitesh Goyal、Alice Friend、Nicole Delange、Kerry Barker、Madeleine Elish、Shruti Sheth、Dawn Bloxwich、William Isaac、Christina Butterfield。





原文标题:携手 MLCommons,制定有效且值得信赖的 AI 安全基准

文章出处:【微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110252

原文标题:携手 MLCommons,制定有效且值得信赖的 AI 安全基准

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    携手共创AI新时代,安谋科技“AI Arm CHINA”战略驱动半导体生态重构

      2025年12月2日,SIIAS香港首届国际半导体峰会隆重召开,安谋科技CEO陈锋以《Together! Empower the AI New Era!》(“携手共进,共创AI未来”)为题发表
    的头像 发表于 12-05 17:44 691次阅读
    <b class='flag-5'>携手</b>共创<b class='flag-5'>AI</b>新时代,安谋科技“<b class='flag-5'>AI</b> Arm CHINA”战略驱动半导体生态重构

    大华股份荣获福布斯韩国最值得客户信赖的品牌大奖

    近日,大华股份斩获福布斯韩国“最值得客户信赖的品牌——影像保安部门大奖”。作为韩国市场极具公信力的行业标杆奖项,此次殊荣不仅是对大华股份深耕韩国市场、坚持技术创新与服务深耕的高度认可,更是对大华技术硬实力与品牌影响力的权威认证。
    的头像 发表于 11-26 16:28 386次阅读

    关于“实时基准对比测量”与AI再探讨

    qqxjyxjy清风:关于“实时基准对比测量”我还想多问一句。 AI: 已深度思考(用时 14 秒) AI: 好的,用户之前详细讨论了用实时基准对比测量来解决ADA8330增益不确定的
    的头像 发表于 10-14 17:39 363次阅读

    vivo携手Google Cloud推动智能手机迈入AI新时代

    在人们期待更智能、更前瞻手机的时代,vivo 携手 Google Cloud,迅速推出更安全、更前沿的 AI 功能,共同加速创新,推动智能手机迈入智能、无缝、以人为本的 AI 新时代。
    的头像 发表于 09-23 16:54 1007次阅读

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    任务。这套系统为艺术市场、教育行业和内容平台提供了一种实用的工具,有效应对AI生成内容带来的挑战。虽然有些识别会出错,但是还是值得继续优化以及探讨方案的可行性。
    发表于 08-21 13:59

    货架倾斜监测:保障仓储安全的关键

    在货架倾斜监测方面,选择合适高品质的无线倾角传感器至关重要,而直川科技的无线倾角传感器凭借其卓越的性能和优势,无疑是众多仓储企业值得信赖的选择,为仓储安全保驾护航,助力现代物流仓储行
    的头像 发表于 07-04 14:36 463次阅读
    货架倾斜监测:保障仓储<b class='flag-5'>安全</b>的关键

    威盛电子推出天车安全AI监控方案

    近日,威盛电子宣布推出”威盛天车安全AI监控方案”。该方案基于自主研发的AI技术,集成行人姿态识别、精准防撞预警和智能分区警示等功能,大幅提升桥式起重机(天车)的安全管理效率。目前,该
    的头像 发表于 05-21 13:55 635次阅读

    国芯科技与美电科技携手推出AI传感器模组

    2024年,国芯科技与战略合作伙伴深圳美电科技有限公司(以下简称“美电科技”)展开了深度合作。双方以国芯科技首颗端侧AI芯片CCR4001S为核心,携手推出AI传感器模组,迅速紧密地
    的头像 发表于 03-18 16:34 937次阅读
    国芯科技与美电科技<b class='flag-5'>携手</b>推出<b class='flag-5'>AI</b>传感器模组

    Banana Pi 与瑞萨电子携手共同推动开源创新:BPI-AI2N

    与嵌入式系统的优势,该联合解决方案旨在打造更开放、更灵活的软硬件平台。 “此次合作将提升瑞萨在开源社区的知名度。基于 RZ/V2N 的突破性 BPI-AI2N SOM 有望对多个行业产生重大影响,为工程师
    发表于 03-12 09:43

    芯海科技BMS:让每块电池的安全值得信赖

    电池作为能源存储的核心组件,广泛应用于各类电子设备中。随着快充技术的普遍应用,大功率快充对电芯及电池管理系统(BMS)提出了更高的安全要求。一旦电池管理系统的安全防护不足,就极易引发电池起火、燃烧
    发表于 02-11 17:33 384次阅读
    芯海科技BMS:让每块电池的<b class='flag-5'>安全</b>都<b class='flag-5'>值得</b><b class='flag-5'>信赖</b>

    芯海科技BMS:让每块电池的安全值得信赖

    电池作为能源存储的核心组件,广泛应用于各类电子设备中。随着快充技术的普遍应用,大功率快充对电芯及电池管理系统(BMS)提出了更高的安全要求。一旦电池管理系统的安全防护不足,就极易引发电池起火、燃烧
    的头像 发表于 02-10 18:33 742次阅读
    芯海科技BMS:让每块电池的<b class='flag-5'>安全</b>都<b class='flag-5'>值得</b><b class='flag-5'>信赖</b>

    smart与元戎启行携手,共研智能驾驶AI大模型

    近日,智能汽车品牌smart与领先的人工智能企业元戎启行正式宣布达成战略合作。此次合作旨在共同研发智能驾驶AI大模型技术,为新一代智能驾驶系统注入强大动力。 双方将携手打造基于AI大模型的智能驾驶
    的头像 发表于 01-18 11:25 1714次阅读

    探讨电压基准噪声对模数转换器(ADC)的有效位数(ENOB)和无噪声分辨率的影响

    信息,而电压基准作为信号链关键元件,其噪声对 ADC 精度和准确度有重要影响。 *附件:探讨电压基准噪声对模数转换器(ADC)的有效位数(ENOB)和无噪声分辨率的影响.pdf 电压基准
    的头像 发表于 01-15 15:43 1370次阅读
    探讨电压<b class='flag-5'>基准</b>噪声对模数转换器(ADC)的<b class='flag-5'>有效</b>位数(ENOB)和无噪声分辨率的影响

    徐工汽车荣获2025年度值得用户信赖创新城市物流装备鼎新奖

    近日,在第十届发现信赖中国卡车用户调查暨评选活动中,徐工4米4大轻卡凭借在新能源技术上的领先优势和创新突破,一举荣获“2025年度值得用户信赖创新城市物流装备鼎新奖”。
    的头像 发表于 01-14 10:25 991次阅读

    MLCommons推出AI基准测试0.5版

    开放式机器学习工程联盟 MLCommons 在美国加州当地时间公布推出适用于消费类 PC 的 AI 性能的 MLPerf Client 基准测试的 0.5 版,这是该测试的第一个公开版本
    的头像 发表于 12-12 16:47 1207次阅读