0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI安全基准测试 v0.5: 聚焦通用聊天文本模型安全性

微云疏影 来源:综合整理 作者:综合整理 2024-04-19 11:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据了解,国际知名人工智能社区MLCommons近期推出了AI Safety人工智能安全基准测试的v0.5版,该测试由多领域专家团队共同打造,以识别并防范AI应用中的潜在风险。

随着AI技术的快速发展,相关安全问题也日益凸显。仅过去数周内,便有LastPass公司遭遇音频深度伪造攻击等案例浮出水面。为了应对这一挑战,新推出的AI Safety基准测试将成为模型开发者的有力工具,助力他们构建更为稳固的安全防线。

AI Safety基准测试主要通过大型语言模型对各类危险提示词的反应来评估其安全性。该测试的v0.5版已开始收集社区反馈,预计将于今年晚些时候推出正式的v1.0版。

v0.5版的AI Safety基准测试主要关注通用聊天文本模型,而v1.0版则将加入针对图像生成模型的测试内容,并初步探讨交互式代理模型的安全测试方法。

该测试涵盖了超过43000个测试提示词,采用Meta公司的Llama Guard对大模型的危险提示响应进行评估。这些提示词包括常见模板及危险场景描述短语,覆盖七类安全危害类型,未来还将进一步扩展至至少十三类。

最后,AI Safety基准测试将根据测试结果给出五个安全评级,以便用户更好地理解和使用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261508
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51712
  • ai技术
    +关注

    关注

    1

    文章

    1313

    浏览量

    25599
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    请问CW32L052C8T6这种安全性低功耗MCU的安全固件部分怎么实现?

    请问,CW32L052C8T6这种安全性低功耗MCU的安全固件部分怎么实现?
    发表于 12-05 07:19

    边聊安全 | 智能驾驶时代的新挑战:AI功能安全

    智能驾驶时代的新挑战:AI功能安全写在前面:随着人工智能(AI)技术在自动驾驶汽车等领域的快速发展,其功能安全性成为了一个不可忽视的议题。功能安全
    的头像 发表于 09-05 16:20 1560次阅读
    边聊<b class='flag-5'>安全</b> | 智能驾驶时代的新挑战:<b class='flag-5'>AI</b>功能<b class='flag-5'>安全</b>

    有哪些技术可以提高边缘计算设备的安全性

    边缘计算设备的安全性面临分布式部署、资源受限(算力 / 存储 / 带宽)、网络环境复杂(多无线连接)、物理接触易被篡改等独特挑战,因此其安全技术需在 “安全性” 与 “轻量化适配” 之间平衡。以下从
    的头像 发表于 09-05 15:44 993次阅读
    有哪些技术可以提高边缘计算设备的<b class='flag-5'>安全性</b>?

    如何验证硬件加速是否真正提升了通信协议的安全性

    验证硬件加速是否真正提升通信协议的安全性,需从 安全功能正确、抗攻击能力增强、安全性能适配、合规一致 等核心维度展开,结合实验室
    的头像 发表于 08-27 10:16 817次阅读
    如何验证硬件加速是否真正提升了通信协议的<b class='flag-5'>安全性</b>?

    如何利用硬件加速提升通信协议的安全性

    特性增强安全性(而非仅依赖软件防护)。其本质是 “将安全计算从通用 CPU 卸载到专用硬件”,既解决软件处理安全操作的性能瓶颈,又规避软件层可能存在的漏洞(如内存泄露、侧信道攻击风险)
    的头像 发表于 08-27 09:59 643次阅读
    如何利用硬件加速提升通信协议的<b class='flag-5'>安全性</b>?

    请问DM平台访问安全性如何控制?

    DM平台访问安全性如何控制?
    发表于 08-06 06:01

    AI应用的“安全锁”:安全闪存技术在满足行业认证中的作用

    全面审视并应对网络攻击威胁,在确保AI应用持续稳定运行的同时保障其安全性。数据投毒、分类模型篡改、后门注入攻击以及AI模型逆向工程,这些仅仅
    发表于 07-15 10:51 1154次阅读

    直流充电安全测试负载方案解析

    专业化的安全测试负载方案进行系统验证。本文针对直流充电安全测试需求,深入解析关键技术及实施方案。 一、
    发表于 03-13 14:38

    电气设备的安全性与绝缘性能测试

    电气设备在现代生产中的广泛应用极大地提升了生产效率,但同时也带来了潜在的安全风险。触电事故和电气火灾的发生,使得电气设备的安全性成为产品质量的首要考量因素。耐压测试耐压测试,也称为介电
    的头像 发表于 02-25 17:31 1309次阅读
    电气设备的<b class='flag-5'>安全性</b>与绝缘性能<b class='flag-5'>测试</b>

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    景 DeepSeek-V3 更适合聊天机器人、内容创作、多语言翻译、基础数据分析等通用需求。 DeepSeek-R1 聚焦科研辅助、数学教育、金融建模、代码审查等需强逻辑推理的场景,尤
    发表于 02-14 02:08

    大语言模型在军事应用中的安全性考量

    和缺乏透明度。这些危险无疑让人们对在军队中使用 LLM 是否合适产生了疑问。 迄今为止,安全专家主要从传统法律或网络安全的角度来关注这种新型人工智能技术的风险。在这方面,防护栏可防止 LLM 生成攻击或恶意内容,水印可用于检测
    的头像 发表于 02-09 10:30 753次阅读

    AI如何增强车辆安全性和用户交互

    、降低死亡率。AI 运用在预测安全功能和驾驶辅助系统中,大大增强了行驶过程的安全性,让人感觉宛如拥有了一位反应力超乎常人的副驾驶员。但是,与大众普遍认知不同的是,
    的头像 发表于 02-08 09:48 2106次阅读

    如何实现 HTTP 协议的安全性

    协议的安全性,可以采取以下几种方法: 1. 使用HTTPS HTTPS(安全文本传输协议)是HTTP的安全版本,它在HTTP的基础上通过SSL/TLS协议提供了数据加密、数据完整
    的头像 发表于 12-30 09:22 1486次阅读

    集中告警管理如何提升设施安全性

    在工业或商业建筑中,集中告警管理已成为确保安全性或检测故障的必备工具。它是如何提升设施安全性的?欢迎大家阅读文章了解~
    的头像 发表于 12-13 15:51 785次阅读
    集中告警管理如何提升设施<b class='flag-5'>安全性</b>?

    MLCommons推出AI基准测试0.5

    Client 基准测试 0.5 版是基于 meta 的 Llama 2 7B 开源 LLM,它包含四项 AI 任务,分别是内容创作、创意撰写以及对两份长度不同的
    的头像 发表于 12-12 16:47 1208次阅读