0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI推出AI真假鉴别工具,成功率仅有26%

youyou368 来源:电子元器件超市 2023-02-06 16:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

很多人也许已经忘记,ChatGPT 正式发布时间是去年 11 月底,到现在才刚刚两个月,但它掀起的热潮却已引发科技公司纷纷跟进,催生了独角兽创业公司,还让学术界修改了论文接收的要求。

在 ChatGPT 引发 AI 领域「是否要禁用」大讨论之后,OpenAI 的真假鉴别工具终于来了。

1 月 31 日 OpenAI 官宣了区分人类作品和 AI 生成文本的识别工具上线,该技术旨在识别自家的 ChatGPT、GPT-3 等模型生成的内容。然而分类器目前看起来准确性堪忧:OpenAI 在博客里指出 AI 识别 AI 高置信度正确率约为 26%。但该机构认为,当它与其他方法结合使用时,可以有助于防止 AI 文本生成器被滥用。

「我们提出分类器的目的是帮助减少人工智能生成的文本造成的混淆。然而它仍然有一些局限性,因此它应该被用作其他确定文本来源方法的补充,而不是作为主要的决策工具,」OpenAI 发言人通过电子邮件对媒体介绍道。「我们正通过这个初始分类器获取有关此类工具是否有用的反馈,并希望在未来分享改进的方法。」

最近科技领域随着围绕生成式 AI,尤其是文本生成 AI 的热情正在不断增长,但相对的是人们对于滥用的担忧,批评者呼吁这些工具的创造者应该采取措施减轻其潜在的有害影响。

面对海量的 AI 生成内容,一些行业立刻作出了限制,美国一些最大的学区已禁止在其网络和设备上使用 ChatGPT,担心会影响学生的学习和该工具生成的内容的准确性。包括 Stack Overflow 在内的网站也已禁止用户共享 ChatGPT 生成的内容,称人工智能会让用户在正常的讨论中被无用内容淹没。

这些情况突出了 AI 识别工具的必要性。虽然效果不尽如人意,但 OpenAI AI 文本分类器(OpenAI AI Text Classifier)在架构上实现了和 GPT 系列的对标。它和 ChatGPT 一样是一种语言模型,是根据来自网络的许多公开文本示例进行训练的。与 ChatGPT 不同的是,它经过微调可以预测一段文本由 AI 生成的可能性 —— 不仅来自 ChatGPT,也包括来自任何文本生成 AI 模型的内容。

具体来说,OpenAI 在来自五个不同组织(包括 OpenAI 自己)的 34 个文本生成系统的文本上训练了 AI 文本分类器。这些内容与维基百科中相似(但不完全相同)的人工文本、从 Reddit 上共享的链接中提取的网站以及为 OpenAI 文本生成系统收集的一组「人类演示」配对。

需要注意的是,OpenAI 文本分类器不适用于所有类型的文本。被检测的内容至少需要 1000 个字符,或大约 150 到 250 个单词。它没有论文检测平台那样的查重能力 —— 考虑到文本生成人工智能已被证明会照抄训练集里的「正确答案」,这是一个非常难受的限制。OpenAI 表示,由于其英语前向数据集,它更有可能在儿童或非英语语言书写的文本上出错。

在评估一段给定的文本是否由 AI 生成时,检测器不会正面回答是或否。根据其置信度,它会将文本标记为「非常不可能」由 AI 生成(小于 10% 的可能性)、「不太可能」由 AI 生成(在 10% 到 45% 之间的可能性)、「不清楚它是否是」AI 生成(45% 到 90% 的机会)、「可能」由 AI 生成(90% 到 98% 的机会)或「很有可能」由 AI 生成(超过 98% 的机会)。

看起来和图像识别的 AI 很像,除了准确程度。根据 OpenAI 的说法,分类器错误地将人类编写的文本标记为 AI 编写的文本的概率为 9%。

一番试用之后,效果的确不大行

OpenAI 宣称其 AI 文本分类器的成功率约为 26%,一些网友上手试用之后,发现识别效果果然不行。

知名 ML 和 AI 研究人员 Sebastian Raschka 试用之后,给出了「It does not work」的评价。他使用其 2015 年初版的 Python ML 书籍作为输入文本,结果显示如下。

Randy Olson 的 foreword 部分被识别为不清楚是否由 AI 生成(unclear)

他自己的 preface 部分被识别为可能由 AI 生成(possibly AI)

第一章的段落部分被识别为很可能由 AI 生成(likely AI)

387526ca-a4d2-11ed-bfe3-dac502259ad0.png

Sebastian Raschka 对此表示,这是一个有趣的例子,但自己已经为将来可能因离谱的论文识别结果而受到惩罚的学生感到难过了。

因此他提议,如果要部署这样的模型,请共享一个混淆矩阵。不然如果教育者采用这一模型进行评分,则可能会对现实世界造成伤害。此外还应该增加一些有关误报和漏报的透明度。

此外,Sebastian Raschka 输入了莎士比亚《麦克白》第一页的内容,OpenAI AI 文本分类器给出的结果竟然是很可能由 AI 生成。简直离谱!

3918e2ce-a4d2-11ed-bfe3-dac502259ad0.png

还有人上传了 AI 写作工具 Easy-Peasy.AI 创作的内容,结果 OpenAI AI 文本分类器判定为由 AI 生成的可能性非常小。

3937aa2e-a4d2-11ed-bfe3-dac502259ad0.png

最后,有人用上了反复翻译大法,把文本让 GPT3 重写一遍,也能骗过识别器。

39ebeb2e-a4d2-11ed-bfe3-dac502259ad0.png

总结一下的话就是正向识别不准,反向识别出错,也无法识破一些改论文的技巧。看来,起码在 AI 文本内容识别这一领域,OpenAI 还需努力。

最近,有媒体爆料百度计划在今年3月推出 ChatGPT 风格的应用程序,最初将其嵌入到其主要搜索服务中。该工具的名称尚未确定,就像 ChatGPT 一样允许用户获得对话式搜索结果。百度对此未予置评。不过,有网友建议,还是先做一个AI内容真假鉴别工具吧!

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41981

    浏览量

    303078
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52341
  • OpenAI
    +关注

    关注

    9

    文章

    1263

    浏览量

    10328

原文标题:ChatGPT “克星”来了!OpenAI 推出AI真假鉴别工具,成功率仅有26%

文章出处:【微信号:jbchip,微信公众号:电子元器件超市】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    IRAMY20UP60B:家电电机驱动的集成功率混合IC解决方案

    Rectifier推出的IRAMY20UP60B集成功率混合IC,看看它能为我们带来哪些优势。 文件下载: IRAMY20UP60B.pdf 产品概述 IRAMY20UP60B是一款专为家电电机驱动
    的头像 发表于 05-18 16:40 78次阅读

    IRAMS12UP60A:集成功率混合IC在电器电机驱动中的卓越表现

    (International Rectifier)推出的IRAMS12UP60A系列集成功率混合IC,看看它在电器电机驱动应用中究竟有何独特之处。 文件下载: IRAMS12UP60A.pdf 一、产品概述
    的头像 发表于 05-18 16:30 71次阅读

    IRAMS10UP60B:家电电机驱动的集成功率模块解决方案

    IRAMS10UP60B:家电电机驱动的集成功率模块解决方案 在电子工程师的日常工作中,为家电电机驱动寻找高效、可靠且易于设计的解决方案是一项重要任务。国际整流器公司(International
    的头像 发表于 05-18 16:30 88次阅读

    IRAM136 - 3063B:高性能集成功率混合IC的技术解析

    (International Rectifier)推出的IRAM136 - 3063B集成功率混合IC,看看它有哪些独特之处。 文件下载: IRAM136-3063B.pdf 一、产品概述 IRAM136 - 3063B
    的头像 发表于 05-18 16:20 69次阅读

    IRAMS06UP60B:家电电机驱动的集成功率模块解决方案

    IRAMS06UP60B:家电电机驱动的集成功率模块解决方案 引言 在当今的家电应用中,高效、可靠且紧凑的电机驱动解决方案至关重要。国际整流器公司(International Rectifier
    的头像 发表于 05-18 16:15 76次阅读

    IRAMS06UP60A集成功率模块:家电电机驱动的理想之选

    (International Rectifier)推出的IRAMS06UP60A集成功率模块,看看它在电子电机控制领域的表现如何。 文件下载: IRAMS06UP60A-2.pdf 一、产品概述 IRAMS06UP60A
    的头像 发表于 05-18 16:15 63次阅读

    IRAM256 - 1567A:家电电机驱动的集成功率模块

    IRAM256 - 1567A:家电电机驱动的集成功率模块 在电子工程师的日常工作中,为家电电机驱动寻找合适的功率模块是一项关键任务。今天,我们就来深入了解一下 International
    的头像 发表于 05-18 16:05 118次阅读

    CIPOS™ Tiny IM393 - X6E:高效集成功率模块的设计与应用

    CIPOS™ Tiny IM393 - X6E:高效集成功率模块的设计与应用 在电子工程师的设计世界里,一款性能卓越、功能丰富的功率模块往往能为项目带来极大的便利和优势。今天,我们就来深入探讨一下
    的头像 发表于 05-18 14:50 121次阅读

    IRSM836 - 035MB:小体积大能量的集成功率模块

    IRSM836 - 035MB:小体积大能量的集成功率模块 在电子工程师的日常设计中,为小型家电电机驱动寻找合适的功率模块是一项常见且关键的任务。今天,我们就来深入探讨一款名为 IRSM836
    的头像 发表于 01-23 17:20 1035次阅读

    IRSM836 - 044MA集成功率模块:小身材大能量,助力家电电机驱动

    (International Rectifier)推出的IRSM836 - 044MA集成功率模块(IPM),看看它如何在小尺寸下实现高性能,为家电电机驱动应用带来新的解决方案。 文件下载
    的头像 发表于 12-17 16:20 669次阅读

    功率 ( 23 dBm) 802.11ax 超线性 WLAN 功率放大器,带集成功率检测器 skyworksinc

    电子发烧友网为你提供()高功率 ( 23 dBm) 802.11ax 超线性 WLAN 功率放大器,带集成功率检测器相关产品参数、数据手册,更有高功率 ( 23 dBm) 802.11
    发表于 10-16 18:32
    高<b class='flag-5'>功率</b> ( 23 dBm) 802.11ax 超线性 WLAN <b class='flag-5'>功率</b>放大器,带集<b class='flag-5'>成功率</b>检测器 skyworksinc

    成功率检测器的高功率 802.11ac WLAN 功率放大器 skyworksinc

    电子发烧友网为你提供()集成功率检测器的高功率 802.11ac WLAN 功率放大器相关产品参数、数据手册,更有集成功率检测器的高功率 8
    发表于 10-16 18:31
    集<b class='flag-5'>成功率</b>检测器的高<b class='flag-5'>功率</b> 802.11ac WLAN <b class='flag-5'>功率</b>放大器 skyworksinc

    功率 ( 19 dBm) 802.11ac WLAN 功率放大器,带集成功率检测器 skyworksinc

    电子发烧友网为你提供()高功率 ( 19 dBm) 802.11ac WLAN 功率放大器,带集成功率检测器相关产品参数、数据手册,更有高功率 ( 19 dBm) 802.11ac W
    发表于 10-10 18:33
    高<b class='flag-5'>功率</b> ( 19 dBm) 802.11ac WLAN <b class='flag-5'>功率</b>放大器,带集<b class='flag-5'>成功率</b>检测器 skyworksinc

    功率 ( 22 dBm) 802.11ac WLAN 功率放大器,带集成功率检测器 skyworksinc

    电子发烧友网为你提供()高功率 ( 22 dBm) 802.11ac WLAN 功率放大器,带集成功率检测器相关产品参数、数据手册,更有高功率 ( 22 dBm) 802.11ac W
    发表于 09-25 18:34
    高<b class='flag-5'>功率</b> ( 22 dBm) 802.11ac WLAN <b class='flag-5'>功率</b>放大器,带集<b class='flag-5'>成功率</b>检测器 skyworksinc

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    1. 项目概述 本项目旨在开发并部署一个高精度的深度学习模型,用于自动鉴别一张图片是由AI生成(如Stable Diffusion, DALL-E, Midjourney等工具生成)还是真实的画家
    发表于 08-21 13:59