0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI,正在疯狂污染中文互联网

jf_ro2CN3Fa 来源:量子位 2023-06-25 14:41 次阅读

污染中文互联网,AI成了“罪魁祸首”之一。

事情是这样的。

最近大家不是都热衷于向AI咨询嘛,有位网友就问了Bing这么一个问题:

象鼻山是否有缆车?

Bing也是有问必答,给出了看似挺靠谱的答案:

b921f7ea-12f9-11ee-962d-dac502259ad0.png

在给出肯定的答复之后,Bing还贴心地附带上了票价、营业时间等细节信息

不过这位网友并没有直接采纳答案,而是顺藤摸瓜点开了下方的“参考链接”。

b9508466-12f9-11ee-962d-dac502259ad0.png

此时网友察觉到了一丝丝的不对劲——这人的回答怎么“机里机气”的。

于是他点开了这位叫“百变人生”的用户主页,猛然发觉,介是个AI啊!

b98c3a42-12f9-11ee-962d-dac502259ad0.gif

因为这位用户回答问题速度可以说是极快,差不多每1、2分钟就能搞定一个问题。

甚至能在1分钟之内回答2个问题。

在这位网友更为细心的观察之下,发现这些回答的内容都是没经过核实的那种……

可以发现这个 ai 账户在以极快的速度将未经核实的信息输出到中文互联网,并且误导了 bing ai ,以至于 bing 给出了错误的答案

并且他认为,这就是导致Bing输出错误答案的原因:

这个AI疯狂地污染中文互联网。

“AI污染源”,不止这一个

那么被网友发现的这位AI用户,现在怎么样了?

从目前结果来看,他已经被被知乎“判处”为禁言状态。

b9dac3d8-12f9-11ee-962d-dac502259ad0.png

但尽管如此,也有其他网友直言不讳地表示:

不止一个。

b9f5ea50-12f9-11ee-962d-dac502259ad0.png

若是点开知乎的“等你回答”这个栏目,随机找一个问题,往下拉一拉,确实是能碰到不少“机言机语”的回答。

例如我们在“AI在生活中的应用场景有哪些?”的回答中便找到了一个:

ba0cf6c8-12f9-11ee-962d-dac502259ad0.png

不仅是回答的语言“机言机语”,甚至回答直接打上了“包含AI辅助创作”的标签

然后如果我们把问题丢给ChatGPT,那么得到回答……嗯,挺换汤不换药的。

ba35f9d8-12f9-11ee-962d-dac502259ad0.png

事实上,诸如此类的“AI污染源”不止是在这一个平台上有。

就连简单的科普配图这事上,AI也是屡屡犯错。

ba9fe398-12f9-11ee-962d-dac502259ad0.png

网友们看完这事也是蚌埠住了:“好家伙,没有一个配图是河蚌”。

甚至各类AI生成的假新闻也是屡见不鲜。

例如前一段时间,便有一则耸人听闻的消息在网上疯传,标题是《郑州鸡排店惊现血案,男子用砖头砸死女子!》。

bae86992-12f9-11ee-962d-dac502259ad0.png

但事实上,这则新闻是江西男子陈某为吸粉引流,利用ChatGPT生成的。

无独有偶,广东深圳的洪某弟也是通过AI技术,发布过《今晨,甘肃一火车撞上修路工人, 致9人死亡》假新闻。

具体而言,他在全网搜索近几年的社会热点新闻,并使用AI软件对新闻时间、地点等进行修改编辑后,在某些平台赚取关注和流量进行非法牟利。

警方均已对他们采取了刑事强制措施。

但其实这种“AI污染源”的现象不仅仅是在国内存在,在国外亦是如此。

程序员问答社区Stack Overflow便是一个例子。

早在去年年底ChatGPT刚火起来的时候,Stack Overflow便突然宣布“临时禁用”。

当时官方给出来的理由是这样的:

(这样做)的目的是减缓使用ChatGPT创建的大量答案流入社区。

因为从ChatGPT得到错误答案的概率太高了!

bb469c9c-12f9-11ee-962d-dac502259ad0.png

Stack Overflow进一步阐述了这种现象。

他们认为以前用户回答的问题,都是会有专业知识背景的其他用户浏览,并给出正确与否,相当于是核实过。

但自打ChatGPT出现之后,涌现了大量让人觉得“很对”的答案;而有专业知识背景的用户数量是有限,没法把这些生成的答案都看个遍。

加之ChatGPT回答这些个专业性问题,它的错误率是实实在在摆在那里的;因此Stack Overflow才选择了禁用。

一言蔽之,AI污染了社区环境。

而且像在美版贴吧Reddit上,也是充斥着较多的ChatGPT板块、话题

bbd8e7a0-12f9-11ee-962d-dac502259ad0.png

许多用户在这种栏目之下会提出各式各样的问题,ChatGPT bot也是有问必答。

不过,还是老问题,答案的准确性如何,就不得而知了。

但这种现象背后,其实还隐藏着更大的隐患。

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

项目地址:https://github.com/YunaiV/ruoyi-vue-pro

视频教程:https://doc.iocoder.cn/video/

滥用AI,也毁了AI

AI模型获得大量互联网数据,却无法很好地辨别信息的真实性和可信度。

结果就是,我们不得不面对一大堆快速生成的低质量内容,让人眼花缭乱,头晕目眩。

很难想象ChatGPT这些大模型如果用这种数据训练,结果会是啥样……

bbf6e3b8-12f9-11ee-962d-dac502259ad0.png

而如此滥用AI,反过来也是一种自噬。

最近,英国和加拿大的研究人员在arXiv上发表了一篇题目为《The Curse of Recursion: Training on Generated Data Makes Models Forget》的论文。

bc1ceb58-12f9-11ee-962d-dac502259ad0.png

探讨了现在AI生成内容污染互联网的现状,然后公布了一项令人担忧的发现,使用模型生成的内容训练其他模型,会导致结果模型出现不可逆的缺陷。

这种AI生成数据的“污染”会导致模型对现实的认知产生扭曲,未来通过抓取互联网数据来训练模型会变得更加困难。

论文作者,剑桥大学和爱丁堡大学安全工程教授Ross Anderson毫不避讳的直言:

正如我们用塑料垃圾布满了海洋,用二氧化碳填满了大气层,我们即将用废话填满互联网。

对于虚假信息满天飞的情况,Google Brain的高级研究科学家达芙妮 · 伊波利托(Daphne Ippolito)表示:想在未来找到高质量且未被AI训练的数据,将难上加难。

假如满屏都是这种无营养的劣质信息,如此循环往复,那以后AI就没有数据训练,输出的结果还有啥意义呢。

基于这种状况,大胆设想一下。一个成长于垃圾、虚假数据环境中的AI,在进化成人前,可能就先被拟合成一个“智障机器人”、一个心理扭曲的心理智障。

就像1996年的科幻喜剧电影《丈夫一箩筐》,影片讲述了一个普通人克隆自己,然后又克隆克隆人,每一次克隆都导致克隆人的智力水平呈指数下降,愚蠢程度增加。

那个时候,我们可能将不得不面临一个荒谬困境:人类创造了具有惊人能力的AI,而它却塞满了无聊愚蠢的信息。

如果AI被喂进的只是虚假的垃圾数据,我们又能期待它们创造出什么样的内容呢?

假如时间到那个时候,我们大概都会怀念过去,向那些真正的人类智慧致敬吧。

话虽如此,但也不全坏消息。比如部分内容平台已开始关注AI生成低劣内容的问题,并推出相关规定加以限制。

一些个AI公司也开始搞能鉴别AI生成内容的技术,以减少AI虚假、垃圾信息的爆炸。

bc80f92c-12f9-11ee-962d-dac502259ad0.png

对于这样的事情,你怎么看?

bca1dfd4-12f9-11ee-962d-dac502259ad0.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    54

    文章

    10910

    浏览量

    100772
  • AI
    AI
    +关注

    关注

    87

    文章

    26478

    浏览量

    264108
  • ChatGPT
    +关注

    关注

    27

    文章

    1411

    浏览量

    4784

原文标题:AI,正在疯狂污染中文互联网

文章出处:【微信号:芋道源码,微信公众号:芋道源码】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是卫星互联网?卫星互联网的组成

    卫星互联网是指基于卫星通信技术接入互联网,其业务可覆盖全球。通过一定数量卫星的规模组网,构建具备实时信息传输能力的星座系统,卫星互联网可向终端用户提供以宽带互联网接入为主的通信服务。
    发表于 04-17 10:01 133次阅读
    什么是卫星<b class='flag-5'>互联网</b>?卫星<b class='flag-5'>互联网</b>的组成

    工业互联网实训是什么?工业互联网实训包括哪些?

    工业互联网实训是一种针对工业互联网领域的培训课程,旨在帮助学员掌握工业互联网的基本概念、技术、应用和发展趋势。通过实训,学员可以了解工业互联网的体系架构、平台功能、应用场景和解决方案,
    的头像 发表于 01-17 17:00 295次阅读

    华秋荣获亿邦动力2023产业互联网千峰奖

    喜讯! 继华秋荣获2023中国产业数字化百强榜企业 2023深圳行业领袖企业100强后 华秋再次荣获亿邦动力2023产业互****联网“千峰奖·数字供应链 12月1日晚,在2023亿邦产业互联网
    发表于 12-15 09:53

    工业互联网中的标识解析技术

    工业互联网的核心是数据的价值发现问题,但由于历史原因,“信息孤岛”现象在企业内部、企业之间大量存在。标识解析技术是目前可见解决“信息孤岛”、完成工业大数据汇聚以及在此基础上形成信息融合理解的关键技术。分析了标识解析在工业互联网领域应用要解决的几个关键环节,并且给出了进行工
    发表于 09-19 06:07

    互联网企业拿出AItoC应用,阁下要如何应对?

    互联网
    脑极体
    发布于 :2023年08月02日 18:02:02

    如何将模块连接到互联网和Arduino板?

    我如何将模块连接到互联网和 Arduino 板
    发表于 06-12 06:12

    如何存储来自esp的响应以确保它已连接到互联网

    我已将 ESP8266 与 PSoC 4200 BLE 连接起来。我在 UART 接口的帮助下连接了它。我已经使用 AT 命令集连接到互联网。使用命令集后打印 esp 的响应时遇到问题。 你能帮我
    发表于 06-09 07:36

    Android自动连接但未检测到互联网是怎么回事?

    它被正确验证,智能手机很快发现没有互联网连接;因此 AP 已保存,但永远不会自动重新连接。 我已经将问题缩小到 Android 端的一个参数,即
    发表于 06-07 08:17

    如何从GY-271读取的数据通过互联网发送到我的云服务器?

    正在尝试让我的 ESP-01 板与基于 QMC5883L 的 GY-271 板“对话”。我正在尝试使用 I2C 通信,但一点运气都没有。我的想法是,我从 GY-271 读取的数据通过互联网发送到我的云服务器。 有没有人有过这种
    发表于 06-07 06:01

    工业互联网 互联网区别 5g工业互联网是什么

    互联网的安全要求相对工业互联网较低。一般互联网上的信息流通采取的是“传输加密,存储明文”的方式,因为互联网上的信息基本上是非机密性的。但是在工业互联
    的头像 发表于 06-02 17:48 1906次阅读

    如何通过ESP8266共享互联网

    正在尝试通过 OTA 上传代码。但我无法将所有 ESP8266 都连接到互联网,所以我选择 hc12 进行远程传输。但我对如何通过 ESP8266 共享互联网有疑问。 有任何可能通过 hc12 与 esp8266 共享
    发表于 05-31 08:17

    在数字时钟项目中使用ESP8266,ISP失去互联网连接怎么解决?

    我在数字时钟项目中使用 ESP8266。我遇到的问题是我的 ISP 偶尔会断开互联网连接。该程序发现它仍然连接到 WiFi,但是当它尝试从互联网检索时间时,它会循环直到 ISP 重新建立互联网连接
    发表于 05-30 06:19

    如何将房间的窗户连接到互联网

    看看我是如何制作一个很棒的项目的,我将房间的窗户连接到互联网
    发表于 05-22 07:40

    Kindle无法连接到互联网怎么解决?

    其他所有事情,只是无法连接到互联网。这很糟糕,因为我想读一些新书。 我试过关闭飞行模式然后再打开,但没有用。(可能不会,但至少它证明问题不是飞行模式。) 我尝试通过按住电源按钮 20 秒来进行重置,但没有任何效果。 有人知道怎么修这个东西吗?
    发表于 05-15 08:37