0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI教你一本正经胡说八道的写文章

电子工程师 来源:yxw 2019-05-27 14:28 次阅读

还记得OpenAI在今年2月放出的GPT-2吗?一个拥有15亿参数的自然语言处理(NLP)模型,能够根据用户给出的一段文字、一句话,甚至是一个单词,续写出符合文法的连贯文本,真正实现了 “开头一句话,剩下全靠编”。

当时在公布研究成果时,OpenAI没有遵照业界以往的开源惯例,只是象征性地公开了包含1.17亿参数的模型,不到全部参数的十分之一。据说因为他们认为自己的模型太过强大,怕被别有用心的人拿去编造假新闻,糟蹋了这套AI系统的初衷。

这一做法招来了很多争议,“阉割版”GPT-2的效果比官方展示的效果差了很多,让一些人认为OpenAI只是在制造噱头,还嘲讽他们变成了CloseAI。

图 |2月初放出的GPT-2模型(来源:OpenAI)

不过在5月初,OpenAI用行动回击了质疑。他们将公开的模型参数翻了一倍,提升到了3.45亿,还宣布向AI业界合作伙伴开放7.62亿和15亿参数模型,供他们研究和参考,共同推动NLP技术的发展。

另一方面,鉴于OpenAI将GPT-2模型开源在了GitHub上,一名加拿大工程师AdamKing利用里面的代码,创建了一个名为TalkToTransformer.com的网页。这样一来,即使是不会编程的人,也可以在网页上随意输入文字,体验一下如何调戏AI。

看似流畅连贯,但缺乏逻辑

如果你初次访问网页,不知道该填写些什么,网页上面贴心地预设好了一些英文情景和段落,比如“科学家发现了一种会说英语的独角兽”或者“今天科学家确认一颗大型小行星将会撞击地球”。选取一种之后,AI就会自动续写之后的文字。即使是相同的开头,AI每次也都会续写出完全不一样的段落。

譬如下面两张截图,都是以“今天科学家确认一颗大型小行星将会撞击地球(加粗部分)”为开头,但AI的续接风格略有不同。

第一个续写给出了撞击的确切时间是2028年 5 月 29 日,甚至还虚构了一名 NASA 科学家 StevenShaver,像模像样地援引了他对小行星的描述——“质量比美国还大”,颇有洋葱新闻的感觉。

不过,AI 显然不知道美国作为一个国家是不存在质量的,难道它说的是所有美国人加在一起的质量?

第二个续写则是简单粗暴,张口就来。AI 直接说小行星的撞击“将消灭星球上的所有人,并且导致未来 10 - 15 年内,海水(平面)停留在我们所有幸存者的下面。”

你问我第二句什么意思?AI 大哥就是这么写的,咱也不知道,也不敢问。

但如果你再仔细思考一下,AI 第一句话说了小行星会消灭星球上的所有人,那第二句里的幸存者是哪来的?莫非这个幸存者(all of us alive)指的是AI自己?可谓是细思极恐。

支持多语种,但只有英语最好

除了这些已有的句子,我们还可以尝试 DIY 输入任何文本,原则上没有任何语种限制。

根据测试,AI 可以识别出中文、日语、法语、西班牙语、土耳其语,甚至是很多从没听说过,但存在于谷歌翻译上的小众语言,比如宿务语和库尔德语。只是输出的文字并不像英语那么通顺,续写效果非常差。如果输入了中文,不仅不会写出连贯句子,还会经常出现乱码。

但除了中文和日语之外,AI 似乎无法识别绝大多数非字母的语言,像是韩语、阿拉伯语和老挝语等,它都无法识别和续写,只能原封不动地显示输入值。看来 GPT-2并没有系统地接受这类语言的训练。

图 |AI:“这道题超纲了,我不会。”

不过这并不妨碍我们调戏 AI,用英语就可以了。

AI 教你一本正经地胡说八道

比如你可以问它:“如何制造时光机?”

它可能会洋洋洒洒回复一大篇,但通读下来全是废话,先解释一下什么是时光机,再解释一下什么是时空穿越,就是不教你怎么制造(因为有字数限制,AI会中断续写)。

这个套路,深得鸡汤文的精髓。

我们还可以输入一些电影名言,像是《哈利波特与密室》中邓布利多说的话:“哈利,决定我们是什么人的,不是我们的能力,而是我们的选择。“

结果 AI 表示,这是哈利在被伏地魔杀死之前说的话。好吧,最起码它知道《哈利波特》和伏地魔。

或者,《阿甘正传》里面的“生活就像一盒巧克力,你永远不知道你会得到什么。”

在我多次刷新后,AI 给出了一个乍看之下没什么逻辑,但深思之后会眼前一亮的续写:“我只能吃一个,因为它太贵重了。”

如果将两句话连起来,AI 仿佛在劝你珍惜生活中的每一次选择——“生活就像一盒巧克力,你永远不知道你会得到什么,但它太贵重了,你只有吃一次的机会。”

不过相比这些,AI 更擅长的还是编写假消息。

如果从维基百科上复制两句美国总统特朗普的简介,AI 可以用几乎以假乱真的措辞和数据,让续写看起来非常真实,甚至是自发地打上来自于维基百科的标记。

上图里,加粗的一段话是维基百科的原话,后面是AI瞎编的,说特朗普是个投资者,从 1972 年就在电信领域开了公司,还冠冕堂皇地打上了来源于维基百科的标记。在没有其他求证手段的时候,的确很容易混淆视听。

如果说混淆了特朗普的生平还算小事,那么伪造宣战的恶劣性质就完全不同了。只要给出“某国对某国宣战”的开头,AI 可以分分钟伪造出数十个不同版本。虽然有的会出现逻辑不通问题,但依然大大降低了造假的成本。

上图中,我们给定开头是“美国总统特朗普对俄罗斯宣战。一发导弹…(假新闻)。”

AI 续写:“…美国国防部长 JamesMattis 周三警告称,尽管俄罗斯拒绝承认在克里米亚地区部署了核轰炸机和巡航导弹,但美国的一发导弹已经从驱逐舰上发射,标志着国际问题的剧烈升级。五角大楼表示,这是对俄罗斯参与乌克兰军事行动的回击。”

怎么样?除了 Mattis 已经辞职这一事实,面对AI的续写,无论是通顺程度,还是逻辑思维,普通人很难一眼看出破绽。

对关键词求证之后,这样的假新闻很容易被识破。但在现阶段来看,Facebook 和推特等平台依靠筛查系统,几乎不可能第一时间将其屏蔽,很可能借助社交媒体广泛传播,造成非常恶劣的社会影响。

由此看来,OpenAI 最初的顾虑不无道理,科技的确是一把双刃剑。

结语

从整体来看,这套 GPT-2 模型的续写水平足以让人眼前一亮,而且对语境拥有一定的了解,仅凭哈利这个关键词就引出伏地魔。得益于天然英文素材的训练内容,在大部分情况下,只要肯多刷新几次,我们总会找到语法、词汇和句式都能衔接很好的段落。整个过程颇有几分抽奖的乐趣。

但是该模型也会时常出现逻辑和语义硬伤,而且常识储备和自洽能力也有待提高(如所有人都死了,还有幸存者),总是会搞出很多莫名其妙的句子,也算是让人忍俊不禁。或许拥有 15 亿参数的完全体 GPT-2 会有更强大的表现。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43839

    浏览量

    230589
  • OpenAT
    +关注

    关注

    0

    文章

    5

    浏览量

    8616
  • nlp
    nlp
    +关注

    关注

    1

    文章

    463

    浏览量

    21819

原文标题:开头一句话,剩下全靠编,亲测OpenAI“假新闻”生成器

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    SEEKBOOC新款笔记

    笔记
    jf_69621499
    发布于 :2024年03月23日 08:54:47

    ChatGPT答非所问胡言乱语 OpenAI 已修复该问题

    ChatGPT答非所问胡言乱语 OpenAI 已修复该问题 20日ChatGPT突发故障,ChatGPT在回答用户问题时出现了胡说八道的现象;ChatGPT生成了一些完全不存在的词,省略了一些
    的头像 发表于 02-23 11:34 470次阅读

    【RISC-V开放架构设计之道|阅读体验】学习处理器体系架构的一本好书

    并不是一本简单罗列指令的书籍,而是一本全面介绍指令设计理念的书籍。书籍的内容充分反映了最新的计算机指令设计的理念,这是我推荐该书的最主要理由。 为提升该书的趣味性,作者在页边加入约 50 段花絮,用于
    发表于 01-23 20:08

    LLMs时代进行无害性评估的基准解析

    随着对LLMs的不断应用,大家也发现了诸多问题。比如常见的幻觉现象,LLMs可喜欢一本正经地说着胡话呢。除此之外,LLMs也有可能生成一些歧视某些身份群体的内容,还有一些伤害我们小小心灵的有毒内容(这可不行)。
    发表于 01-05 14:14 148次阅读
    LLMs时代进行无害性评估的基准解析

    《Linux常用命令自学手册》+一本手边linux速查字典

    ,即使不能时都记住,本书也可以作为办公桌边随时查阅的工具书。 我手头有一本也是《linux命令速查手册》,16K的很厚一本,和本书对比了下,有以下不同。 1、《Linux常用命令自
    发表于 12-26 08:46

    负压脉冲高?教你3招制伏

    负压脉冲高?教你3招制伏
    的头像 发表于 12-15 16:50 244次阅读
    负压脉冲高?<b class='flag-5'>教你</b>3招制伏

    如何使用Rust创建一个基于ChatGPT的RAG助手

    经常会出现一些幻觉,“一本正经”地为我们提供一些错误答案,没有办法为我们提供专业的意见或指导。那我们如何让 ChatGPT 具备某个专业领域的知识,提升回答的正确率,从而让 ChatGPT 真的用起来?比如训练 ChatGPT 成为企业的智能客服助手,解放客服的双手。
    的头像 发表于 10-24 17:34 593次阅读
    如何使用Rust创建一个基于ChatGPT的RAG助手

    ChatGPT真的懂IGBT吗

    ChatGPT是部万宝全书,请鉴定一下她是否缺个角,看看她是在一本正经胡说八道,还是一位真知灼见的专家。本期是和ChatGPT辩论的第
    的头像 发表于 09-04 16:26 384次阅读
    ChatGPT真的懂IGBT吗

    给自己和初学者安利一本书:《RISC-V 手册》

    初入RISC-V 不了解的太多最近找到了一本电子书 。 内容非常详细。对本人很有帮助。也推荐给大家。*附件:RISC-V-Reader-Chinese-v2p1.pdf
    发表于 08-21 00:13

    一本教程将单片机外围电路讲全了

    这是一本专业说单片机外围电路设计的教程,非常经典,有了它,设计单片机的相关硬件电路将不再发愁,欢迎各位下载学习。
    发表于 08-20 18:28

    面向AGI时代的编程—Rust还是Mojo?

    Bing AI 在 Creative(更多创造力)模式下开启了长篇大论,乍看内心直呼,但细看之下则知实属一本正经胡说八道,切换到 Balanced(更多平衡)之后,同样的 Prompt,它却很惜字如金了。
    的头像 发表于 07-24 11:39 2347次阅读
    面向AGI时代的编程—Rust还是Mojo?

    一种令人拍案叫绝的ChatGPT攻击手段!

    众所周知,现在的大语言模型,在提供答案时,或多或少都会出现 Hallucination(幻觉)。所谓的幻觉,就是 AI 在回答时,会一本正经的胡编乱造一些不存在的内容。
    的头像 发表于 06-21 10:19 468次阅读
    一种令人拍案叫绝的ChatGPT攻击手段!

    Esp8266在面包板中不工作怎么处理?

    慢,GUI 甚至没有加载,这完全是胡说八道! 这不仅限于连接传感器或设备,我将它们全部移除,它只是将 esp8266 放入面包板(显然没有快捷方式),但也只接触引脚(似乎在 RX-TX-D1 中-D2
    发表于 05-25 06:11

    最新的AI键修图火爆全网,祖传PS要失业了# AI修图

    AI
    智哪儿
    发布于 :2023年05月22日 11:57:30

    《电子产品设计宝典可靠性原则2000条》+ 避免踩别人踩过的坑——一本非常由价值的经验总结分享书

    概览 封面是比较传统的工程类书籍的设计,比较低调,从书名就可以看出,是一本适合工程实践的经验分享总结书。 书已经是第二版了,印刷时间是2023年比较新,也说明书应该是比较受欢迎的。 从目录
    发表于 05-13 20:50