0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI发布一款令人印象深刻的语言模型GPT-2

电子工程师 来源:yxw 2019-05-17 18:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

几十年来,机器一直在努力学习人类语言的微妙之处,深度学习的出现加速了这一进程。

今年2月,OpenAI发布了一款令人印象深刻的语言模型GPT-2,它可以写短篇小说、诗歌,甚至轻松辨别《哈利波特》和《指环王》中的角色。最近,一位加拿大工程师用它创建了一个向公众开放的文本生成器,只需提供一个句子,机器便能自动生成一则完整的新闻、故事、歌词、诗歌、食谱和代码等文本。

我们用吴亦凡在综艺节目《七十二层奇楼》中的一段freestyle(即兴说唱)——“你看这个面它又长又宽,就像这个碗它又大又圆”进行了创作。一起来看看人工智能的freestyle水平吧。

芒果TV综艺《七十二层奇楼》

人工智能版《大碗宽面》

这个名为talktotransformer的文本生成器由加拿大工程师亚当·金(Adam King)创建,它脱胎于OpenAI的大规模无监督语言模型GPT-2。talktotransformer使用的是GPT-2的精简版本,这个版本过去只开放给特定的科学家和记者。

在talktotransformer中输入文本“你看这个面它又长又宽,就像这个碗它又大又圆”后,人工智能创作出的歌词大意为:

你看这个面它又长又宽,

就像这个碗它又大又圆。

只需尝一口,你就知道是面条。

我的脸上,露出怀疑的表情。

这是真的,我的碗它变成了面条。

这简直太棒了。

当我回到家,我得到一些鸡翅。

我怎么会变得这么好?谁知道呢?

我从朋友和家人那里得到足够的爱,

我的味蕾开始变大。

当我要吃饭的时候,

它不再只是食物,它是我的想法。

我想要吃好喝好的生活。

talktotransformer模型的输出结果

通过阅读上述由人工智能模型输出的文字,我们很容易发现,机器输出了一些看似语义完整的句子,但其中的意思却让人摸不着头脑。这就是自然语言处理(NLP)的难题——由于缺乏常识,机器并不真正理解语言的含义。

就如2018年图灵奖获得者约书亚·本吉奥(Yoshua Bengio)在接受澎湃新闻(www.thepaper.cn)采访时所言,目前的自然语言系统其实并不理解句子的真正含义,机器“会犯一些非常愚蠢的错误,甚至没有两岁小孩的理解能力”。

talktotransformer.com页面

文思泉涌的OpenAI GPT-2语言模型

2019年2月,OpenAI发布了拥有15亿参数的大规模无监督语言模型GPT-2,它擅长处理语言建模和文本预测任务,还具备阅读理解、总结、翻译等能力。只要给出一个开头的句子,GPT-2就能生成一篇小文章、一则新闻故事,甚至在文本中使用引语和统计数据。如果给出的句子是一个短篇小说的开头,它会告诉你接下来在这些角色身上会发生什么事。

OpenAI加利福尼亚州实验室工程副总裁David Luan对美国科技媒体《边缘》(THE VERGE)表示,GPT-2能写出“非常合理的”、“称职的”论文,“是可以提交给美国大学入学资格考试(SAT)并取得好成绩的东西”。

GPT-2在人工智能社区引起了不小的关注,但OpenAI当时并没有开源这个系统。一方面,研究人员对该算法能做什么、不能做什么尚不明确;另一方面,他们担心这项技术被滥用——开源之后,如果有人向GPT-2提供种族主义、暴力、歧视女性或者辱骂性的文本,GPT-2将自动学习并持续地输入类似的内容。

不开源的决定引发了人工智能社区的不满,毕竟,开源是人工智能领域的优良传统。也许是反对的声音太大,OpenAI在5月初表示将逐步公开GPT-2,并开源了345M的预训练模型。后续,OpenAI将分析该语言模型对社会的影响。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41964

    浏览量

    303060
  • 语言模型
    +关注

    关注

    0

    文章

    575

    浏览量

    11370
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137420

原文标题:OpenAI能作词,我们输入吴亦凡的“大碗宽面”试了一把

文章出处:【微信号:smartman163,微信公众号:网易智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    GPT-5震撼发布:AI领域的重大飞跃

    跃升重新定义了人工智能的能力边界。OpenAI首席执行官山姆·奥特曼在发布会上直言:“这不仅是模型的升级,更是通往通用人工智能(AGI)的关键里程碑。”     GPT-5:集成
    的头像 发表于 08-09 07:44 1w次阅读
    <b class='flag-5'>GPT</b>-5震撼<b class='flag-5'>发布</b>:AI领域的重大飞跃

    OpenAI发布多款产品

    联系人"心理健康功能** 。三产品覆盖通用交互、行业专用和安全治理三个维度,释放出个清晰信号:OpenAI正在从"造最强模型"转向"让模型
    的头像 发表于 05-12 13:40 662次阅读

    OpenAI全新GPT-5.5依托NVIDIA基础设施驱动Codex

    超 1 万名来自不同职能部门的 NVIDIA 员工提前体验了 OpenAI 全新前沿模型位工程师表示,其结果“令人惊叹”。
    的头像 发表于 05-08 09:32 179次阅读

    OpenAI与Anthropic对战,Claude Opus 4.6与GPT-5.3-Codex同日发布

    电子发烧友网报道 北京时间2月6日凌晨,Anthropic与OpenAI分别推出了新版本基础大模型——Claude Opus 4.6和GPT-5.3-Codex。     Claude
    的头像 发表于 02-06 14:19 2185次阅读
    <b class='flag-5'>OpenAI</b>与Anthropic对战,Claude Opus 4.6与<b class='flag-5'>GPT</b>-5.3-Codex同日<b class='flag-5'>发布</b>

    上海交大发布国产光学大模型Optics GPT

    电子发烧友网综合报道 1月25日,上海交通大学正式推出光学领域垂直大语言模型——Optics GPT(光学大模型),这是一款完全自主研发的国
    的头像 发表于 01-26 09:59 2320次阅读
    上海交大<b class='flag-5'>发布</b>国产光学大<b class='flag-5'>模型</b>Optics <b class='flag-5'>GPT</b>

    谷歌正式发布Gemma Scope 2模型

    语言模型 (LLM) 具备令人惊叹的推理能力,但其内部决策过程在很大程度上仍然不透明。如果系统未按预期运行,对其内部运作机制缺乏可见性将难以准确定位问题根源。过去,我们通过发布 Ge
    的头像 发表于 01-24 14:01 820次阅读

    GPT-5.1发布 OpenAI开始拼情商

    OpenAI正式上线了 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有网友实测发现OpenAI
    的头像 发表于 11-13 15:49 889次阅读

    如何在TPU上使用JAX训练GPT-2模型

    如果您对如何使用 JAX 从头开始构建语言模型感到好奇,那么本文非常适合您。我们在 2025 年 Google Cloud Next 大会上举办了场关于此主题的研讨会,并获得了些很
    的头像 发表于 09-03 11:39 1871次阅读
    如何在TPU上使用JAX训练<b class='flag-5'>GPT-2</b><b class='flag-5'>模型</b>

    OpenAI开源模型登陆IBM watsonx.ai开发平台

    OpenAI 已向公众发布了两 AI 模型,允许开发者和企业可自由下载、运行并进行定制。其中一款模型
    的头像 发表于 08-26 15:36 1211次阅读

    NVIDIA从云到边缘加速OpenAI gpt-oss模型部署,实现150万TPS推理

      自 2016 年推出 NVIDIA DGX 以来,NVIDIA 与 OpenAI 便开始共同推动 AI 技术的边界。此次 OpenAI gpt-oss-20b 和 gpt-oss-
    的头像 发表于 08-15 20:34 2605次阅读
    NVIDIA从云到边缘加速<b class='flag-5'>OpenAI</b> <b class='flag-5'>gpt</b>-oss<b class='flag-5'>模型</b>部署,实现150万TPS推理

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型体机上的原生适配与优化,用户可
    的头像 发表于 08-14 11:34 1652次阅读

    讯飞星辰MaaS平台率先上线OpenAI最新开源模型

    8月6日凌晨,OpenAI 时隔六年再次回归开源,发布全新的大语言模型gpt-oss-12
    的头像 发表于 08-13 16:43 2056次阅读

    SuperX全新发布多种规格的多模型体机:全新定义企业级智能生产力

    体机将预搭载OpenAI最新发布GPT-OSS-120B 和 GPT-OSS-20B性能卓越的大
    的头像 发表于 08-08 08:52 755次阅读
    SuperX全新<b class='flag-5'>发布</b>多种规格的多<b class='flag-5'>模型</b><b class='flag-5'>一</b>体机:全新定义企业级智能生产力

    OpenAI或在周五凌晨发布GPT-5 OpenAI以低价向美国政府提供ChatGPT

    外界直在期待的OpenAI代大语言模型GPT-5或将
    的头像 发表于 08-07 14:13 1.6w次阅读

    OpenAI发布2开源模型

    OpenAI开源了两高性能权重语言模型gpt-oss-120b和gpt-oss-20b,
    的头像 发表于 08-06 14:25 1205次阅读