0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AIGC最新综述:从GAN到ChatGPT的AI生成历史

深度学习自然语言处理 来源:深度学习自然语言处理 2023-03-13 10:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一句话总结

本综述全面回顾了生成模型的历史、基本模型组件、AIGC从单模态交互和多模态交互的最新进展,以及模态之间的交叉应用,最后讨论了AIGC中存在的开放问题和未来挑战。

摘要

最近,ChatGPT 与 DALL-E-2 和 Codex 一起受到了社会的广泛关注。因此,许多人对相关资源产生了兴趣,并试图揭开其出色表现背后的背景和秘密。

实际上,ChatGPT 和其他生成式人工智能 (GAI) 技术属于人工智能生成内容 (AIGC) 的范畴,涉及通过人工智能模型创建数字内容,例如图像、音乐和自然语言。

AIGC 的目标是使内容创建过程更加高效和易于访问,从而能够以更快的速度制作高质量的内容。

AIGC是通过从人类提供的指令中提取和理解意图信息,并根据其知识和意图信息生成内容来实现的。

近年来,大型模型在 AIGC 中变得越来越重要,因为它们提供了更好的意图提取,从而改进了生成结果。

随着数据的增长和模型的规模,模型可以学习的分布变得更加全面和接近现实,从而导致更真实和高质量的内容生成。

本调查全面回顾了生成模型的历史、基本组件、AIGC 从单模态交互和多模态交互的最新进展。我们从单峰性的角度介绍了文本和图像的生成任务和相关模型。我们从多模态的角度来介绍上述模态之间的交叉应用。最后,我们讨论了 AIGC 中存在的开放性问题和未来的挑战。

论文:A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT
链接:https://arxiv.org/pdf/2303.04226v1.pdf
单位:CMU & Lehigh University

贡献

一共有三点贡献:

据我们所知,我们是第一个为 AIGC 和 AI 增强生成过程提供正式定义和全面调研的人。

我们回顾了AIGC 的历史和基础技术,并从单模态生成和多模态生成的角度对GAI 任务和模型的最新进展进行了全面分析。

我们讨论了AIGC 面临的主要挑战和AIGC 未来的研究趋势。

总体看

图像生成中的 AIGC 示例。向 OpenAI DALL-E-2 模型给出文本指令,它根据指令生成两张图像:

cdf9985c-c142-11ed-bfe3-dac502259ad0.png

AIGC整体图。一般来说,GAI模型可以分为两类:单峰模型和多峰模型。单模态模型从与生成的内容模态相同的模态接收指令,而多模态模型接受跨模态指令并产生不同模态的结果:

ce0fedf0-c142-11ed-bfe3-dac502259ad0.png

生成AI在CV、NLP和VL领域的历史:

ce2243b0-c142-11ed-bfe3-dac502259ad0.png

单模态

预训练大语言模型的大体类型:

ce5f9cf6-c142-11ed-bfe3-dac502259ad0.png

模型大小、训练速度在不同模型和计算设备的统计数据:

ce7c93ce-c142-11ed-bfe3-dac502259ad0.png

InstructGPT的架构:

ce9f3550-c142-11ed-bfe3-dac502259ad0.png

视觉分类的模型分类:

cf6d4cd8-c142-11ed-bfe3-dac502259ad0.png

视觉生成模型的基本框架:

cf8fb296-c142-11ed-bfe3-dac502259ad0.png

多模态

两种视觉语言编码类型:

cfac7d36-c142-11ed-bfe3-dac502259ad0.png

两种解码类型:

cfef0cb4-c142-11ed-bfe3-dac502259ad0.png

DALL-E-2模型结构:

d03beb24-c142-11ed-bfe3-dac502259ad0.png

KG-文本的生成模型的一种方法DUALENC:

d052678c-c142-11ed-bfe3-dac502259ad0.png

跨模态文本分子生成模型MoMu:

d10866fe-c142-11ed-bfe3-dac502259ad0.png

当前研究领域、应用与相关公司的关系图,其中深蓝色圆圈代表研究领域,浅蓝色圆圈代表应用,绿色圆圈代表公司:

d124d924-c142-11ed-bfe3-dac502259ad0.png

应用

生成AI模型应用:

d13cf108-c142-11ed-bfe3-dac502259ad0.png

AIGC的效率

prompt learning的通常流程:

d19b6aa8-c142-11ed-bfe3-dac502259ad0.png

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41966

    浏览量

    303061
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2391

    浏览量

    84921
  • ChatGPT
    +关注

    关注

    31

    文章

    1608

    浏览量

    10427
  • AIGC
    +关注

    关注

    1

    文章

    394

    浏览量

    3287

原文标题:AIGC最新综述:从 GAN 到 ChatGPT 的AI生成历史

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI大模型小龙虾-OpenClaw-0基础入门实战

    无可替代的适用性? 适用性的角度来剖析,OpenClaw 教程并不是要培养底层架构的造轮子者,而是精准切入了一大片被传统教育忽略的“应用型蓝海”场景。 一、 传统岗位的 AI 效率赋能与工具化改造场景
    发表于 05-06 16:04

    [完结15章]Java转 AI高薪领域必备-01打通生产级AI Agent开发

    数据的检索增强生成(RAG)系统。这也是Java+AI转型的技术深水区。 RAG绝非简单的向量检索,它是一项复杂的系统工程。Java工程师需要跨界理解自然语言处理(NLP)的基础技术链路:文档解析的容错
    发表于 04-30 13:46

    Java转 AI高薪领域必备 01打通生产级AI Agent开发 教程资料

    砍向这些高替代率、低附加值的基础开发岗位。继续在CRUD里死磕,就如同在一条通胀率远超收益率的赛道上狂奔,投入的每一分精力都在经历边际收益递减。 二、 AI Agent的商业破局:“代码执行者”
    发表于 04-29 17:08

    Codex操控Mac超级应用:OpenAI全面打响AI端侧入口“战争”?

    台“使用电脑上的所有应用”,并支持多代理同步工作。OpenAI特别强调“后台”属性,意味着智能体不会与用户“抢”电脑。而且,Codex现在也可以使用gpt-image-1.5模型来生成和迭代图像,开发者无需为了生成AI图像而切换
    的头像 发表于 04-20 09:37 4302次阅读

    虚拟实体:物理 AI 产业发展与核心感知硬件支撑

    人工智能正经历信息域物理域的范式跃迁,如果说传统生成AI是“会思考、会表达”的虚拟大脑,那么物理AI就是“会行动、会实践”的实体智能,
    的头像 发表于 04-03 13:14 1135次阅读
    <b class='flag-5'>从</b>虚拟<b class='flag-5'>到</b>实体:物理 <b class='flag-5'>AI</b> 产业发展与核心感知硬件支撑

    AI辅助编程设计之道:SpecCode工程实践

    大语言模型正在重塑软件开发的日常。Copilot各种编程助手,AI生成代码的能力已经渗透许多开发者的工作流中。但在实际应用中,一个现象
    发表于 03-16 13:33

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:AI硬件AI湿件

    ,又分为真菌计算和基于DNA的计算。 图4 基本的真菌计算机结构 在用化学和生物方法实现AI功能的过程中,要经历5个阶段,见图5所示。 图5 以化学和生物方法实现AI功能各阶段 期待AI
    发表于 09-06 19:12

    智能体化AI生成AI的区别

    步骤,甚至在没有明确指令时主动行动。举个例子:生成AI 可能会帮你生成一个“本周出差清单”,而智能体化 AI 会结合你的行程、天气和历史
    的头像 发表于 08-25 17:24 2009次阅读

    生成AI代理式AI:半导体技术赋能下一波创新浪潮

    AI领域始终在不断演进,我们正见证一场生成AI”时代“代理式AI”时代的深刻变革。这场变
    的头像 发表于 08-21 17:59 1758次阅读
    <b class='flag-5'>从</b><b class='flag-5'>生成</b>式<b class='flag-5'>AI</b><b class='flag-5'>到</b>代理式<b class='flag-5'>AI</b>:半导体技术赋能下一波创新浪潮

    【书籍评测活动NO.64】AI芯片,过去走向未来:《AI芯片:科技探索与AGI愿景》

    计算等类别AI芯片的及时、全面而富有远见的书。” 那么时至今日,这个世界发生了什么变化呢? 在这四年间,最重大的技术变革无疑就是大模型的横空出世,人类的时间仿佛被装上了加速器,ChatGPT
    发表于 07-28 13:54

    “出发吧!新疆”AIGC宣传片创作大赛全球征片中

    升级的创新突破。 「出发吧!新疆」2025新疆文旅AIGC宣传片创作大赛线下沙龙会。   7月6日当天,在北京举办了一场AIGC宣传片创作大赛线下沙龙,大赛评审团专家、资深AIGC创作者陈家伟表示:“
    的头像 发表于 07-14 10:38 821次阅读
    “出发吧!新疆”<b class='flag-5'>AIGC</b>宣传片创作大赛全球征片中

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    发表于 07-09 18:30

    边缘生成AI面临哪些工程挑战?

    本文由TechSugar编译自electronicdesign当大多数人想到人工智能(AI)时,他们通常能想到的是能够生成新文本、图像或语音内容的应用。像ChatGPT这样流行的文本应用(在几天
    的头像 发表于 06-25 10:44 1373次阅读
    边缘<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>面临哪些工程挑战?

    Gartner报告看Atlassian在生成AI领域的创新路径与实践价值

    Atlassian入选Gartner 2025生成AI技术"新兴领导者"!其核心AI产品Rovo依托Teamwork Graph,支持团队知识库中提取情境化的个性答案与洞察
    的头像 发表于 06-05 15:59 1322次阅读
    <b class='flag-5'>从</b>Gartner报告看Atlassian在<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>领域的创新路径与实践价值

    生成AI如何重塑设计思维与品牌创新?工具认知革命的跃迁

    ?作为深度参与AI与设计融合实践的观察者,我逐渐意识这场变革的本质不是简单的"人机协作",而是一场认知范式的迁移——就像文艺复兴时期透视法的发明永久改变了人类观察世界的方式,GAI正在重新定义"创造力"的疆域。 一、设计民主化背后的认知升级 传统设计流程
    的头像 发表于 05-30 15:55 782次阅读