0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI为表情包生成搞笑文字说明

NVIDIA英伟达企业解决方案 来源:未知 作者:胡薇 2018-07-31 17:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

制作表情包还能获得研究生学分?如果使用深度学习技术来实现的话,是有可能的。

23岁的Lawrence Peirson正在攻读斯坦福大学的理论天体物理学博士学位,但今年却决定进修几门AI课程。在一个班级项目中,他和自己的同班同学E.Meltem Tolunay开发了一个神经网络,可为表情包生成说明文字。他们发布了一份关于该网络的白皮书,其标题十分贴切:“Dank Learning”(“Dank”是“Cool”的同义词)。

虽然现在已经存在很多训练深度学习模型为图片生成文字说明的例子。例如,准确地为一张图片生成说明性文字“踏着冲浪板的男人”或“拿着蛋卷冰淇淋的孩子”。但对于表情包,Peirson想挑战一下神经网络能否突破字面解释,创造出具有幽默感的文字说明。

尽管一开始Peirson对所生成表情包的趣味性持怀疑态度,但最终他发现深度学习模型确实可以生成“一些非常有趣的原创幽默内容”。

获得“深度表情包”

该神经网络为一类流行的动物表情包生成说明文字。为了收集用于训练该深度学习模型所需的数据,Peirson从memegenerator.net网站上搜集了大约40万个由用户生成的表情包。该网站提供各类表情包模板,并允许用户自己搭配文字说明。

该数据集包含大约3000个基本图像,每个图像都配有多种不同的文字说明。由于输入数据均来自用户,深度学习模型所处理的表情包文字说明的质量良莠不齐。

“我们使用了40万个表情包,其中的大部分没有那么有趣,但是至少它们能够教会系统表情包是什么,以及什么样的笑话才是与图片内容相关的,”他说道。

互联网表情包在网络上早已流传多年,Reddit、Facebook、9GAG和Quick Meme等网站是它们的大本营。最火爆的表情包可能会配有超过200万种原创文字说明。

表情包引用的通常是流行文化、时事或某个特定的互联网亚文化群体才明白的“梗”。(Peirson创建了一个名为“The specific heat capacity of europium at standard temperature and pressure”的表情包页面。)

这些表情包同时汲取了数字文化的精华与糟粕。其论文指出,训练数据中大多是关于咒骂、种族主义和性别歧视的表情包。Peirson觉得需要在未来训练中过滤掉这些内容,但他指出这一问题并不是表情包所独有的,“这在自然语言处理中是一个普遍存在的大问题”。

该深度学习模型利用CUDA语言编写,使用了一块NVIDIA GPU。Peirson和Tolunay同时尝试了使用无标记的数据和标有表情包标题的数据(例如,成功小子或暴走漫画),但并没有发现表情包的质量有任何显著差异。

“这些表情包非常有趣,不过是‘也还说得过去,但其实并不是那么搞笑’这种程度,” Peirson说道,“表情包就是借用了这种幽默感。

该神经网络为此类动物表情包生成了说明文字。

让表情包变酷可不容易

为了评估深度学习模型成功与否,两人开发了一个“困惑指数”(perplexity score),用其检查神经网络是否可以明确识别出数据的模式。他们针对几百张带有预设格式的表情包计算出了“困惑指数”。如Boromir(电影《魔戒》中的角色)表情包,该表情包的文字说明始终都带有“one does not simply”的字样。

但对于表情包的真正考验在于其是否搞笑。

在一项定性调查中,Peirson与其白皮书的共同作者同时向受访者展示了人类创作的表情包和深度学习模型生成的表情包。他们向受访者提出了两个问题:“表情包是由人类创作的还是由计算机创作的?”,以及“如何评价表情包的幽默程度?”。

Peirson表示,访问结果显示深度学习模型创作的表情包“与人类创作的表情包几乎无法区分”。

他们还研究了其神经网络如何为训练数据集之外的表情包生成文字说明。在这种情况下,算法会基于其在训练数据中看到的内容推理未知图像的模式。为了测试这一点,Peirson甚至向深度学习系统展示了他自己的照片,生成的文字也相当有趣。

Peirson在深度学习模型中输入了自己的照片,模型生成了这张表情图。

表情包通常会进行病毒式传播,并成为“网红”,而以表情包为主题的白皮书也受到了欢迎。当该项目获得媒体报道并受到关注时,Peirson表示自己“倍感震惊”。一款名为Dank Learning的移动应用也即将登陆App Store。

他说,这个项目让他打开了新的视角:原来表情包的影响力如此巨大。每天,全球有数百万用户在社交媒体网站上传播表情包。

在Peirson看来,强大的AI有潜力根据时事“突发奇想”,生成表情包,从而影响公众认知。而广告主也可以使用表情包提升品牌知名度:“让表情包进行病毒式传播是一种绝妙的营销方式。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42239

    浏览量

    303275
  • 深度学习
    +关注

    关注

    73

    文章

    5614

    浏览量

    124821

原文标题:表情包生产基地:AI像人类一样为图像生成搞笑文字说明

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI辅助编程设计之道:从Spec到Code工程实践

    Spec集足够清晰时,AI才能基于它生成符合预期的代码。 实践中发现,Spec的细致程度可以通过“生成-验证”的迭代来判断。将当前版本的设计文档喂给AI
    发表于 03-16 13:33

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    和关联性 AI驱动科学:研究和模拟人类思维和认识过程。 本章节作者我们讲解了第五范式,介绍了科学发现的一般方法和流程等。一、科学发现的5个范式 第一范式:产生于公元1000年左右的阿拉伯世界和欧洲
    发表于 09-17 11:45

    智能体化AI生成AI的区别

    生成AI 的核心是“生成内容” —— 比如用大模型写报告,是对输入指令的被动响应。而智能体化 AI(Agentic AI)的关键是 “自
    的头像 发表于 08-25 17:24 2050次阅读

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    任务。这套系统艺术市场、教育行业和内容平台提供了一种实用的工具,有效应对AI生成内容带来的挑战。虽然有些识别会出错,但是还是值得继续优化以及探讨方案的可行性。
    发表于 08-21 13:59

    HarmonyOSAI编程DevEco AI辅助编程工具

    DevEco AI辅助编程工具(CodeGenie)基于BitFun Platform AI能力平台,开发者提供高效的应用与服务AI编程支持,支持智能知识问答、代码
    发表于 08-18 14:54

    HarmonyOS AI辅助编程工具(CodeGenie)卡片生成

    基于AI大模型理解开发者的卡片需求信息,通过对话式的交互智能生成HarmonyOS万能卡片工程。 一、 使用约束 建议从以下维度描述卡片需求: 序号 建议描述维度 说明 举例 1 卡片用途 卡片
    发表于 08-12 11:04

    HarmonyOS AI辅助编程工具(CodeGenie)概述

    DevEco AI辅助编程工具(CodeGenie)基于BitFun Platform AI能力平台,开发者提供高效的应用与服务AI编程支持,支持智能知识问答,同时支持ArkTS代码
    发表于 08-11 14:31

    求助,关于NanoEdge AI Studio生成的库交叉编译器版本疑问求解

    20231009\", 那么问题来了,怎么在NanoEdge AI Studio设定交叉编译器呢,比如设置armcc、armclang、iccram,因为我需要将库加到keil或者iar工程里面。 看样子这个软件生成的库是a
    发表于 08-08 07:25

    生成AI 重塑自动驾驶仿真:4D 场景生成技术的突破与实践

    生成AI驱动的4D场景技术正解决传统方法效率低、覆盖不足等痛点,如何通过NeRF、3D高斯泼溅等技术实现高保真动态建模?高效生成极端天气等长尾场景?本文您系统梳理
    的头像 发表于 08-06 11:20 5509次阅读
    <b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 重塑自动驾驶仿真:4D 场景<b class='flag-5'>生成</b>技术的突破与实践

    AI生成的测试用例真的靠谱吗?

    软件测试正经历一场深刻的技术革命。AI,尤其是以GPT、通义千问、文心一言、Claude等代表的大语言模型(LLM),开始广泛介入测试流程:从需求分析、测试用例设计,到脚本生成与测试报告撰写,
    的头像 发表于 08-01 10:02 1984次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>生成</b>的测试用例真的靠谱吗?

    求CS32A010K8V7的库函数使用教程

    请问有CS32A010K8V7的库函数使用教程吗,官网的库函数自带的文字说明感觉不是很看得明白呢
    发表于 07-18 23:20

    HarmonyOS AI辅助编程工具(CodeGenie)UI生成

    UI Generator基于BitFun Platform AI能力平台,用于快速生成可编译、可运行的HarmonyOS UI工程,支持基于已有UI布局文件(XML),快速生成
    发表于 07-10 11:51

    关于鸿蒙App上架中“AI文本生成模块的资质证明文件”的情况说明

    检查结果“通过”或审核状态“审核通过”。 那么对于这个问题,我也是尝试去解决……这里分享一下我了解到的情况和方法 首先,这个政策虽然说是针对AI文本生成模块,但实际上,针对的是所有
    发表于 06-30 18:37

    生成AI爆发,企业还没AI革命做好准备

    当前,生成AI(GenAI)的能力正以约每六个月翻倍的速度迭代,但多数企业的应用进展仍停留在缓慢的线性增长中,甚至还在观望。这种差距导致企业逐渐落后,无法释放AI带来的巨大商业价值。哈佛商学院教授
    的头像 发表于 06-18 23:10 900次阅读
    <b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>爆发,企业还没<b class='flag-5'>为</b><b class='flag-5'>AI</b>革命做好准备

    谷歌新一代生成AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI 上推出新一代生成AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 1397次阅读