0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用深度学习,制作“图片+文字”型的表情包

DPVg_AI_era 来源:未知 作者:李倩 2018-07-03 10:14 次阅读

深度学习生成表情包,笑不笑由你。

自从有了表情包,跟人聊天时的第一反应,就是去找找看有什么适合的表情。

有一类表情包,形式是文字+图,尤其能够精妙地抒发和传递感情。

在这一点上,可能全世界的网友都一样。

好用的表情永远不嫌多,而且似乎总是不够用。

怎么办?

好在我们有深度学习。

表情包,一个天然的图说生成问题

斯坦福大学的Abel L. Peirson V和E. Meltem Tolunayl,在这一期斯坦福深度学习自然语言处理课程CS224n的期末作业中,提交了一个表情包生成器,使用深度学习,制作“图片+文字”型的表情包。

下面这些都是他们的系统自动生成的结果。不得不说,深得表情包制作精髓。

这个表情包生成器的基本的框架是一个编码器-解码器图说生成系统,先进行CNN图像嵌入,然后用一个LSTM RNN进行文字生成。

其中,编码器的目标是要给出一个有意义的状态,让解码器开始进行文字生成。他们使用在ImageNet上预训练的Inception-v3做为编码器模型,并将最后一层隐藏CNN作为编码器的输出。当表情包模板进入Inception模型后,输出是一组长度固定的向量,也即图像嵌入,能够反映图像的内容。这个图像嵌入之后会被投射到词嵌入空间里,方便后续文字生成。

他们一共尝试了3种不同的编码器模型,最简单的一种只输入图像,另一种输入图像和标签,最后一种的输入也是图像和标签,但使用了注意力机制。至于解码器,都是一个单向LSTM。这样搭配组合成了3种编码器-解码器方案。下图展示了第二种方案的模型。

学习40万个表情,幽默程度媲美人类

数据集是这个表情包生成器的精髓。他们的数据集由大约40万张带标签和图说的图片组成。其中有2600个独特的图像-标签对,是他们写Python脚本从Memegenerator.net中获取的。一张图片对应一个标签,标签是对这幅图的简单描述,而每张图都与很多不同的图说(大约160个)相关联。

下图展示了数据的样本:

在训练前,他们还针对图说中的标点、格式和某些词出现的频率等进行了预处理。

训练的结果,深度学习生成了各种表情:

系统看过的图像(左边4张)的输入标签是来自训练集的标签,而对于没见过的图像(右边4张),我们使用的句子是“AI是新的电力”。

从语法、搞笑程度和可区分性(分辨是人制作的还是深度学习生成的)几个维度判断,深度学习表情包生成器取得了不错的效果。尤其是搞笑程度,因为这一点是制作表情包的初衷,普通表情包的搞笑程度7分(满分10分),深度学习生成的表情包最高达到了6.8。

两位作者指出,幽默是很难评判的事情,本身就是一个很深的研究领域。他们的这项工作十分基础,接下来如果能构建出能够自动断句的表情包生成器(就是自动判断图片上方和下方两行文字从哪里断开),将会是一个很大的进步。(因为使用的都是网络热图,因此数据含有性别歧视和不文明的成分。)此外,探索视觉注意力机制在表情包生成中的作用,也是一个不错的研究方向。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    41

    文章

    3356

    浏览量

    131421
  • 深度学习
    +关注

    关注

    73

    文章

    5224

    浏览量

    119865
  • cnn
    cnn
    +关注

    关注

    3

    文章

    326

    浏览量

    21294

原文标题:深度学习了40万个表情,一大波AI 表情包来了

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    表情识别-深度学习探索情感

    来源:易百纳技术社区 随着人工智能技术的不断进步,深度学习成为计算机视觉领域的重要技术。微表情识别作为人类情感分析的一种重要手段,受到了越来越多的关注。本文将介绍基于深度
    的头像 发表于 08-14 17:27 1345次阅读
    微<b class='flag-5'>表情</b>识别-<b class='flag-5'>深度</b><b class='flag-5'>学习</b>探索情感

    表情一起玩(表情动画制作软件)

    即可缓存到本地,随时可以快速查找使用; <br/>5.快速编辑制作表情,添加任意文字,只需数秒就可以做出你想要的表情,可保存和使用编辑方案模版,</p&
    发表于 04-27 17:31

    如何制作QQ表情的安装?如何制作eip文件?

    如何制作QQ表情的安装?如何制作eip文件?[hide]第一步:制作BMP, JPG, GIF格式的QQ
    发表于 05-07 08:39

    利用深度无盘快速制作通用的方法

    利用深度无盘快速制作通用的方法相信论坛里有不少的网管朋友都想想节约时间快速的完成一家网吧的无盘施工吧,特别是那些维护比较多的网吧,经常为了安装操作系统、上传系统感到麻烦。这个时候有人就会想到通用
    发表于 07-18 16:38

    32灯心形花样流水灯制作 图片 没有文字。。。。

    只有图片 没有文字。。。。
    发表于 02-23 12:50

    图片文字转换成word真的只需要这四步

    了方法,就和添加文字一样简单了。 这里向大家推荐一款捷速OCR文字识别软件。这是一款识别效果十分好的文字识别软件,软件采用的是深度图片多层次识别技术,借助强大的
    发表于 07-26 10:40

    深度学习脱掉图片人物的裤子之python教程

    深度学习脱掉图片人物的裤子【python教程】
    发表于 05-22 13:19

    深度学习中的图片如何增强

    深度学习中的图片增强
    发表于 05-28 07:03

    深度学习模型是如何创建的?

    嵌入式系统已被证明可以降低成本并增加各个行业的收入,包括制造工厂,供应链管理,医疗保健等等。本文将介绍有关深度学习嵌入式系统的信息。深度学习模型是如何创建的?创建
    发表于 10-27 06:34

    C#教程之图片上绘制文字

    C#教程之图片上绘制文字,很好的C#资料,快来学习吧。
    发表于 04-20 11:13 5次下载

    深度学习图片压缩算法,可以节省55%带宽

    通过深度学习技术设计压缩算法不仅能在不借助HEVC的情况下设计出更适合商用的更高压缩比的图片压缩算法,还可以在保持图片画质同时,尽可能降低图片
    的头像 发表于 03-14 13:31 6330次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>为<b class='flag-5'>图片</b>压缩算法,可以节省55%带宽

    AI为表情包生成搞笑文字说明

    制作表情包还能获得研究生学分?如果使用深度学习技术来实现的话,是有可能的。
    的头像 发表于 07-31 17:38 7412次阅读

    深度学习下的AI微表情研究

    对微表情的研究,在方法上事实上类似于人脸识别,一般包含检测和识别两个具体问题。 对于人脸识别,一般都是先进行人脸检测,然后对检测到的人脸进行识别。这个过程同样也适用于微表情识别:先从一段长视频中把发生微表情的视频片段检测出来,然
    的头像 发表于 09-28 01:31 5842次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>下的AI微<b class='flag-5'>表情</b>研究

    曝腾讯QQ发生崩溃 部分群聊无法发送文字图片

    3月10日午间,腾讯QQ突然出现崩溃现象,部分群聊无法发送文字图片内容,只能发送表情、文档。
    的头像 发表于 03-10 14:27 3240次阅读

    面部表情识别技术的最新研究进展

    面部表情识别技术是人工智能领域的研究热点之一,对于揭示情感状态和心理状况具有重要意义。本文将介绍面部表情识别技术的最新研究进展,包括深度学习、多模态融合、微
    的头像 发表于 08-21 17:58 636次阅读