0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

像在word里一样便捷地编辑图像中的文字

nlfO_thejiangme 来源:lp 2019-03-08 09:38 次阅读

你想像编辑word文本一样便捷地编辑照片中的文字吗?像这样:

和这样:

让别人感觉不到任何人为编辑的迹象:

近日来自印度的研究人员们近日提出了一种基于自编码模型的字符替换方法,通过字符生成、颜色调节和重置完成对图像中目标文字的修改,并且能生成十分自然的图像,图像中被编辑过的文字毫无违和感。图片上的文字信息对于我们理解图片十分重要。字符的缺失和改变有的时候会严重的影响我们对于图像内涵的理解。除了会造成忍俊不禁的错别字,有时候还会让人们误解造成严重的损失!

另一方面,对于不同视角、环境下得到字符缺失的图片,如何进行有效的编辑和修复也是视觉领域一个重要的问题,甚至对于古文献修复和案件侦破都有着重要意义。

像编辑文本一样编辑图像中的文字

如果我们能够像文本编辑器一样编辑图像中的文字就好了。先前的人员提出过基于字符几何特征的合成方法,但却缺乏泛化性。但随着深度学习的发展,研究人员提出了利用GAN来进行字符生成,但基于GAN生成字符进行编辑的方法也需要面临一系列问题。首先基于GAN的生成需要对目标字符进行精确的识别,但字符识别本身就是一个复杂的问题,任何误差都会在整个过程积累十分有可能造成字符编辑的错误;其次,字符在同一张图像内具有多种字体类型,GAN模型需要对字体进行多次观察,并在生成前对字符进行较为严格的字体去失真过程,这对于不同情况下的字符编辑来说十分复杂。

所以研究人员聚焦字符级别的生成模型,来代替单词级别的生成模型最大化模型的灵活性和适应性。那么为了编辑图像中的文字,怎样才能又快又好呢?你需要四个步骤:定位到你要修改的字符、生成目标字符、调整目标字符的颜色、将字符融合回图像中去。这一工作的核心在于解决如何生成具有相同字体的目标字符,并为它赋予原字符相同的颜色风格。为此,研究人员提出了下图所示的FANet和ColorNet联合完成。

首先选取需要修改的字符,并利用算法将原字符转变为二值图像输入网络。FANet首先通过一个三层卷积和两次全连接将输入字符编码到512长度的向量上,其中包含了字体的风格信息。此外,目标字符的编码通过26个字符的独热编码转换到512维的编码上与先前得到的输入字符图像编码拼接得到1024维的隐空间编码。随后利用两个全连接和三次上采样最终得到与原字符相同风格的目标字符。但这时候的字符还没有颜色。那么就把原字符的颜色信息拿过来,继续进行处理。通过编码器解码器的结构,将原字符上的颜色信息迁移到了新字符上。最后对原图的对应区域进行背景去除,区域连续性处理,将得到的新字符放到合适的位置就可以得到修改后的图片了!来看看效果~~

这本jave书有点厉害!

看到这些图,你可能会觉得这些路标好像和上次看到的不一样了!

为了训练这个网络,研究人员们利用了谷歌字符库中的1000中字体,其中训练集中包含了67.6万个数据,验证集则有20.2万个数据。

最终的网络不仅可以编辑字符,同时还能由输入的单一字符生成出全部26个字母的新字体,下图中的的字体都是由一个输入字符生成出来的。

同样颜色也可以迁移,下图中的第二行表示输入字符的颜色,第三行就是将第二行的颜色迁移到第一行字符的结果。

中文字符

那么按道理,我们也可以开心的编辑照片中的汉字了。华中科技大学和旷视去年就提出了一篇可以生成各种风格汉字书法的工作,利用生成器和判别器实现了中文书法字符的合成。

这是文章中的网络结构:

和最后得到的结果:

我们可以基于同样的思路将图像中的中文字符也进行转换,把照片中的汉字都变成优秀的书法作品啦。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • word
    +关注

    关注

    1

    文章

    77

    浏览量

    21729
  • 图像
    +关注

    关注

    2

    文章

    1063

    浏览量

    40029
  • 编码
    +关注

    关注

    6

    文章

    834

    浏览量

    54452

原文标题:如何如文本般顺滑来编辑照片中的文字?

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Word文字录入技巧

    Word文字录入技巧1.1.1  叠字轻松输入在汉字中经常遇到重叠字,比如“爸爸”、“妈妈”“欢欢喜喜”等,在Word输入时除了利用输入法自带的功能快速输入外,还有没有其
    发表于 03-10 17:51

    word按空格自动删除后面的文字

    养成碰到问题及时解决的习惯。原因分析:可能是不小心碰到Insert键了,按了这个键就会把平常WORD输入文字时的插入状态变成改写状态了,在改写状态下,你每输入个字符,就会自动把插入
    发表于 01-05 23:27

    pdf文件文字怎么进行编辑

    文件文字怎么编辑,发现百度出来的步骤好多,觉着好麻烦。所以又去百度有什么pdf编辑器可以简单操作修改pdf文件今天小编就把我知道的款好
    发表于 07-10 10:29

    把图片文字转换成word真的只需要这四步

    了方法,就和添加文字一样简单了。 这里向大家推荐款捷速OCR文字识别软件。这是款识别效果十分好的文字
    发表于 07-26 10:40

    在Labview Communication Design System Suite如何创建属性节点,就像在labview右键创建属性节点一样

    在Labview Communication Design System Suite如何创建属性节点,就像在labview右键创建属性节点一样
    发表于 02-03 14:40

    LabVIEW 怎么可以实现竖排文字显示,类似Office Word 竖排文本框一样

    LabVIEW 图表可以添加注释列表,功能是在图表写入文字类的说明,但是文字都是横版的, 有没有可能竖排显示。
    发表于 07-12 19:00

    打印雕刻激光怎么可以像打印机一样下位机直接与pc通讯后执呢

    新手不知道问题应该怎么问因为理性上 不理解找了很多相关资料还是没找首先不管是打印雕刻还是激光都是上位机和下位机那么图像文字是通过上位机与下位机通讯执行的怎么可以像打印机一样下位机直接
    发表于 01-14 09:09

    请问怎么把OV7670的图像通过wifi传到服务器?

    RT,谁能帮我讲解下,我现在想做个监控,想通过wifi把图像传到服务器那里,可以实现实时操控。现在毫无头绪。。。另外还有实验36面,camera_refresh()这个函数
    发表于 02-13 15:13

    程序编辑器结果不一样

    有个程序段int i=1;int j=0;j=((i++)*(i++));printf(“%d,%d\n”,i,j);在不同的编辑器结果为什么不一样 我用虚拟机的VI编辑结果i=3;j=1;用C++
    发表于 03-13 02:22

    请问怎么将WORD文字复制到虚拟机Linux的VI编辑

    如何将WORD文字复制到虚拟机Linux的VI编辑
    发表于 03-27 07:45

    如何实现图片转Word文档

    脱轨了,现在有个图片转word便捷方法,可以轻松帮你提取图片中的文字信息,快来试试吧!使用工具:迅捷OCR文字识别工具;操作方法:第二步:
    发表于 04-19 15:05

    CAD图纸的CAD文字复制到Word文档变成了黑色框怎么办?

    我们在使用浩辰CAD制图软件绘制完成图纸后,有些时候将CAD图形复制到Word文档后部分CAD文字出现了问题,这个时候该怎么解决呢?接下来给大家介绍下问题产生的原因以及解决方法吧!
    发表于 01-20 11:00

    如何制作类似word软件的下拉选项卡界面

    我要实现的功能如下图所示,即像WORD一样,不点击某个菜单时,下面的选项卡不可见,当点击某个菜单时出现下拉选项卡,选中某个按钮后又自动消失。LABVIEW的选项卡控件只能将某个菜单连同其页面上的按钮
    发表于 03-09 15:15

    有哪几种办法可实现单片机像在pc终端一样打印log呢

    有哪几种办法可实现单片机像在pc终端一样打印log呢?stm32实现printf打印log的办法有哪些呢?
    发表于 12-01 06:39

    请问在emwin TEXT控件文字可以更改吗?

    请问在 emwinTEXT控件文字可以更改吗?如果字体不一样,修改了字体,能不能改?谢谢
    发表于 11-06 08:22