0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一款工具,借助深度学习模型可以一键抠去漫画中的文字

m3Fp_almosthuma 来源:机器之心 2020-01-27 11:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

漫画抠图是汉化组翻译中必不可少而又工作量很大的一项工作,主要内容是将漫画中的文字抠去,以便替换成另一种语言。现在,这项工作可以自动化地完成了,一位韩国的开发者开源了一款工具,借助深度学习模型可以一键抠去漫画中的文字,连背景图中的文字都可以被抠去,效果十分惊人。

很多人都喜欢看日本漫画,不少作品已经成为很多人心中的童年回忆。但是对于漫画的翻译人员来说,他们需要去除原有漫画的对话框和背景文字,并将其替换为读者使用的语言。由于一本漫画可能有数万个对话框和对话,因此工作量是很大的。

现在,抠图的工作人员可以基本上解放他们的双手了。只要你有 TensorFlow,就可以快速实现一键抠图,将漫画图像中的所有文字一键去除。

SickZil-Machine,一键抠图

SickZil 是韩文中的作者提供了一个视频,用于展示这一工具的效果。

作者同时提供了自动工具抠图的案例。

对话框中的文字可以被完全消除。

有时候会有些文字消除不干净的情况,但基本不影响画面(漫画右上角标题符号)。同时,背景中被去掉文字后,背景画面可以被自动补全,基本不改变画面效果(画面右上角背景文字)。

从视频中可以看出,这一工具非常的方便。只需要选择待处理的漫画,然后运行工具即可。如果有一些画面被误去除,或者有一些去除不干净的情况下,用户可以手动修改需要被去除的文字。

那么,这一工具背后是什么技术呢?

技术

模型架构

据项目作者介绍,这一工具背后使用了两个模型,第一个是 Seg Net,用于检测漫画中的问题。另一个则是 Compl Net,用于处理漫画图像,去除文字并补全缺失的图像部分。

Seg Net 使用的是 U-NET。这是一种编码器-解码器架构。编码器逐渐减少池化层的空间维度,解码器逐步修复物体的细节和空间维度。

U-Net 的架构,将输入图像逐步池化后进行上采样,从而还原图像细节。

而 Compl Net 使用的是 deepfill v2,这是一个用于对任意被 mask 的图像进行修复的模型,可以适应各种 mask 的方式(块状遮盖或线条遮盖都可以)。deepfill 是 Adobe 等机构提出一系列图像修复工具,机器之心也曾用过 deepfill v1,但是效果似乎没有论文展示的那么好。

目前 deepfill v2 并没有官方开源,但 GitHub 上有其他开发者复现。

deepfill v2 的模型架构,可以进行图像修复。

有了这两大神器,基本上可以实现漫画文字的检测识别和去除文本后的图像补全。

数据集和训练

有了模型还不够,很多读者想知道,整个系统是怎样训练的。

在 Seg Net 上,作者使用了原始的漫画图像和文本内容遮盖数据,用于覆盖原始漫画中所有的文字部分。在 Compl Net 上,模型的输入为被移除了文字的漫画图像。模型使用了 285 个图像-遮盖对和 31500 张漫画图像,其中有将近 12000 张漫画是有文字的,因此训练的数据比较平衡。

安装和使用

作者没有透露训练模型的相关参数,但是提供了开发者需要准备的硬件配置。 对于开发者而言,运行代码需要准备 NVIDIA 驱动 410.x,CUDA 10.0,CUDNN >= 7.4.1,TensorFlow 需要大于 1.13 版本。

配置代码步骤如下:

首先克隆相关代码:git clone https://github.com/KUR-creative/SickZil-Machine.git; cd SickZil-Machine

下载 zip 文件,地址:https://github.com/KUR-creative/SickZil-Machine/releases。

解压并复制文件:SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/cnet 和 SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/snet 到文件目录:SickZil-Machine/resource.

进入目录并安装:pip install -r requirements.txt

运行主程序:cd src; python main.py

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3655

    浏览量

    51750
  • 代码
    +关注

    关注

    30

    文章

    4942

    浏览量

    73197
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123949

原文标题:漫画汉化组福音:深度学习工具一键抠图

文章出处:【微信号:almosthuman2014,微信公众号:机器之心】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    借助电商 API,多平台客户评价一键抓取

    出错。借助电商平台的 API(Application Programming Interface),我们可以实现一键抓取多平台客户评价,高效自动化这过程。本文将
    的头像 发表于 08-11 14:49 593次阅读

    告别多设备!揭秘QM系列闪测仪如何一键搞定多元检测

    QM 系列一键闪测仪作为方案核心,搭载双视野双远心镜头与 2000 万像素 CMOS 传感器,测量精度可达 ±1μm。其内置的 AI 深度学习系统经过海量工业样本训练,能一键识别 50
    的头像 发表于 08-11 13:43 864次阅读
    告别多设备!揭秘QM系列闪测仪如何<b class='flag-5'>一键</b>搞定多元检测

    HarmonyOS应用一键置灰指南

    一键置灰通常应用于如下场景 1. 重大悼念活动: 在国家发生重大灾难、事故或举行悼念日等特殊时期,为了表达对逝者的尊重和哀悼,许多 APP 会将界面置灰。例如,在些地震、空难等灾难事件发生后,以及
    的头像 发表于 06-27 00:08 400次阅读

    U盘一键制作

    在电脑维修中启动盘很重要,靠谱的u盘一键启动制作方法
    发表于 05-06 16:10 44次下载

    Profinet邂逅ModbusRTU:印刷厂有网关“一键打通”通信链路

    Profinet邂逅ModbusRTU:印刷厂有网关“一键打通”通信链路
    的头像 发表于 04-08 17:11 444次阅读
    Profinet邂逅ModbusRTU:印刷厂有网关“<b class='flag-5'>一键</b>打通”通信链路

    三一挖掘机一键启动开关易坏的原因及更换注意事项

    关:安装完成后,先不要急于启动车辆,而是先测试新开关是否正常工作,确保切正常后再启动车辆。结论三一挖掘机的一键启动开关虽然设计精良,但在实际使用中仍可能出现易坏的问题。更换移动管家一键启动开关时,需要注意安全、使用适当的
    发表于 03-12 09:29

    为什么开关柜人机交互装置集成一键顺控,可以替代开关柜操显装置

    蜀瑞创新科普:开关柜人机交互装置集成一键顺控在功能集成与简化操作、智能化与远程监控以及可靠性与安全性等方面均表现出显著优势。这些优势使得集成一键顺控的人机交互装置能够替代传统的开关柜智能操作装置,成为现代智能电网发展的重要组成部分。
    的头像 发表于 03-07 10:21 1104次阅读
    为什么开关柜人机交互装置集成<b class='flag-5'>一键</b>顺控,<b class='flag-5'>可以</b>替代开关柜操显装置

    在OpenVINO™工具套件的深度学习工作台中无法导出INT8模型怎么解决?

    无法在 OpenVINO™ 工具套件的深度学习 (DL) 工作台中导出 INT8 模型
    发表于 03-06 07:54

    两轮车PKE无钥匙进入PKG一键启动系统设计

    两轮车无钥匙进入PKE 一键启动系统PKG
    的头像 发表于 03-04 10:20 834次阅读
    两轮车PKE无钥匙进入PKG<b class='flag-5'>一键</b>启动系统设计

    LoRa无线一键报警安防建设方案

    险情,不论是老人,还是小孩都可以一键紧急呼救,联动智能网关、手机APP等其他报警设备进行紧急求救。方案背景:•近年来,医患关系日趋紧张,患方辱骂、伤害、殴打医务人员
    的头像 发表于 02-28 14:41 1040次阅读
    LoRa无线<b class='flag-5'>一键</b>报警安防建设方案

    开关柜一键顺控在一键停电、一键送电中的作用

    蜀瑞创新为大家科普,开关柜一键顺控技术在一键停电和一键送电中发挥了快速响应、减少人为错误、提高安全性、简化操作流程、降低操作风险、提高送电成功率等综合优势,对于提升电力系统的运行效率、安全性以及自动化水平具有重要意义。
    的头像 发表于 02-27 09:13 1280次阅读

    如何保障10KV开关柜的一键顺控技术的安全性?

    通过上述综合性的安全措施,蜀瑞创新开关柜一键顺控方案可以显著提升10KV开关柜一键顺控技术的安全水平,确保其在实际应用中的稳定性和可靠性。同时,随着技术的发展,还需要不断评估和改进现有的安全措施,以应对新的挑战。
    的头像 发表于 01-16 09:09 881次阅读
    如何保障10KV开关柜的<b class='flag-5'>一键</b>顺控技术的安全性?

    石油行业中,开关柜一键顺控的作用

    蜀瑞创新为大家科普:在石油行业中,开关柜的一键顺控技术可以显著提高操作的安全性、效率和可靠性。一键顺控指的是通过个简单的操作指令(如按下按钮或点击屏幕上的图标),自动执行
    的头像 发表于 12-26 09:37 980次阅读
    石油行业中,开关柜<b class='flag-5'>一键</b>顺控的作用

    一款支持USB摄像头输入录像的高清录播机

    春源丽影4KR-05高清录像机,不仅支持HDMI输入进行4K高清录制,还支持USB高清摄像头输入录制!不仅可以录制4K高清音视频,还可以一键切为单独录音,可以录制无损MP3音频。支持
    的头像 发表于 12-24 16:01 1777次阅读
    <b class='flag-5'>一款</b>支持USB摄像头输入录像的高清录播机

    谷歌发布“深度研究”AI工具,利用Gemini模型进行网络信息检索

    据外媒最新报道,谷歌近期发布了一款名为“深度研究”的先进AI工具。这款工具借助其内部的Gemini大型语言
    的头像 发表于 12-16 09:35 1047次阅读