0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软开源的 AI 工具介绍-Bringing-Old-Photos-Back-to-Life

工程师邓生 来源:HelloGitHub 作者:Ziyu Wan 2020-11-25 17:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

写在前面

在 GitHub 热点趋势Vol.046 中,HG 介绍过一个微软开源的 AI 工具——Bringing-Old-Photos-Back-to-Life

它可以让破损、残旧的图片焕发新生,在本周更是获得近 3k star。 而本文则是项目团队成员 Ziyu Wan 发布于 Hacker News 的项目介绍,Enjoy it~

概述

我们打算通过深度学习的方法来修复老化严重的旧照片。与传统的监督式学习 supervised learning 的修复任务不同,真实照片的老化更为复杂,合成图像和真实旧照片之间的领域差距 domain gap 使得网络无法泛化。因此,我们提出了一种利用真实照片和大量合成图像对的新型三重域翻译网络。具体来说,我们训练了两个变分自编码器 (VAE),分别将旧照片和干净照片转换为两个潜在空间。 通过合成配对数据来学习两个潜在空间之间的转换。因为在紧凑的潜在空间中,domain gap 是封闭的,所以这种翻译网络可以很好地泛化为真实照片。

此外,为了解决混杂在旧照片中的多个退化问题,我们设计了一个带有 partial nonlocal block 的全局分支,用于处理结构性缺陷,如:划痕、尘点,和一个局部分支,用于处理非结构性缺陷,如:噪点、模糊。两个分支在潜在空间融合,提高从多个退化问题中恢复旧照片的能力。该方法在相片修复的视觉质量方面优于现有的方法。

架构全览

我们首先训练两个变分自编码器 VAE:VAE1 用于真实照片 r ∈ R 和合成图像 x ∈ X,通过联合训练一个对抗判别器缩小它们的 domain gap;对干净图像 y ∈ Y 进行 VAE2 训练。利用 VAE 将图像转换到紧凑的潜在空间。

我们了解了在紧凑潜在空间将损坏的图像恢复到带 partial non-local block 的干净照片的映射。

对比图

更多修复细节

近距离围观

团队成员 Ziyu Wan 对 Bringing-Old-Photos-Back-to-Life 的介绍已经翻译完毕,感兴趣的小伙伴可以去把玩下,项目地址:

https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6722

    浏览量

    107360
  • AI
    AI
    +关注

    关注

    89

    文章

    38171

    浏览量

    296892
  • 开源
    +关注

    关注

    3

    文章

    4038

    浏览量

    45578
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    对于指令集中back2back情况的简单介绍

    1. 什么是back2back问题 在分析上述问题之前,我们先来想这么一个问题:对于无符号二进制数,两个4位数相乘需要一个几位的寄存器才能保证结果没有溢出呢?答案是我们需要用一个8位的寄存器来存
    发表于 10-23 06:52

    开源鸿蒙MNN AI应用开发与MNN移植经验

    本期内容由AI Model SIG提供,介绍了在开源鸿蒙中,利用MNN开源框架开发AI应用以及基于MNN源码编译与Har包封装的方法。
    的头像 发表于 09-04 11:31 3661次阅读
    <b class='flag-5'>开源</b>鸿蒙MNN <b class='flag-5'>AI</b>应用开发与MNN移植经验

    微软开源GitHub Copilot Chat,AI编程迎来新突破

    30分,微软首席执行官Satya Nadella向大家展示了VS Code的最新AI开源编辑器GitHub Copilot Chat。 GitHub Copilot Chat的一大技术亮点是其支持
    的头像 发表于 07-02 09:34 835次阅读
    <b class='flag-5'>微软</b><b class='flag-5'>开源</b>GitHub Copilot Chat,<b class='flag-5'>AI</b>编程迎来新突破

    开源鸿蒙工程工具分论坛圆满举办

    近日,开源鸿蒙开发者大会2025(OHDC.2025)工程工具分论坛在深圳圆满举办。本次分论坛由开源鸿蒙IDE SIG组长、华为终端BG工程工具技术专家唐春担任出品人,主题为“
    的头像 发表于 06-05 15:35 824次阅读

    微软推出多项革新性AI工具

    在今年Microsoft Build大会上,微软推出了多项革新性Al工具:智能Microsoft 365 Copilot副驾驶Tuning支持企业通过低代码方式,结合自有数据与业务逻辑定制高精度AI
    的头像 发表于 05-26 09:47 913次阅读

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    正式提出“智能体化用户体验”方向,并启动“天玑智能体化体验领航计划”。更值得注意的是,其三大AI工具链的发布——天玑开发工具集、AI开发套件2.0,以及升级的天玑星速引擎与旗舰芯片天玑
    发表于 04-13 19:52

    AI开发工具分类与功能

    当下,AI开发工具不仅简化了AI开发的复杂流程,还提高了开发效率,推动了AI技术的广泛应用。下面,AI部落小编为大家
    的头像 发表于 04-12 10:12 1045次阅读

    开源AI MPU

    1. 基于RISC-V的开源AI MPU/加速器 ‌ ‌**(1) SiFive Intelligence系列**‌ ‌ 特点 ‌:SiFive提供开源的RISC-V IP核,支持AI
    的头像 发表于 04-02 17:44 2149次阅读

    Banana Pi 与瑞萨电子携手共同推动开源创新:BPI-AI2N

    与嵌入式系统的优势,该联合解决方案旨在打造更开放、更灵活的软硬件平台。 “此次合作将提升瑞萨在开源社区的知名度。基于 RZ/V2N 的突破性 BPI-AI2N SOM 有望对多个行业产生重大影响,为工程师
    发表于 03-12 09:43

    2024年AI编程技术与工具发展总结

    最近,开源中国 OSCHINA、Gitee 与 Gitee AI  联合发布了《2024 中国开源开发者报告》 。 报告聚焦 AI 大模型领域,对过去一年的技术演进动态、技术趋势、以及
    的头像 发表于 02-13 09:11 1489次阅读
    2024年<b class='flag-5'>AI</b>编程技术与<b class='flag-5'>工具</b>发展总结

    Photos大升级!铁威马NAS携手AI,打造智能相册新时代

    般横空出世 霸屏多条热搜 让人直呼 “AI,你还有多少惊喜是朕不知道的?!” 正当我们还在为DeepSeek的神奇惊叹不已时 铁威马NAS也悄悄玩起了AI新花样! 它的Photos功能最近迎来了一次华丽转身 直接拥抱
    的头像 发表于 02-11 16:01 750次阅读
    <b class='flag-5'>Photos</b>大升级!铁威马NAS携手<b class='flag-5'>AI</b>,打造智能相册新时代

    微软科技如何应对AI原生企业浪潮

    本文改编自微软AI at Work首席营销官贾里德·斯帕塔罗(Jared Spataro)的“关于Al原生组织系列文章”,其中第1部分揭示了AI原生组织的核心原则,第2部分详细介绍了一
    的头像 发表于 02-11 10:34 875次阅读

    微软起诉绕过云AI安全工具开发者

    微软公司近期针对某组织提起了一宗法律诉讼,指控该组织故意开发并使用非法工具,以绕过微软AI产品的安全防护措施。这一行为导致未经授权的访问,并生成了有害内容,对
    的头像 发表于 01-13 14:46 730次阅读

    微软与重要伙伴深化AI领域技术合作

    2025年1月9日,美国,拉斯维加斯——CES 2025国际消费类电子产品展览会期间,微软大中华区举办以 “AI在握,共拓全球Be AI Ready, Win Globally” 为主题的出海伙伴
    的头像 发表于 01-09 16:41 1219次阅读

    开源AI模型库是干嘛的

    开源AI模型库是指那些公开源代码、允许自由访问和使用的AI模型集合。这些模型通常经过训练,能够执行特定的任务。以下,是对开源
    的头像 发表于 12-14 10:33 1302次阅读