0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

以深度学习为核心的计算机视觉技术具有视觉美感吗

MZjJ_DIGITIMES 来源:cg 2018-12-21 11:07 次阅读

我们看到了智能技术在影像辨识、侦测上的突破,甚至落地为产品。很多人问,这些深度学习为核心的计算机视觉技术也可以具有人类的美感—具有评判、编修、甚至美学创作的能力吗?

智能视觉美感技术大致可以区分为三类:首先为影像(或视讯)编修强化,包括修图(对比、亮度、景深等)、超高分辨率成像、突破压缩技术、改善电视显像质量、加速电影(内容)特效制作、甚至主动改善车辆安全驾驶在低亮度下的视讯质量;其次为照片美学评分、取景,自动挑选具美感的照片或是画面;第三为自动生成不存在的影像。而这些核心技术所启发的应用都已经是进行式,或是即将落地为产品。

相关技术大大改变数位内容产业。梵谷油画电影《梵谷:星夜之谜(Loving Vincent)》耗时6年,动员超过百位来自世界各地的画家才完成这个耗时、耗资的工作。目前已经有软件服务完成类似的功能,可以让一般人自动将影片转换为特定画家的风格,透过画家的经典创作,让卷积网络(CNN)的数千万个参数,学习到影像转换的方式,均衡风格跟影片内容。我们在两年前参与的IBM华生研究中心预告片自动剪辑研究,也同样带来类似产业的突破。

一般的卷积网络架构为设计适合的编码器以及相对的译码器;前者将画面内容解析之后,透过后者生成适切的影像(强化或是编修),大量的卷积网络参数透过事前的训练数据来达成目的。而时常被忽略的是适合的目标函数,通常得同时使用多个,并将领域知识吸纳其中,这是成功与否的重要关键!

在美学评分方面,一般利用卷积网络加上回归函式来逼近美感分数。最大的挑战在于训练的数据。因为严谨的美感牵涉到文化、社会、以及个人的差异,可以取得的训练数据─不管是透过人工标注或是社群网络下载—不全具代表性,很难学习到通用的美感。不过在特定家用照片上,透过自动评分,甚至修正照片(旋转、取景、饱和度等)等都已经落地在国内外的各种应用当中。如果能进一步熟悉应用场域,个人化适性学习,将有更大发挥的空间。

最具挑战的是从无到有生成具美感的影像,一般都尝试利用生成对抗网络(GAN)来实现,但是目前在速度、分辨率、生成质量控制上都还有相当努力的空间。

值得产业注意的是,我们观察到这些视觉美感智能突破也逐渐由云端走入本地端。相机、摄影机、电视等相关芯片都已经看到国内外的公司正逐渐布局。因为提供具美感的生活体验,不正也是智能时代的新产品吗?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    8

    文章

    1575

    浏览量

    45555
  • 深度学习
    +关注

    关注

    73

    文章

    5200

    浏览量

    119804

原文标题:【椽经阁】智能技术可以具有人类的视觉美感吗?

文章出处:【微信号:DIGITIMES,微信公众号:DIGITIMES】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    机器视觉、工业视觉计算机视觉这三者的关系

    机器视觉、工业视觉计算机视觉这三者的关系
    的头像 发表于 01-24 10:51 487次阅读
    机器<b class='flag-5'>视觉</b>、工业<b class='flag-5'>视觉</b>和<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>这三者的关系

    什么是计算机视觉计算机视觉的三种方法

    计算机视觉是指通过为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机
    的头像 发表于 11-16 16:38 1949次阅读
    什么是<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>?<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的三种方法

    最适合AI应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机
    的头像 发表于 11-15 16:38 212次阅读
    最适合AI应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?

    用于计算机视觉的经典机器学习应用分析

    深度学习是指在大部分未处理或“原始”数据上运行的非常大的神经网络模型。深度学习通过将特征提取操作拉入模型本身,对计算机
    发表于 11-07 10:11 132次阅读
    用于<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的经典机器<b class='flag-5'>学习</b>应用分析

    反思深度学习与传统计算机视觉的关系

    某种程度上,深度学习最大的优势就是自动创建没有人会想到的特性能力。如今,深度学习在众多领域都有一席之地,尤其是在计算机
    的头像 发表于 09-12 08:29 379次阅读
    反思<b class='flag-5'>深度</b><b class='flag-5'>学习</b>与传统<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的关系

    计算机视觉中的九种深度学习技术

    计算机视觉中仍有许多具有挑战性的问题需要解决。然而,深度学习方法正在针对某些特定问题取得最新成果。 在最基本的问题上,最有趣的不仅仅是
    发表于 08-21 09:56 311次阅读
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>中的九种<b class='flag-5'>深度</b><b class='flag-5'>学习</b><b class='flag-5'>技术</b>

    人工智能计算机视觉方向是什么

    人工智能计算机视觉方向是什么 人工智能计算机视觉方向是指利用人工智能技术对图像和视频进行各种分析、解释和操作的过程。
    的头像 发表于 08-15 16:06 1079次阅读

    机器视觉计算机视觉的区别

    机器视觉计算机视觉的区别 机器视觉计算机视觉是两个相关但不同的概念。虽然许多人使用这两个术语
    的头像 发表于 08-09 16:51 1009次阅读

    计算机视觉是什么 计算机视觉历史及发展趋势

    正像其它学科一样,一个大量人员研究了多年的学科,却很难给出一个严格的定义,模式识别如此,目前火热的人工智能如此,计算机视觉亦如此。与计算机视觉密切相关的概念有
    发表于 07-20 15:41 0次下载

    计算机视觉六大主要技术介绍

    本文将对计算机视觉应用中最为广泛的六大技术进行介绍。
    的头像 发表于 07-11 17:06 558次阅读

    浅谈深度学习计算机视觉领域的三大瓶颈

    深度学习能够实现的前提是大量经过标注的数据,这使得计算机视觉领域的研究人员倾向于在数据资源丰富的领域搞研究,而不是去重要的领域搞研究。
    发表于 06-11 10:22 250次阅读
    浅谈<b class='flag-5'>深度</b><b class='flag-5'>学习</b>在<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>领域的三大瓶颈

    什么是机器视觉?机器视觉计算机有什么关系?

    机器视觉计算机视觉有什么区别
    的头像 发表于 06-05 09:28 803次阅读
    什么是机器<b class='flag-5'>视觉</b>?机器<b class='flag-5'>视觉</b>与<b class='flag-5'>计算机</b>有什么关系?

    计算机视觉相关概念总结

    为了帮助同事和客户了解更多有关计算机视觉和AI的更多信息,我们言简意赅介绍一些计算机视觉和AI术语,希望能帮助到大家。
    的头像 发表于 05-31 10:11 490次阅读

    理解如何处理计算机视觉深度学习中的图像数据

    在过去几年从事多个计算机视觉深度学习项目之后,我在这个博客中收集了关于如何处理图像数据的想法。对数据进行预处理基本上要比直接将其输入深度
    的头像 发表于 04-26 11:57 465次阅读
    理解如何处理<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>和<b class='flag-5'>深度</b><b class='flag-5'>学习</b>中的图像数据

    浅析4个计算机视觉领域常用迁移学习模型

    使用SOTA的预训练模型来通过迁移学习解决现实的计算机视觉问题。
    的头像 发表于 04-23 18:08 1043次阅读
    浅析4个<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>领域常用迁移<b class='flag-5'>学习</b>模型