0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能可以帮助我们找到图片背后的摄影师

ss 来源:学术头条 作者:学术头条 2020-11-03 14:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在日常生活中,我们经常会看到一些十分漂亮、构思精妙的照片,但某张照片背后的摄影师是谁?我们有时却并不清楚。

如今,人工智能AI)可以帮助我们找到图片背后的摄影师。

在一项新的国际跨学科研究中,研究人员通过使用人工智能算法分析近 60000 张二战时期的历史照片发现,人工智能可以根据照片内容来识别摄影师的身份。相关研究成果以论文的形式发表在科学杂志 IEEE Access上。

研究人员展示了使用现代神经网络分析图像的优势,以使机器可以自动检测各种场景中的人和物体,甚至可以根据图像中的特征区分摄影师,这些操作比任何人工检查过程都要快得多。获得的结果将有助于历史学家、其他研究人员和专业人员在工作中使用历史照片档案来分析和比较特定摄影师的作品。

通过这项工作,研究人员证明了人工智能可以在某些方面帮助学者“追溯”历史照片档案的潜力。

令人惊讶

研究人员选择了 23 名芬兰战地摄影师作为实验对象。他们中的 20 人是芬兰战时照片档案中图像总数最高的摄影师,另外 3 人则是因为有专家认为他们的照片对这项摄影新闻研究很有趣。

他们提出并评估了机器学习可以帮助分析历史图像的几个应用领域,即分析场景中存在的对象、照片取景评估、摄影师分类以及评估它们的视觉相似性。

他们使用人工智能技术对这 23 位著名芬兰摄影师在第二次世界大战期间拍摄的照片进行了识别,所用照片来自公开可用的芬兰战时照片档案库,其中包含约 160000 张 1939-1945 年间从芬兰冬季战争、延续战争(第二次世界大战期间芬兰与苏联之间的两场战争中的第二场战争)和拉普兰战争中拍摄的照片。

由于芬兰战时照片档案中的数千张照片仍然没有摄影师的名字,所以这项研究中选用的照片总数为 59000 多张。

这种自动分析可以作为一种工具,以提供基于内容的公共照片档案的文本描述,比如丹麦抵抗博物馆的照片档案。今年 9 月生效欧盟可访问性指令(DIRECTIVE(EU)2016/2102),要求将图像内容的文字描述添加到网络上的所有公共图像中。

对此,论文作者之一 Alexandros Iosifidis 表示:“这让我们非常惊讶,人工智能可以根据照片中的特征(如内容和框架)识别摄影师。”

准确率最高可达 69.7%

在这项研究中,研究人员应用了最先进的目标检测模型和神经网络体系结构,以获得来自杰出二战摄影师的统计数据和特征。

由于每个摄影师都有一定数量的重复图像,这里研究人员根据拍摄时间将照片分成训练集和测试集,以确保描述同一事件的照片不会用于训练和测试。

研究中分析的照片显示,一些摄影师具有非常独特且容易识别的特征,而另一些则很难被人工智能识别。这一人工智能模型的分类准确率区间为 20.1-69.7%,平均为 41.1%。

通过将识别结果与先前对检测到的物体的分析进行比较发现,一些摄影师因为有着特定的拍摄物体和喜好很容易被识别。因此,研究人员检查了每个摄影师照片中的典型物体类别,并分析了他们捕捉和框定人的方式差异。

Roivainen 拍摄的照片中拥有最多的狗、马和汽车,预测准确率为 69.7%;Hollming 拍摄了大量滑雪照片,所有照片中只有几把椅子出现,即户外照片多,预测准确率为 51.4%;Manninen 拍摄的人物照片中的平均人数最高,椅子(即室内照片)出现率最高,预测准确率为 35.5%;SJ Blom 喜欢在城市环境中拍摄照片,预测准确率为 50.4%。

研究结果证明,除了确定照片的作者身份之外,这些特征代表了模型对这些摄影师的整体视觉相似性和照片风格相似性的认知。此外,由于卷积神经网络可以在一定程度上从照片中识别摄影师,某些照片可以被认为是特定摄影师的典型。其中最著名的摄影师是 Heikki Roivainen,他是芬兰植物学教授,曾在延续战争期间担任官方战地摄影师。

通往更多应用的大门

在这项工作中,研究人员只使用了可公开获得的预处理对象检测模型和基本照片信息,但他们认为这一模型可用于大多数照片档案,且提供了所有代码、模型和数据注释,以及如何使用它们的详细描述。

例如,可以通过考虑摄影师的意图和他们的照片质量来进一步增强摄影师分析。此外,可以通过考虑信息融合方法来增强对象检测性能,以及改善较小尺寸对象的检测。除了对象级分析,场景识别将有助于进一步描述摄影师的特征。

在未来,研究人员将专注于需要更专业方法的问题,比如识别仅出现在芬兰历史照片或二战期间的对象类别。他们的目标是利用原始的文本照片描述来产生更完整的对象标签以及主题和事件识别。

这将有助于人们解决分析战时照片时面临的最大挑战之一,即区分拍摄对象的不同状态——照片中的人是活着的、受伤的还是死亡的。

这些更精细的结果最终可以帮助人们更详细地描绘出传统知识摄影师的目标、素质和性格。这项研究的目标是在档案中公布所有的结果,以帮助对档案进行不同类型的社会研究。

对于此次研究结果,作者之一、从事新闻摄影研究已有 25 年以上的 Anssi M?nnist? 认为,“对照片蕴含的内容进行大数据分析是我的一个长期梦想,我对这个项目的结果非常着迷。人工智能可以识别诸如照片中的框架和内容的各个方面,这将在人文科学和社会科学领域中有着广泛的应用。”

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4803

    浏览量

    98530
  • AI
    AI
    +关注

    关注

    91

    文章

    41060

    浏览量

    302568
  • 人工智能
    +关注

    关注

    1820

    文章

    50314

    浏览量

    266880
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译器优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在算力受限
    发表于 04-16 18:47

    浅谈人工智能(2)

    。 强人工智能(Strong AI),又称通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以胜任人类所有工作的
    的头像 发表于 02-22 08:24 339次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    开发智能体配置-内容合规

    智能体上架前,需完成“人工智能生成合成内容标识”和“大模型备案信息”填写 ,以供平台审核;可在智能体【配置】-【内容合规】中填写。 人工智能生成合成内容标识 “
    发表于 02-07 11:44

    人工智能应用开发-中级(大模型)》认证证书含金量如何?怎么考?

    ,且能完成智能体系统设计与任务编排的工程备受企业青睐。《人工智能应用开发-中级(大模型)》专业技术人才培训授证项目正是为应对这一趋势推出,项目依托中国电子学会“
    的头像 发表于 01-28 15:11 1027次阅读
    《<b class='flag-5'>人工智能</b>应用开发-中级(大模型)》认证证书含金量如何?怎么考?

    傲琪人工合成石墨片: 破解智能手机散热困境的创新解决方案

    帮助智能手机制造商突破了长期存在的热瓶颈,使设备能够在更小的空间内发挥更强大的性能。 随着智能手机功能的不断扩展和功率需求的持续增长,像傲琪人工合成石墨片这样的先进散热材料将继续扮演关
    发表于 09-13 14:06

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍这对开发人员意味着什么,以及使用 Neuton 模型如何改进您的开发和终端
    发表于 08-31 20:54

    人工智能+”,走老路难赚到新钱

    昨天的“人工智能+”刷屏了,这算是官方第一次对“人工智能+”这个名称定性吧?今年年初到现在,涌现出了一大批基于人工智能的创业者,这已经算是AI2.0时代的第三波创业潮了,第一波是基础大模型,第二波
    的头像 发表于 08-27 13:21 877次阅读
    “<b class='flag-5'>人工智能</b>+”,走老路难赚到新钱

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:23

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    人工智能是做什么的

    在当今科技日新月异的时代,人工智能(ArtificialIntelligence,简称AI)已成为推动社会进步和经济发展的重要力量。本文旨在深入探讨人工智能的核心功能、应用领域,并通过具体实例解析其
    的头像 发表于 05-30 10:04 1020次阅读
    <b class='flag-5'>人工智能</b>是做什么的

    中兴通讯亮相2025全球人工智能终端展

    此前,5月22日至24日,2025全球人工智能终端展暨第六届深圳国际人工智能展览会在深圳会展中心隆重举行。中兴通讯终端业务以“AI赋智,端云共生”为主题,围绕“AI for All”的产品战略和理念
    的头像 发表于 05-29 11:38 1214次阅读

    Ampere如何解决人工智能背后的能源困境

    人工智能已从一项前景广阔的创新成果迅速蜕变,成长为一股强大的力量,正重塑着商业领域的每一个角落以及人们日常生活的方方面面。从革新企业的运营模式,到提升全球消费者的体验,人工智能不再是一种小众技术,而是推动全球变革的关键驱动力。
    的头像 发表于 05-07 10:43 1072次阅读