0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

刚上岗就翻车?微软AI编辑图像识别出错

如意 来源:百家号 作者:新华网客户端 2020-07-01 17:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

目前阶段的编辑工作完全依赖AI是不现实的,让AI成为人类编辑的帮手似乎更切实可行。双方协同起来,将使工作更加高效有质量。

日前,微软宣布6月底拟裁撤近80名外包编辑,由AI编辑负责接下来的MSN网站的新闻抓取、排版和配图等工作。但没想到,刚到岗没多久,AI编辑就“翻车”了,而且犯了一个非常低级的错误。AI编辑在寻找配图的时候,把非裔歌手Leigh跟阿拉伯裔歌手Jade弄混了。

针对此次微软AI的配图错误事件,Jade也在社交媒体上表达了不满:“正常区分两个不同肤色的人有那么难吗?”为何一向以高识别率著称的AI,这次却“翻车”了?

解决脸盲问题需要不断扩大学习范围

人脸识别技术是目前AI领域公认的比较成熟的技术,圈内人士也热衷像刷分一样把人脸识别准确率屡屡刷出新高,最高的号称准确率可达99.9%。人脸识别技术有如此辉煌的战绩,为何此次AI编辑还会脸盲呢?

“人脸识别技术的工作原理,主要是比对五官比例以及面部特征。”天津大学智能与计算学部教授韩亚洪解释,简单说,就是基于人脸图像的大数据,先对看到的人脸图像进行预处理,提取面部各个方面的特征,并通过分层多次提取,寻找对于识别个体人脸最有效的特征表达。

人脸识别技术这些年已经发生了重大的变化,传统的人脸识别方法已经被基于卷积神经网络深度学习方法替代。深度学习方法的主要优势是它们可通过大规模数据集进行训练,从而学习到这些数据的最佳特征。

“虽然可以使用大规模数据集进行训练,但是目前99.9%的准确率,基本上是在一些基准的数据集上测试的结果。这个数据集肯定是有范围的,如果收集的数据是在数据集分布的范围内,便可获得比较高的准确率。”韩亚洪说。

据了解,目前号称人脸识别准确率达到99%以上的,很多指的都是和全世界最权威的人脸数据库LFW(Labeled Faces in the Wild)进行比对测试的成绩。LFW可以被认作一个考查深度学习系统人脸识别能力的题库。它从互联网上提取6000张不同朝向、表情和光照环境的人脸照片作为考题,可以让任何系统在里面“跑分”。“跑分”过程是LFW给出一对照片,询问测试系统两张照片是不是同一个人,系统给出yes或no的答案。

“解决特定的脸盲问题并不难,其实就是重新针对任务,收集这项任务领域内的人脸图像,在原有算法模型上训练,或者重新设计新的算法模型进行训练,都会提高人脸识别率,以满足实际应用的需求。”韩亚洪说,但是超出了特定任务,AI的“脸盲症”就会复发。目前并没有哪个通用的模型算法可以解决所有的任务,但是AI可以通过不断地调整,大量的学习,从而提高人脸识别的准确性。

新华社联合搜狗在第五届世界互联网大会上发布全球首个合成新闻主播——“AI合成主播”,运用最新人工智能技术,“克隆”出与真人主播拥有同样播报能力的“分身”。视觉中国供图

深度神经网络模型是进阶的必要条件

“目前针对新闻文档的分析和处理任务,AI编辑做起来相对得心应手。”韩亚洪介绍,具体地说,比如在一篇很长的报道中,让AI编辑把重点摘出来,这是没有问题的。现在是多媒体时代,大量的新闻报道会涉及图片和视频,AI编辑可以将图片或者视频自动提取出来,再从大篇幅的文字报道中,选取与之相匹配的文字说明,这个工作AI是可以比较准确地做到的。

“解决特定领域的问题,AI大多时候还是没问题的,但是要实现通用,就比较难了。”韩亚洪强调,实现这些功能需要用到自然语言处理、模式识别、图像视频理解等领域的技术。

要培养一名AI编辑,首先需要收集大量的新闻报道和图片视频,再根据收集到的数据设计一个针对这个任务的深度神经网络模型,网络模型里会有很多参数,然后通过数据把参数训练出来,它就具备了最初设定的各种编辑能力了。在使用过程中,随着AI编辑学习了更多的新闻,它的业务能力和性能也将不断提升。

“不过目前的新闻生产对于AI编辑来说还很困难。”韩亚洪说,要让AI学会写新闻,必须要针对某个特定新闻主题,进行大量资料搜集和模型训练。目前AI技术只能在风格相对固定、词汇量使用范围较小的领域完成文本生成,比如天气预报等内容,AI可以很好地输出相关报道和消息。但要生成人类创作的那种有创新要求、情感描述丰富的文章,AI编辑的能力仍有待进一步提升。

协作将使新闻生产更加高效

“有趣的是,AI犯的错误大多是我们意想不到的低级错误,但在某些方面又强悍到让人类望尘莫及。”韩亚洪举例说,像给文章分类这种工作,人类编辑要进行大量阅读,重复性劳动耗时耗力,速度非常慢。但这项工作AI编辑做起来就非常简单了,通过文字—文档的主题建模,AI可以比较准确地对文章按主题进行分类。另外,对于可以使用模板的短新闻,比如天气预报、证券信息等,AI编辑可以准确迅速地将各种数字或者专有名词嵌套到模板中,从而完成一定的文档生成任务。

美联社曾使用AI系统自动编发企业财报。AI系统对数据进行自动抓取,将其嵌套在美联社预先设定的新闻模板中,几秒钟就能完成一篇150—300字的短消息,该系统每季度能产出约4000篇新闻,与之相比,美联社的人工编辑们每季度只能完成400篇。

做这些特定的工作,AI编辑比人类厉害的地方不仅在于速度,准确率也可圈可点。“像分类或者是嵌套模板写短消息这类的工作,因为任务明确,AI的准确率还是非常高的,很少出现错别字或者数据错误。”韩亚洪介绍。

在运用大数据分析预测爆款方面,AI编辑可能比人类单纯从经验出发显得更“科学”。2015年,《纽约时报》使用AI机器人对社交平台中的文章进行筛选和分析,预测哪部分内容适合推广。凡是由它自动推荐的文章的点击量都大大增加,甚至达到了普通文章的38倍。

“但在AI编辑的世界中,只有知道和不知道两种状态,因此处理的内容一旦超纲,它们就会立刻犯很多低级到可笑的错误。”韩亚洪说,像这次AI编辑把非裔的Leigh跟阿拉伯裔的Jade弄混了的这样的错误,对于人类来说,即使没见过Leigh ,但根据常识,也不会把非洲裔和阿拉伯裔弄混。

“目前阶段的编辑工作完全依赖AI是不现实的,让AI成为人类编辑的帮手似乎更切实可行。”韩亚洪说。美联社预测,AI介入媒体行业能够帮助新闻工作者释放20%左右的时间,让后者可以将这部分时间更多地投入到内容创作方面,简单的事实核查与调研方面的工作交给AI,有利于提高新闻质量。

“未来,人类应该把AI编辑当作合作伙伴,双方协同起来,使工作更加高效有质量。”韩亚洪说,人类不应该觉得AI是来“抢饭碗”的,而应该为有AI这样的合作伙伴而感到幸运。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6722

    浏览量

    107359
  • 图像识别
    +关注

    关注

    9

    文章

    529

    浏览量

    39846
  • AI
    AI
    +关注

    关注

    89

    文章

    38153

    浏览量

    296811
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【飞凌OK-MX9596-C开发板试用】③云端AI拍照识别

    。 本篇基于此,开发云端AI拍照识别。 简单来说,就是拍照,并调用云端AI工具,进行图像文本识别,再将
    发表于 11-01 22:12

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    任务。这套系统为艺术市场、教育行业和内容平台提供了一种实用的工具,有效应对AI生成内容带来的挑战。虽然有些识别出错,但是还是值得继续优化以及探讨方案的可行性。
    发表于 08-21 13:59

    基于米尔MYC-YM90X安路飞龙DR1开发板仪表图像识别系统开发

    满足工业自动化、智能化发展需求。图像识别技术为仪表自动化读数提供了有效途径。随着集成电路技术发展,异构计算芯片在图像识别领域优势凸显。安路飞龙 FPSOC 集成 ARM 处理器与 FPGA 可编程逻辑
    发表于 08-17 21:29

    华怡丰推出ISC-B/C系列图像识别传感器

    在工业自动化领域,精准、高效的视觉检测是提升生产效率的关键。华怡丰全新推出的ISC-B/C系列图像识别传感器集高精度定位、测量算法与先进图像处理技术于一体,为各类工业场景提供稳定、可靠的解决方案!
    的头像 发表于 08-15 11:36 1464次阅读
    华怡丰推出ISC-B/C系列<b class='flag-5'>图像识别</b>传感器

    火车车号图像识别系统如何应对不同光照条件下的识别问题?

    在铁路运输管理中,准确识别火车车号是实现自动化车辆管理的关键环节。然而,实际应用场景中复杂多变的光照条件给车号识别带来了巨大挑战。现代火车车号图像识别系统通过多项技术创新,有效解决了这一难题。 多
    的头像 发表于 07-15 11:37 532次阅读
    火车车号<b class='flag-5'>图像识别</b>系统如何应对不同光照条件下的<b class='flag-5'>识别</b>问题?

    STM32N6570-DK 的STLINK口不能识别出STLINK,为什么?

    使用数据线连接STM32N6570-DK的CN6口和电脑,存在不能识别出STLINK的情况。这个板子集成的STLINK是连上数据线就能识别出STLINK,还是配置硬件才能识别出来?我电脑的stlink驱动和数据线应该都没有问题。
    发表于 06-16 07:14

    想用K230放在无人机上做图像识别,加装一个4G模块把识别结果和画面同时传输的地面站或者手机上,怎么操作?

    我想用K230放在无人机上做图像识别,然后想加装一个4G模块把识别结果和画面同时传输的地面站或者手机上,这个目前可以如何处理? 你好,目前底层是支持4G模块得驱动,参考https
    发表于 06-16 07:08

    AI视觉识别收银称:水果生鲜店的“智能店员”

    仅耗时费力,还容易出现人为错误。而生鲜自动识别称重收银一体机、AI视觉识别收银秤、生鲜称重收银秤和AI生鲜识别电子秤等
    的头像 发表于 06-07 10:19 499次阅读
    <b class='flag-5'>AI</b>视觉<b class='flag-5'>识别</b>收银称:水果生鲜店的“智能店员”

    基于RV1126开发板实现驾驶员行为检测方案

    在RV1126上实现驾驶员行为检测:通过图像识别出这几种行为:打电话、抽烟、疲劳驾驶。
    的头像 发表于 04-21 11:07 922次阅读
    基于RV1126开发板实现驾驶员行为检测方案

    基于RV1126开发板实现驾驶员行为检测方案

    在RV1126开发板上实现驾驶员行为检测:通过图像识别出这几种行为:打电话、抽烟、疲劳驾驶。
    的头像 发表于 04-18 17:47 354次阅读
    基于RV1126开发板实现驾驶员行为检测方案

    手持终端集装箱识别系统的图像识别技术

    行业提供了更灵活、精准的管理工具。 一、技术核心:OCR+AI深度融合 现代手持终端系统采用多模态图像识别技术,结合深度学习算法,可快速捕捉并解析集装箱号码。其技术优势体现在: 1. 复杂环境适应性:通过动态曝光补偿和图像增强算
    的头像 发表于 04-03 10:49 553次阅读

    岸桥箱号识别系统如何工作?揭秘AI图像识别技术!

    在港口自动化升级的浪潮中,AI岸桥识别系统凭借前沿的图像识别技术,成为提升码头作业效率的“智慧之眼”。那么,这套系统如何实现集装箱信息的精准捕捉?又是如何通过AI技术替代传统人工理货?
    的头像 发表于 04-02 09:45 536次阅读

    惊了!这个“神器”让树莓派秒变智能管家,图像识别+无线投屏,太秀了!

    和BalenaCloud,让树莓派实现从图像识别到智能生活的华丽转身!图像分类项目:用树莓派和BalenaOS实现智能识别1.项目背景:让树莓派“看懂”世界想象一下,你的
    的头像 发表于 03-25 09:23 1355次阅读
    惊了!这个“神器”让树莓派秒变智能管家,<b class='flag-5'>图像识别</b>+无线投屏,太秀了!

    BP神经网络在图像识别中的应用

    BP神经网络在图像识别中发挥着重要作用,其多层结构使得网络能够学习到复杂的特征表达,适用于处理非线性问题。以下是对BP神经网络在图像识别中应用的分析: 一、BP神经网络基本原理 BP神经网络,即反向
    的头像 发表于 02-12 15:12 1192次阅读