0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

比较谷歌、微软、亚马逊等公司的鉴定API能力,哪家强呢?

DPVg_AI_era 来源:未知 作者:李倩 2018-08-13 09:27 次阅读

如今,网络中每天会产生海量的图像文件,而对于这些图片进行安全性鉴定是非常有必要的。很多公司都会使用图像鉴定API对裸露或违法照片进行自动过滤和修改。本文便实现并比较了谷歌、微软、亚马逊等公司的鉴定API能力。

扫黄打非,刻不容缓!

智能手机时代,手机上装有一个、两个甚至更多的摄像头,图像(和视频)已经成为用户与社交媒体互动的最常见方式。

几乎所有用户生成的内容,比如Yelp或TripAdvisor上的评论、Instagram和Facebook上的帖子、WhatsApp上的转发等等,所有内容的图片数量都在不断增加。最近一项2017年的数据显示,仅Facebook每天就会上传大约3.5亿张图片。这个数量是非常庞大的。

如果你的网站或者APP允许用户生成内容(UGC),例如评论、上传可能带图片的帖子等等。但目前很现实的一个问题是,一个troll可以将带有色情或者可怕的照片在你的网站上公开显示,必定会带来许多用户的谴责,甚至可能会承担相应的法律责任。

扫黄打非—手段是关键

公司处理这一类问题常见的方式是审核,在审核过程中,UGC的每个细节内容都要通过人工操作,然后才能在网站或应用中展示出来。许多公司雇用了数十名工作人员,他们日复一日地过滤这些UGC。然后公司聘用这样的团队,实际上不仅花费大量的金钱,而且效率也是很低的。

在过去的几年里,科技公司通过机器学习和使用ML算法检测“有害”的内容,并自动调节UGC来应对这种威胁。最后机器无法自动分类或判别的内容,将交于员工进行人工操作。这就大幅度提高了效率。

开发、构建上述ML解决方案是一件非常困难的任务,所以像谷歌、微软这样的大型技术公司或Clarifai这样的小公司都会提供api来帮助用户完成这项工作。由于大多数这些API提供了类似的功能,我们希望相互测试这些API的有效性,特别是用于检测图像中的成人或色情内容。我们比较了AWS rekognition、Microsoft moderation services、Google vision和Clarifai的鉴黄API的性能。

明确任务—迈向成功的关键

将用户上传的“有害”图片标记为含有成人或色情内容,以便仅批准安全图像;

裸照等图片会被自动删除;

没有明确分类的图片会被发送给人工评估。

数据集介绍

我们使用了YACVID数据集的180幅图像,其中90张图像人工标记为非裸照,90张图像为裸照。我们用这4个API分别去测试这180张图像,并记录它们的分类的情况。

数据集中的一个示例数据项

数据集中安全的示例图像

实验结果一览

在测试这些API时,主要关注以下这些值:

真阳性(True Positive,TP):给定一个安全照片,API鉴定结果也是安全的;

假阳性(False Positive,FP):给定一个色情照片,API鉴定结果是安全的;

假阴性(False Negative,FN):给定一个安全照片,API鉴定结果是色情的;

真阴性(True Negative,TN):给定一个色情照片,API鉴定结果也是色情的;

理想情况下,人们肯定希望100% TP率和0% FP率。无论FP的值是多少,都是有害的,因为这有可能会在你的应用或网站上展现一些色情的图像。而FN的值若是过高,则说明这个系统是无效的,便会导致一个企业投入更多的人力资源。

实验结果如下表所示:

星标的表示集成使用API

最好的独立API来自谷歌,精度为99%,召回率为94%。从表中可以看到,大部分API实验结果都非常良好,数值都达到了90以上。但是考虑到问题的实际背景情况,即使准确率如此之高,但对于许多情况也并非是万无一失的。

我们还试图结合使用两个或多个API来寻找解决问题的最佳方案。在我们的数据集中,似乎将Google和AWS API结合起来可以提供最佳性能。即便如此,仍有10%的安全图片需要人工验证才能共同构建出一个万无一失的系统。

各个API介绍

Microsoft image moderation

这个API将色情图像分类为“成人”或“猥琐”,我们将这两类都视为NSFW类。以下是一些错误地将安全图片分类为色情类的图片:

Google cloud vision

这个API将一个色情图像分类为“也许”、“可能”、“非常可能”,这三类都被视作NSFW类。以下是一些错误地将安全图片分类为色情类的图片:

AWS Rekognition

这个API将一个色情图像分类为“明显裸露”、“裸露”、“暗示”,这三类都被视作NSFW类。以下是一些错误地将安全图片分类为色情类的图片:

Clarifai nudity moderation

这个API返回一个NSFW/SFW类的置信度值。该API将NSFW值大于或等于0.85的图像分类为NSFW, NSFW值小于或等于0.15的图像分类为SFW。而处于0.15到0.85范围之间的图像被视为未知状态(因为召回率非常低)。以下是一些错误地将安全图片分类为色情类的图片:

The Black Swan

下面这张图片,无论哪个API,都将其分类为NSFW,但都被人工分类为SFW。那么问题来了,各位读者,你们认为它应该属于哪类呢?

其它因素

我们还测量了API响应时间,这是决定用户选择使用哪个API的一个因素。由于响应时间可能受很多因素的影响,因此下表的值只是一个大概数字,而不是实际值。下表的统计数据是在Ubuntu系统的笔记本运行试验而得到的(每个API调用180次)。

需要注意的一点是,所有这些API都访问了在Amazon S3上传的图像,AWS API在访问S3映像时会有一定不公平的优势,因此响应时间可能较短。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能手机
    +关注

    关注

    66

    文章

    18056

    浏览量

    177052
  • 谷歌
    +关注

    关注

    27

    文章

    5855

    浏览量

    103250
  • 数据集
    +关注

    关注

    4

    文章

    1178

    浏览量

    24349

原文标题:【机器学习看裸照】谷歌、微软、亚马逊,哪家图像API鉴黄能力强?

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    裁员潮席卷半导体行业,年终奖哪家强?2024年哪些职位有“钱景”?

    23,670名工人被解雇。1月26日,市值达3万亿美元的微软正式宣布即将从其动视暴雪和 Xbox 部门裁员 1,900名员工。还有,谷歌的母公司Alphabet、亚马逊等多家
    的头像 发表于 02-04 00:03 6525次阅读
    裁员潮席卷半导体行业,年终奖<b class='flag-5'>哪家</b>强?2024年哪些职位有“钱景”?

    现在RISC-V 都有哪家公司再推啊?

    RISC-V 的芯片都出来很久了,现在RISC-V 都有哪家公司再推啊?以后是不是一种趋势呀? 沁恒的产品如何?
    发表于 02-05 22:30

    美FTC将调查科技巨头 包括微软谷歌OpenAI等五公司

    美FTC将调查科技巨头 包括微软谷歌OpenAI等五公司 据外媒报道,近期美国联邦贸易委员会(FTC)因为担心扭曲创新、破坏公平竞争;对一些科技巨头的大额投资进行了调查,包括了微软
    的头像 发表于 01-26 20:26 1693次阅读

    电动工具直流调速专用集成电路GS069,具有电源电压范围宽、功耗小、抗干扰能力强特性

    GS069电动工具直流调速电路是CMOS专用集成电路,具有电源电压范 围宽、功耗小、抗干扰能力强特点。通过外接电阻网络,改变与之相接 的VMOS 管的输出,达到控制电动工具转速的作用。该电路输出幅
    发表于 01-16 15:18

    小米汽车代工公司哪家 小米汽车会和哪家车企合作

    小米汽车代工公司哪家 小米汽车将由北汽代工生产。申报信息显示,产品商标为小米牌,但申报企业名称填写的是北京汽车集团越野车有限公司。 12月28日下午,小米汽车举行汽车技术发布会,小米SU7正式亮相
    的头像 发表于 12-29 14:57 5689次阅读

    台积电获微软5nm AI芯片订单

    ai相关芯片表现强势,谷歌亚马逊aws、微软等通信服务提供企业的技术力量和与英伟达、amd、英特尔等半导体制造企业的竞争和合作关系起到了很大作用。
    的头像 发表于 11-17 14:24 855次阅读

    谷歌向人工智能聊天机器人初创公司Character.AI投入数亿美元

    为了对抗Open AI和微软在AI领域的挑战,谷歌正不断的将明星AI初创公司收入自家阵营。
    的头像 发表于 11-14 10:41 604次阅读

    恭喜!华为云通过中国信通院《API 全生命周期管理能力评估》

    互联互通。为助力企业高质量管理 API 全生命周期的发展目标,中国信通院牵头制定了《API 全生命周期管理能力评估》标准并推出相关评估服务,规范企业 API 建设
    的头像 发表于 10-26 09:16 453次阅读
    恭喜!华为云通过中国信通院《<b class='flag-5'>API</b> 全生命周期管理<b class='flag-5'>能力</b>评估》

    OpenHarmony 应用开发SDK、API 与基础工具

    。C API 也包含在鸿蒙SDK 中,方便开发者使用 C 或者 C++语言实现应用相应功能。 C API 只覆盖了部分鸿蒙基础底层能力,如 libc,图形库,窗口系统,多媒体,压缩库
    发表于 09-19 15:45

    挑战微软亚马逊 谷歌发布企业级AI工具和芯片争夺云计算市场份额

    的软件工具。谷歌在年度云会议上公布的AI芯片、工具和合作伙伴关系,以期在云计算市场挑战亚马逊微软谷歌云首席执行官托马斯·库里安(Thomas Kurian)在旧金山举行的
    的头像 发表于 08-31 00:08 701次阅读
    挑战<b class='flag-5'>微软</b>和<b class='flag-5'>亚马逊</b> <b class='flag-5'>谷歌</b>发布企业级AI工具和芯片争夺云计算市场份额

    英伟达与云巨头必有一战

    众所周知,谷歌亚马逊微软先后在内部启动自研AI芯片项目——谷歌的TPU系列,亚马逊的Inferentia和Trainium系列,以及
    的头像 发表于 08-21 15:00 449次阅读
    英伟达与云巨头必有一战

    怎么使用Java8的Stream API比较两个List的差异呢?

    可以使用Java8的Stream API比较两个List的差异,并取出不同的对象。
    的头像 发表于 08-12 11:15 1578次阅读

    M451系列的抗干扰能力比M481几乎吗?

    各位大侠,我看到新唐官网的介绍,M451系列抗ESD是8KV,M481系列一般是3KV到4KV,这是不是说明M451系列的抗干扰能力比M481几乎一倍
    发表于 06-16 06:36

    德勤与亚马逊云科技深化合作 利用Amazon Bedrock扩展生成式AI能力

    北京2023年6月1日 /美通社/ -- 德勤宣布将利用亚马逊云科技的Amazon Bedrock全托管服务扩展其生成式人工智能(AI)能力,借助该服务,用户可通过API轻松访问来自领先AI
    的头像 发表于 06-01 18:18 511次阅读

    HarmonyOS/OpenHarmony应用开发API-ConnectOptions能力

    说明: 在连接指定的后台服务时作为入参用于接收连接过程中的状态变化。 编译环境: 编译器版本:release3.0 Api:8 语言:js 示例 *附件:HarmonyOSOpenHarmony应用开发API-ConnectOptions
    发表于 05-08 17:29