0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

比较谷歌、微软、亚马逊等公司的鉴定API能力,哪家强呢?

DPVg_AI_era 来源:未知 作者:李倩 2018-08-13 09:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如今,网络中每天会产生海量的图像文件,而对于这些图片进行安全性鉴定是非常有必要的。很多公司都会使用图像鉴定API对裸露或违法照片进行自动过滤和修改。本文便实现并比较了谷歌、微软、亚马逊等公司的鉴定API能力。

扫黄打非,刻不容缓!

智能手机时代,手机上装有一个、两个甚至更多的摄像头,图像(和视频)已经成为用户与社交媒体互动的最常见方式。

几乎所有用户生成的内容,比如Yelp或TripAdvisor上的评论、Instagram和Facebook上的帖子、WhatsApp上的转发等等,所有内容的图片数量都在不断增加。最近一项2017年的数据显示,仅Facebook每天就会上传大约3.5亿张图片。这个数量是非常庞大的。

如果你的网站或者APP允许用户生成内容(UGC),例如评论、上传可能带图片的帖子等等。但目前很现实的一个问题是,一个troll可以将带有色情或者可怕的照片在你的网站上公开显示,必定会带来许多用户的谴责,甚至可能会承担相应的法律责任。

扫黄打非—手段是关键

公司处理这一类问题常见的方式是审核,在审核过程中,UGC的每个细节内容都要通过人工操作,然后才能在网站或应用中展示出来。许多公司雇用了数十名工作人员,他们日复一日地过滤这些UGC。然后公司聘用这样的团队,实际上不仅花费大量的金钱,而且效率也是很低的。

在过去的几年里,科技公司通过机器学习和使用ML算法来检测“有害”的内容,并自动调节UGC来应对这种威胁。最后机器无法自动分类或判别的内容,将交于员工进行人工操作。这就大幅度提高了效率。

开发、构建上述ML解决方案是一件非常困难的任务,所以像谷歌、微软这样的大型技术公司或Clarifai这样的小公司都会提供api来帮助用户完成这项工作。由于大多数这些API提供了类似的功能,我们希望相互测试这些API的有效性,特别是用于检测图像中的成人或色情内容。我们比较了AWS rekognition、Microsoft moderation services、Google vision和Clarifai的鉴黄API的性能。

明确任务—迈向成功的关键

将用户上传的“有害”图片标记为含有成人或色情内容,以便仅批准安全图像;

裸照等图片会被自动删除;

没有明确分类的图片会被发送给人工评估。

数据集介绍

我们使用了YACVID数据集的180幅图像,其中90张图像人工标记为非裸照,90张图像为裸照。我们用这4个API分别去测试这180张图像,并记录它们的分类的情况。

数据集中的一个示例数据项

数据集中安全的示例图像

实验结果一览

在测试这些API时,主要关注以下这些值:

真阳性(True Positive,TP):给定一个安全照片,API鉴定结果也是安全的;

假阳性(False Positive,FP):给定一个色情照片,API鉴定结果是安全的;

假阴性(False Negative,FN):给定一个安全照片,API鉴定结果是色情的;

真阴性(True Negative,TN):给定一个色情照片,API鉴定结果也是色情的;

理想情况下,人们肯定希望100% TP率和0% FP率。无论FP的值是多少,都是有害的,因为这有可能会在你的应用或网站上展现一些色情的图像。而FN的值若是过高,则说明这个系统是无效的,便会导致一个企业投入更多的人力资源。

实验结果如下表所示:

星标的表示集成使用API

最好的独立API来自谷歌,精度为99%,召回率为94%。从表中可以看到,大部分API实验结果都非常良好,数值都达到了90以上。但是考虑到问题的实际背景情况,即使准确率如此之高,但对于许多情况也并非是万无一失的。

我们还试图结合使用两个或多个API来寻找解决问题的最佳方案。在我们的数据集中,似乎将Google和AWS API结合起来可以提供最佳性能。即便如此,仍有10%的安全图片需要人工验证才能共同构建出一个万无一失的系统。

各个API介绍

Microsoft image moderation

这个API将色情图像分类为“成人”或“猥琐”,我们将这两类都视为NSFW类。以下是一些错误地将安全图片分类为色情类的图片:

Google cloud vision

这个API将一个色情图像分类为“也许”、“可能”、“非常可能”,这三类都被视作NSFW类。以下是一些错误地将安全图片分类为色情类的图片:

AWS Rekognition

这个API将一个色情图像分类为“明显裸露”、“裸露”、“暗示”,这三类都被视作NSFW类。以下是一些错误地将安全图片分类为色情类的图片:

Clarifai nudity moderation

这个API返回一个NSFW/SFW类的置信度值。该API将NSFW值大于或等于0.85的图像分类为NSFW, NSFW值小于或等于0.15的图像分类为SFW。而处于0.15到0.85范围之间的图像被视为未知状态(因为召回率非常低)。以下是一些错误地将安全图片分类为色情类的图片:

The Black Swan

下面这张图片,无论哪个API,都将其分类为NSFW,但都被人工分类为SFW。那么问题来了,各位读者,你们认为它应该属于哪类呢?

其它因素

我们还测量了API响应时间,这是决定用户选择使用哪个API的一个因素。由于响应时间可能受很多因素的影响,因此下表的值只是一个大概数字,而不是实际值。下表的统计数据是在Ubuntu系统的笔记本运行试验而得到的(每个API调用180次)。

需要注意的一点是,所有这些API都访问了在Amazon S3上传的图像,AWS API在访问S3映像时会有一定不公平的优势,因此响应时间可能较短。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能手机
    +关注

    关注

    66

    文章

    18702

    浏览量

    186321
  • 谷歌
    +关注

    关注

    27

    文章

    6259

    浏览量

    112019
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26264

原文标题:【机器学习看裸照】谷歌、微软、亚马逊,哪家图像API鉴黄能力强?

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    亚马逊商品详情数据获取实战:从商品链接提取 ID 到解析详情

    亚马逊商品详情API是开发者获取平台上商品核心信息(如标题、价格、图片、描述、评价)的官方技术接口,主要用于跨境电商、比价工具、选品分析、联盟营销和数据监控场景。由于
    的头像 发表于 02-10 16:41 515次阅读

    跨境电商 API 对接指南(亚马逊 / 速卖通接口选型与调试)

    跨境电商对接亚马逊、速卖通官方 API,核心是 合规获取平台数据、实现自动化运营 (如订单处理、商品管理、库存同步),相比爬虫更稳定、无封号风险,是企业级运营的核心方案。本指南从 接口准入、核心
    的头像 发表于 02-06 11:53 665次阅读

    淘宝、京东、拼多多API各显神通,商家如何选择?

    、基础能力对比 功能维度 淘宝/天猫API 京东API 拼多多API 商品管理 $$ text{CRUD全支持+SPU/SKU复杂关系} $$
    的头像 发表于 12-17 15:24 609次阅读
    淘宝、京东、拼多多<b class='flag-5'>API</b>各显神通,商家如何选择?

    系统调用和API有什么区别

    首先,什么是API?以汽车发动机为例: 档把就是发动机给你提供的api,当你想让汽车前进时只需要将其挂到“D”档位,然后轻踩油门就可以前进了,当你挂挡时你根本就不需要关心汽油是怎么进到发动机
    发表于 12-03 06:52

    亚马逊平台 API:解锁电商潜能的技术钥匙

    显著提升电商运营的效率、扩展业务能力并创造独特价值。 一、 核心 API 功能概览 亚马逊提供的 API 种类繁多,功能覆盖了电商运营的各个环节。主要的
    的头像 发表于 11-24 15:39 603次阅读
    <b class='flag-5'>亚马逊</b>平台 <b class='flag-5'>API</b>:解锁电商潜能的技术钥匙

    目前专业的音频振动采集卡哪家?NI,SonoDAQ,APX,HBK哪个好点?

    目前专业的音频振动采集卡哪家?NI,SonoDAQ,APX,HBK哪个好点?
    发表于 11-19 11:16

    标题:技术实战 | 如何通过API接口高效获取亚马逊平台商品详情数据

    ​  导语: 在跨境电商运营、市场分析、价格监控场景中,实时获取亚马逊平台上的商品详情数据至关重要。本文将探讨如何通过官方或第三方API接口,以程序化的方式高效、合规地抓取亚马逊商品
    的头像 发表于 11-14 15:31 649次阅读
    标题:技术实战 | 如何通过<b class='flag-5'>API</b>接口高效获取<b class='flag-5'>亚马逊</b>平台商品详情数据

    亚马逊平台根据关键字搜索商品API接口

    ​  在电商开发中,集成亚马逊平台的商品搜索功能是常见需求。通过亚马逊的Product Advertising API(PAAPI),开发者可以根据关键字高效检索商品信息。本技术帖将逐步介绍如何调用
    的头像 发表于 11-05 15:00 537次阅读
    <b class='flag-5'>亚马逊</b>平台根据关键字搜索商品<b class='flag-5'>API</b>接口

    亚马逊获取商品评论的API接口

    ​ 大家好!今天我将详细介绍如何通过亚马逊API接口获取商品评论数据。作为一名开发人员,你可能需要这些数据来构建价格比较工具、分析产品口碑或开发推荐系统。亚马逊提供了Product
    的头像 发表于 11-05 14:50 612次阅读
    <b class='flag-5'>亚马逊</b>获取商品评论的<b class='flag-5'>API</b>接口

    亚马逊获取商品详情API接口指南

    ​  在电商开发中,获取商品详情是核心需求之一。亚马逊提供了一套强大的API接口,允许开发者高效提取商品信息,如标题、价格、描述和库存状态。本文将逐步介绍如何通过Amazon Product
    的头像 发表于 11-05 14:45 627次阅读
    <b class='flag-5'>亚马逊</b>获取商品详情<b class='flag-5'>API</b>接口指南

    亚马逊商品评论API接口技术指南

    ​ 一、API接口概述 亚马逊商品评论API(Product Reviews API)允许开发者通过程序化方式获取指定商品的用户评价数据。该接口返回结构化数据,包括: 评论内容及评分(
    的头像 发表于 10-21 15:40 689次阅读
    <b class='flag-5'>亚马逊</b>商品评论<b class='flag-5'>API</b>接口技术指南

    亚马逊:调用跨境物流API追踪国际包裹清关状态,优化时效

    ​  在亚马逊全球电商运营中,跨境物流是核心挑战之一。国际包裹的清关状态不确定性常导致延误,影响交付时效和客户满意度。手动追踪效率低下,而通过调用跨境物流API实现自动化监控,不仅能实时获取清关信息
    的头像 发表于 09-22 14:54 639次阅读
    <b class='flag-5'>亚马逊</b>:调用跨境物流<b class='flag-5'>API</b>追踪国际包裹清关状态,优化时效

    亚马逊 MWS API 实战:商品详情精准获取与跨境电商数据整合方案

    本文详细解析亚马逊MWS API接口的技术实现,重点解决跨境商品数据获取中的核心问题。文章首先介绍MWS接口体系的特点,包括多站点数据获取、AWS签名认证关键环节,并对比普通电商接口的差异。随后
    的头像 发表于 09-22 10:05 866次阅读
    <b class='flag-5'>亚马逊</b> MWS <b class='flag-5'>API</b> 实战:商品详情精准获取与跨境电商数据整合方案

    亚马逊:调用订单退款API自动化处理售后请求,缩短用户等待时间

    ​ 在电商运营中,售后处理效率直接影响用户体验和平台声誉。亚马逊作为全球领先的电商平台,其订单退款API为卖家提供了强大的自动化工具,帮助高效处理退款请求,显著缩短用户等待时间。本文将逐步介绍
    的头像 发表于 09-11 15:37 787次阅读
    <b class='flag-5'>亚马逊</b>:调用订单退款<b class='flag-5'>API</b>自动化处理售后请求,缩短用户等待时间

    亚马逊:调用商品上传API实现全球多站点商品信息一键发布,降低人工操作成本

    ​ 在当今全球化电商环境中,亚马逊作为领先平台,拥有多个国际站点(如美国站、英国站、德国站)。手动上传商品信息到各个站点不仅耗时费力,还容易出错,导致运营成本居高不下。通过调用亚马逊的商品上传
    的头像 发表于 09-08 16:13 1474次阅读
    <b class='flag-5'>亚马逊</b>:调用商品上传<b class='flag-5'>API</b>实现全球多站点商品信息一键发布,降低人工操作成本