0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商品识别在零售行业的应用,商品识别的难点

倩倩 来源:lq 2019-09-02 15:42 次阅读

世界顶尖人工智能交流合作平台2019世界人工智能大会于8月29日在上海世博中心开幕。计算机视觉作为在很多领域都有广泛应用场景的前沿技术,受到了广泛关注。

接触人工智能技术,大多人都是从计算机视觉领域中的人脸识别开始,从安防到手机开屏都有了广泛的应用。而与人脸识别相对应的是物体的识别,其中的商品识别由于在零售行业有广泛的应用空间,最近两年逐步受到行业内头部人工智能企业的重视,包括腾讯、旷视、商汤等都在商品识别领域有广泛的研究。本次大会上,我们也看到了从核心技术到产品落地,商品识别开始有了更大的突破。

商品识别在零售行业的应用

线下数字化是我们生活实现智能的一个前提,也就是人类的出行生活等都可以被计算机所理解和描述,从而可以被进一步的优化。我们在网络上的所有行为都是数字化的,比如在淘宝上看过哪些商品,看了多久,在百度上搜索过什么内容,在微信上的聊天,在头条的新闻浏览,这些行为都能被计算机捕捉,并被应用方作为产品优化的主要依据。而线下的数字化就难了很多,计算机视觉是实现线下数字化的一个重要技术。

类似于淘宝购物,如果商超能够实现对顾客从进店那一刻起的所有行为进行识别和分析,那么会大大提升店内的商品优化和运营效率。这个领域的核心技术为人的识别(人脸识别、用户重识别Re-ID以及用户行为分析)和商品识别。而商品识别同时还有货架排面分析,自动结算等方面的应用,是解决线下数字化的一个核心技术点。

商品识别的难点

“人脸识别和商品识别哪个更难?”这是很多人经常问的一个问题。首先这个问题不是很科学,任何问题在不同的场景都可以很难或者比较容易。从算法模型来看,人脸识别模型可以做到手机上,而商品识别基本上不可能做到,也就是商品识别的模型一般会比人脸识别的模型大很多。商品识别最大的难度在于商品种类的多样性和多角度识别。很多应用场景会要求对商品的各个角度能够识别,我们简单理解一下,如果人的识别也要做到看后脑勺就能识别,是不是难度高了好几个级别。另外一个方面是很多人脸识别是配合型的,但是商品识别基本都是不配合型的。

从技术上来看,商品识别分为两个步骤,第一步是目标检测,也就是在一个图片上先找到一个或者多个感兴趣的目标,一般用一个叫bounding-box的画框把目标抠出来。第二步是对这个画框的内容进行识别,区分具体是哪个商品。在大部分场景,第一步目标检测的难度是远远超过识别的难度。我们来看一个例子。

这是一个用手机拍摄的货架排面检查图片,图片里大概有几百个商品,这种高密集的目标检测,要做到一个不多一个不少是很困难的。现在流行的目标检测模型faster-rcnn或者yolo都不是针对这种高密集目标检测设计的,比较容易造成漏框和多框的错误。如果这个拍摄的摄像头是安装在店内的顶部,造成的拍摄角度会大大增加检测的难度。

商品的识别大部分是在特定的场景下进行,具体的物理摆放会大大增加识别的难度。下图是一个智能零售柜内用鱼眼摄像头拍到的图片,我们可以看到大部分商品只漏顶部的一些信息,有些只漏出瓶盖的部分,这样对类似商品的区分大大增加了难度。

在实际商品识别应用中,单纯一个识别模型很难解决实际的问题,往往需要通过物理条件的改变,以及多模型的融合才能达到可以应用的水平。模型复杂度的增加也会影响最后的计算资源成本。

商品识别目前处于什么水平

商品识别最早的应用场所是拍照购物,通过图像识别找到同款商品。早在10年前硅谷有个创业公司SnapTell’s就是做类似的产品,在2009年被亚马逊旗下公司A9收购。后来的图片社区pinterest和谷歌图片搜索都有类似的功能。

国内的淘宝拍立淘是阿里自研的图片购物产品,其优势在于淘宝巨大的图片库。而电商的另一巨头京东拍照购的核心算法是由海深科技在2017年上线提供的。海深科技在小物体的目标检测方面有行业内前沿性的技术,能够准确的检测和识别穿在脚上的鞋子等小物体。同时海深科技为小红书、搜狗等应用提供图像识别服务,提供图像变现的新途径。目前对电商网站用户评论区的图片进行同款搜索,海深科技的top20的准确率在75%左右,处于行业领先地位。本次AI界盛会上,海深科技也受邀参展,并现场展现了基于商品识别技术的智能产品。

Amazon Go的自动结算方案是商品识别的另外一个重要应用场景,但是由于开放式的环境,一般都还需要利用重量感应器等其它辅助手段才能达到一定的准确率。而场景可控的智能零售柜成为一个新的零售终端方式,在办公楼、学校、医院等场景得到了大力的推广。虽然有物体密集摆放、鱼眼摄像头造成的图像畸形以及遮挡等问题,海深科技推出的G-BOX AI 零售柜在实际应用场景中能够达到99.8%的准确率,无论是在识别速度还是准确率方面,都处于领先水准。

不同于人脸识别已经有多个权威的测试数据集,商品识别并没有统一的标准和测试数据,造成这个领域的学习成本很高。我们了解到海深科技正在建设商品识别数据共享平台,把商品数据和算法以服务的方式开放给应用方,推动这个领域的技术发展。

商品识别的发展趋势

边缘化计算是商品识别的一个趋势。由于模型的复杂程度,大部分商品识别算法只能部署在云端GPU完成计算。这个也是商超线下数字化目前遇到的困境,巨大的带宽需求和计算资源造成单店成本过高。随着嵌入式计算的发展,更多的计算能够在前端完成,增加部署的灵活性。

图像识别这几年的快速发展,很大程度受益于李飞飞教授主持的ImageNet大量标注图片数据集。同样的道理,由于商品种类的繁多性,靠一个公司或者团体的能力,很难提升算法的泛化能力,也就是单一算法只能适用于非常有限的场景,很难形成规模化效应。数据共享和算法开放将会成为人工智能发展的一个重要趋势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 核心技术
    +关注

    关注

    4

    文章

    619

    浏览量

    19396
  • 人脸识别
    +关注

    关注

    76

    文章

    3954

    浏览量

    80555
  • 计算机视觉
    +关注

    关注

    8

    文章

    1598

    浏览量

    45605
收藏 人收藏

    评论

    相关推荐

    如何使用Python进行图像识别的自动学习自动训练?

    如何使用Python进行图像识别的自动学习自动训练? 使用Python进行图像识别的自动学习和自动训练需要掌握一些重要的概念和技术。在本文中,我们将介绍如何使用Python中的一些常用库和算法来实现
    的头像 发表于 01-12 16:06 212次阅读

    情感语音识别的应用与挑战

    一、引言 情感语音识别是一种通过分析人类语音中的情感信息实现智能化和个性化人机交互的技术。本文将探讨情感语音识别的应用领域、优势以及所面临的挑战。 二、情感语音识别的应用领域 娱乐产业:在娱乐产业
    的头像 发表于 11-30 10:40 278次阅读

    情感语音识别的研究方法与实践

    一、引言 情感语音识别是指通过计算机技术和人工智能算法自动识别和理解人类语音中的情感信息。为了提高情感语音识别的准确性,本文将探讨情感语音识别的研究方法与实践。 二、情感语音
    的头像 发表于 11-16 16:26 267次阅读

    电脑无法识别的usb设备怎么解决

    Android系统插上USB连接到电脑,提示"无法识别的USB设备"
    的头像 发表于 10-10 16:20 2930次阅读
    电脑无法<b class='flag-5'>识别的</b>usb设备怎么解决

    生物识别和人脸识别的区别

    对人脸图片或视频进行分析和识别,以确定个体身份的一种方法。本文将探讨生物识别和人脸识别的概念、应用领域和区别。
    发表于 08-28 17:29 874次阅读

    面部表情识别在医疗领域的应用

    面部表情识别在医疗领域具有广泛的应用。通过对面部表情的识别和分析,可以获取患者的情感状态和生理状况,为医疗诊断和治疗提供重要的参考信息。本文将探讨面部表情识别在医疗领域的应用,包括情感障碍诊断、疼痛
    的头像 发表于 08-10 18:03 338次阅读

    人脸识别的算法有哪些

    人脸识别的算法有哪些 人脸识别算法现在已经广泛应用于各个领域,如安防、商业、医疗等。人脸识别算法可以分为传统人脸识别算法和深度学习人脸识别
    的头像 发表于 08-09 18:34 3513次阅读

    面部表情识别在社交媒体中的应用

    面部表情识别在社交媒体中有着广泛的应用,可以帮助人们更好地理解和处理社交媒体信息,从而提高社交媒体的交互性和用户体验。本文将探讨面部表情识别在社交媒体中的应用,包括情感分析、个性化推荐、虚拟助手
    的头像 发表于 08-09 16:04 346次阅读

    面部表情识别在安全领域的应用

    面部表情识别在安全领域有着广泛的应用,可以帮助安全系统更加精准地识别和判断人的的情绪和心理状态,从而提高安全系统的效率和准确性。本文将探讨面部表情识别在安全领域的应用,包括人脸识别、情
    的头像 发表于 08-08 22:33 337次阅读

    面部表情识别的伦理问题

    面部表情识别是一项涉及隐私和伦理的技术,其在应用过程中可能会引发一系列伦理问题。本文将探讨面部表情识别的伦理问题,包括隐私保护、种族和性别偏见、情绪识别准确率等方面。 首先,面部表情识别的
    的头像 发表于 08-04 18:20 594次阅读

    如何利用数据构建零售智能?

    英特尔的Marta Muszynska 和戴尔的Siobhan Lynch 讨论“如何利用数据建立零售情报”
    发表于 08-04 07:51

    人脸识别和指纹识别哪个安全?人脸识别和指纹识别的利弊及风险

      人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技
    发表于 08-03 16:55 2383次阅读

    面部表情识别在人机交互中的应用

    随着人工智能技术的不断发展,人机交互已经成为了人们生活中不可或缺的一部分。面部表情识别作为人机交互的重要组成部分,有着广泛的应用场景和价值。本文将探讨面部表情识别在人机交互中的应用,包括情感识别
    的头像 发表于 08-02 18:03 625次阅读

    掌纹怎么是被识别的?掌纹识别与指纹识别有什么不同?

    从技术原理来看,掌纹识别的核心逻辑和人脸识别以及指纹识别一样,都是利用人体某方面的唯一性。人的面容无论看起来多么相似,但总会在结构上有细微差别。掌纹也是一样,人的掌纹是由万千纹线随机排列组合而成,这构成了掌纹的独特性与唯一性。
    发表于 06-03 14:17 1126次阅读
    掌纹怎么是被<b class='flag-5'>识别的</b>?掌纹<b class='flag-5'>识别</b>与指纹<b class='flag-5'>识别</b>有什么不同?