0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

3D视觉正在成为计算机视觉的下一个爆发的赛道

DPVg_AI_era 来源:未知 作者:李倩 2018-08-11 10:24 次阅读

The Inquirer网站称,苹果iOS 12系统将支持横向Face ID解锁,而2018年秋季新品发布会发布的三款iPhone手机,也都将支持Face ID解锁。苹果引领了3D视觉+AI的潮流,旷视对标苹果,整合技术、构建完整产业链,发布“软硬一体”的移动端3D感知全栈解决方案。

旷视要对标苹果。

2018年,3D视觉成为CV界最新最火的赛道之一,以苹果Face ID引领的“刷脸”风潮,落脚到中国,就成为安卓智能手机厂商的博弈,华为、OPPO、vivo等都先后启用了3D视觉功能。

作为其背后3D视觉技术或者说解决方案的提供商,几家CV头部公司之间的竞争又变得激烈而且直接起来。

智能手机厂商作为甲方,有意让各家3D视觉技术提供商彼此竞争,然后择胜者为合作方。

但无论是手机厂商还是3D视觉技术提供商,他们前面都横着一个共同的敌人——苹果。

据The Inquirer爆料,苹果2018年的“iPhone”将采用与首次应用在iPhone X上的Face ID技术,三款不同尺寸的iPhone手机均支持Face ID解锁,而传说中的iPhone X Plus将拥有“第二代”3D扫描技术。

同时,苹果iOS 12系统将对Face ID升级,支持横向Face ID解锁。

Face ID的应用有利于Apple服务和生态系统的推广,更为重要的是,以Face ID为代表的人脸解锁技术将继续引爆3D视觉在手机端的应用,并开拓安全支付、3D美颜、3D整形等广阔场景,让3D为手机带来的更多能力。

赛道前方风景无限美好,但玩家众多。与苹果并存的安卓阵营中,旷视等靠CV起家厂商在整合技术、构建完整产业链,试图靠“AI+3D”实现跑马圈地,落地多种场景。

2018年iPhone或全配置Face ID,安卓阵营跟进3D视觉+AI算法

2017年,苹果iPhone X引领了安卓阵营的几个潮流:全面屏、AI芯片和人脸解锁。其中,基于3D结构光技术的Face ID 技术为人们带来了强大的人脸识别解锁和支付新应用,成功开启AI与3D创新发展的新浪潮。

目前,Face ID只能在垂直握住手机时完成识别,不支持水平解锁。

The Inquirer网站称,苹果iOS 12系统将支持横向Face ID解锁,而2018年秋季新品发布会发布的三款iPhone手机,也都将支持Face ID解锁。

另有消息称,Face ID的功能也将要在Mac电脑上运行,当Mac电脑处于睡眠模式时也能时刻完成刷脸要求。

Face ID采用的TrueDepth摄像机会在用户的脸部投射多达3万个点来绘制3D图像,苹果的A11仿生芯片会对这些数据进行处理,并使用机器学习进行分析。随着时间的推移,Face ID会自主学习,对用户面部做扩充匹配,结果是戴眼镜或改变发型之后,Face ID仍然能够准确识别。

Face ID的应用引领了3D视觉+AI算法结合的潮流。安卓阵营里,OPPO、vivo、小米等国产手机厂商旗舰系列都在采用3D视觉技术。

手机型号 技术原理 软件供应商
iPhone X 3D结构光 Apple(PrimeSense)
OPPO Find X 3D结构光 旷视
vivo(MWC发布技术) 3D TOF 旷视

一方面,Face ID背后的3D视觉让“刷脸”手机中的一种全新的交互方式,并让安卓的“二维拍摄”得到进步;另一方面,3D视觉开拓出安全支付、AR游戏、虚拟试穿等应用上,持续探寻3D能为手机带来的更多能力。

以旷视为例,旷视2017年发力手机市场,随后推出人脸支付、人脸识别解锁、人像光效、人像背景虚化等一系列移动端AI产品,应用在人脸解锁、图像增强、视频处理等方面。

对标苹果,旷视发布“软硬一体”3D感知全栈解决方案

AI+3D视觉也是国内计算机视觉的下一个爆发赛道。

最近,旷视首次发布“软硬一体”的移动端3D感知全栈解决方案,从算法创新、应用开发、设备制造到解决方案打造四个层面,阐释旷视最新、最全面的“AI+3D”发展脉络。

旷视科技云事业部高级副总裁吴文昊介绍,“手机3D视觉领域虽然已有多种类型的应用案例出来,但该领域包含算法和模组的软硬一体整体解决方案仍是缺位的,旷视科技正在尝试一种从上往下的整合方案。”

旷视科技云事业部高级副总裁吴文昊

在旷视发布的软硬一体移动端智能3D产品解决方案中,最上面一层是3D应用层,往下依次至AI算法、解决方案,最后到摄像、传感等硬件设备制造上。

3D 应用:目前在手机3D视觉能力开发方面,旷视研发的3D人脸识别解锁和3D人像光效应用已经实现了大规模的应用,并且还在业内开发出全面可用的安全支付、3D 美颜、3D 整形等应用。下一步,旷视将投入到AR游戏、虚拟试穿等应用上,持续探寻3D能为手机带来的更多能力。

3D 算法:在AI+3D的底层算法研发方面上,旷视专注于识别和重建两个大类。识别即机器感知、理解世界的能力,也是旷视的强项所在,基于旷视自研的MegBrain深度学习引擎,旷视在人脸识别、人体识别、活体检测、注意力检测追踪及其他图像识别的算法层面拥有业界顶尖的技术实力。

重建即把识别出的物体进行三维重建,是开发针对人、针对物的3D视觉应用核心所在,旷视目前已在人像3D建模、人体3D建模及物体几何测量算法研发方面走在世界前列,并与Bellus 3D、Altizure等3D视觉企业开展了联合研发合作。

Altizure城市3D建模成果

解决方案:不同的应用场景需要不同的3D视觉解决方案,旷视及合作伙伴根据不同应用场景中对深度计算、深度修复、深度优化、标定、畸变校正等能力的需求,设计出基于双摄、三摄、深摄的丰富解决方案,在整合结构光、TOF、双目等不同的摄像、传感系统架构上拥有成熟的应用经验。

硬件模组:移动端3D产业链最下面一层是硬件制造,包含摄像头、传感器、芯片等硬件模组的研发。结构光、TOF和双目方案涉及到高清摄像头、IR投射器、IR接收器、激光发光器等设备的搭配组合,旷视目前已经与艾迈斯半导体等3D硬件模组厂商展开合作,在业界率先建立起软硬一体的3D视觉技术优势。

七成Top20国产手机使用旷视方案,3D+AI能出现杀手级应用

OPPO最新旗舰手机Find X采用旷视科技Face++移动端3D人脸识别解决方案,Face++为提供了识别检测、活体检测和注意力检测三个主要算法模型结构,让成为Find X安卓首款实现3D人脸支付的手机。

吴文昊透露,目前华为、OPPO、vivo、小米这些国内厂商都在使用旷视的3D视觉产品,Top的20国产手机品牌中,旷视产品占到70%。

不过,在吴文昊看来,3D视觉现在处于软硬分离的状态,还缺少一个整合的角色。

旷视“软硬一体”3D感知全栈解决方案的逻辑是,希望Face++能起到整合的角色,把软件、硬件、算法、应用统统整合在一起,只有整合者出现之后,整个3D落地才会大大加速。

至于未来3D视觉领域的杀手级应用出现,吴文昊认为有三个条件:

1、新的硬件形态。手机已经陪伴我们10多年,将来会有新的消费电子产品出现,吴文昊认为,这样的电子产品一定是以3D、AR为主要卖点的产品,并不遥远。“可能现在的想象力还想象不到,我认为会慢慢会看到一些新形态突然之间起来,占领更多的碎片化时间。”

2、3D一定要跟智能化结合起来,AI+3D一定是非常大的杀手级应用场景。现在,像AI Camera拍张照片,机器识别理解蓝天、草地,加上3D的物理信息,一定会做出非常好非常酷的拍照效果,AI+3D一定是个方向。

3、随时随地的产品。从2014年移动互联网崛起,能够随时随地把用户所有碎片化时间和精力全部发挥出来,让人们看到无数的场景。电商、O2O、共享,当3D的变得无处不在,变得随时随地可以对真实世界进行建模,这是非常酷的一件事情。

2018 CV界最大看点,谁能笑傲3D视觉?

苹果目前是3D视觉的绝对领导者,在3D视觉方面积累了丰厚的专利,在硬件配置上也舍得砸钱。

近年来,智能手机销量放缓,任何技术上的革新都将成为推动整个产业上升的动力。从三星到华为再到小米,眼下业界都把最炽热的目光放在了3D视觉上。

而作为3D视觉解决方案的提供商,各家也是铆足了劲,因为心里多少都明白,最终拼的就一个词——速度。技术发展到最后总会趋同,因此看的就是谁能更快地实现性价比更高的方案。

就跟芯片行业一样,在3D视觉这个领域,技术最高或者说解决方案最好的那几家头部公司,将占据绝大部分的市场。这并不是一个能靠低成本、低技术抢占份额的领域,虽然目前看来3D视觉的机会窗口仍然没有关闭,但留给后来者的时间也不多了。

正因如此,苹果才在业界如此受人仰望。更不用说,苹果早就想好了3D视觉做成后的一系列软件应用和开发者生态,AR/VR也布局深远。

苹果Face ID的两家关键合作商,一个是Bellus 3D,其创始人 Eric Chen 曾是苹果公司 Quicktime VR 项目的创建人之一,有30年3D研发的经验,可以说是首批做3D和VR的中国人。

Eric Chen

2015年,Eric Chen 创建Bellus3D,专注于为手机等移动设备提供高解析度的3D人脸扫描、建模技术和产品。Bellus 3D 是最早采用“ active stereo”(主动式立体)深度感测技术打造3D面部扫描相机的企业,通过将 Bellus3D Face Camera Pro与智能手机或平板电脑连接就可以检测人脸上的50万个3D点,在几秒钟内创建出高分辨率和高精确度的面部模型,同时扫描后的面部模型可以进一步应用于人脸的识别、分析和动画制作。

Bellus3D研发的3D面部扫描相机

作为最先一批探索3D视觉技术的华人,Eric Chen 认为,移动端3D人脸扫描摄像机市场近年将迸发强大的市场潜力,而做好3D感知和人脸识别技术的创新结合将成为发展关键。

所以,当旷视联系到Bellus3D时,双方几乎是一拍即合。

同时,旷视的联合创始人兼CEO印奇,本身也有一段“软硬结合”的经历,他是先学的软件,博士又学了硬件,深知产业链上下游整合的重要性。奥地利芯片商艾迈斯(AMS)是苹果Face ID的芯片提供商之一,这次旷视3D视觉的朋友圈里,也出现了AMS的身影。

左起依次为,旷视科技Face++高级副总裁吴文昊、Bellus 3D联合创始人兼 CEO Eric Chen、艾迈斯半导体大中华区销售和市场副总裁陈平路、Altizure的联合创始人兼 CEO 方天、叠境数字科技联合创始人兼 CEO 洪煦。

因此,对标苹果,打造软硬件一提的3D视觉解决方案,旷视绝对不是喊喊口号而已。

中国是如今全球最大的智能手机市场,在这里完全有可能诞生下一个苹果,当年余承东举着华为Mate10介绍麒麟970芯片里的NPU好让人扬眉吐气。在3D视觉的赛跑中,谁能成为NPU乃至整个芯片的提供者,则是以旷视为代表的计算机视觉公司,最大的看点之一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 苹果
    +关注

    关注

    61

    文章

    23667

    浏览量

    191588
  • 计算机视觉
    +关注

    关注

    8

    文章

    1596

    浏览量

    45602
  • 3D视觉
    +关注

    关注

    4

    文章

    393

    浏览量

    27297

原文标题:对标苹果,中国CV独角兽亮出3D+AI秘密武器

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    机器视觉、工业视觉计算机视觉这三者的关系

    机器视觉、工业视觉计算机视觉这三者的关系
    的头像 发表于 01-24 10:51 565次阅读
    机器<b class='flag-5'>视觉</b>、工业<b class='flag-5'>视觉</b>和<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>这三者的关系

    工业视觉计算机视觉的区别

    工业视觉主要解决以往需要人眼进行的工件的定位、测量、检测等重复性劳动;计算机视觉的主要任务是赋予智能机器人视觉,利用测距、物体标定与识别等功能实现对于外界位置信息、图像信息等的识别与判
    发表于 01-16 10:06 109次阅读
    工业<b class='flag-5'>视觉</b>与<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的区别

    最适合 AI 应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 12-18 13:09 6852次阅读
    最适合 AI 应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?

    什么是计算机视觉计算机视觉的三种方法

    计算机视觉是指通过为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 11-16 16:38 3114次阅读
    什么是<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>?<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的三种方法

    最适合AI应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 11-15 16:38 234次阅读
    最适合AI应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?

    STM32低功耗计算机视觉应用:后装智能无线抄表模型

    STM32低功耗计算机视觉应用:后装智能无线抄表模型
    的头像 发表于 09-21 17:55 518次阅读
    STM32低功耗<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>应用:后装智能无线抄表模型

    计算机视觉前景光明

    电子发烧友网站提供《计算机视觉前景光明.pdf》资料免费下载
    发表于 09-18 10:16 0次下载
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>前景光明

    人工智能计算机视觉方向是什么

    人工智能计算机视觉方向是什么 人工智能计算机视觉方向是指利用人工智能技术对图像和视频进行各种分析、解释和操作的过程。计算机
    的头像 发表于 08-15 16:06 1188次阅读

    机器视觉计算机视觉的区别

    机器视觉计算机视觉的区别 机器视觉计算机视觉是两个相关但不同的概念。虽然许多人使用这两个术语
    的头像 发表于 08-09 16:51 1119次阅读

    计算机视觉是什么 计算机视觉历史及发展趋势

    正像其它学科一样,一个大量人员研究了多年的学科,却很难给出一个严格的定义,模式识别如此,目前火热的人工智能如此,计算机视觉亦如此。与计算机视觉密切相关的概念有
    发表于 07-20 15:41 0次下载

    计算机视觉的概念和主要任务

    作为人工智能的关键领域之一的计算机视觉近期再次成为了热点,那么你真的了解什么是计算机视觉吗?
    的头像 发表于 07-17 11:20 883次阅读

    计算机视觉体温测量系统

    电子发烧友网站提供《计算机视觉体温测量系统.zip》资料免费下载
    发表于 07-03 11:31 0次下载
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>体温测量系统

    计算机视觉驱动的迪斯科开源分享

    电子发烧友网站提供《计算机视觉驱动的迪斯科开源分享.zip》资料免费下载
    发表于 06-30 14:48 0次下载
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>驱动的迪斯科开源分享

    什么是机器视觉?机器视觉计算机有什么关系?

    机器视觉计算机视觉有什么区别
    的头像 发表于 06-05 09:28 859次阅读
    什么是机器<b class='flag-5'>视觉</b>?机器<b class='flag-5'>视觉</b>与<b class='flag-5'>计算机</b>有什么关系?

    计算机视觉相关概念总结

    为了帮助同事和客户了解更多有关计算机视觉和AI的更多信息,我们言简意赅介绍一些计算机视觉和AI术语,希望能帮助到大家。
    的头像 发表于 05-31 10:11 514次阅读