0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

规模化的投入让商汤从AI技术到应用均构建起壁垒

产业大视野 来源:未知 作者:李倩 2018-05-30 11:05 次阅读

导读

成立三年多,商汤累积融资额已超过10亿美元,但每年也在用数以亿计的速度消耗资本,有人认为,规模化的投入让商汤从 AI 技术到应用均构建起壁垒,也有声音指出:“商汤在烧钱”。

多数人认识商汤,都从“融资”开始。

去年7月,商汤 B 轮融资4.1亿美元,媒体报道其为“全球人工智能领域单轮融资最高纪录”。今年4月,商汤公布 C 轮6亿美元融资,在刷新融资纪录的同时,领投方也被证实为此前传言的阿里巴巴集团。

为了重塑 AI 底层框架,商汤建立起自己的超算中心,每年在采购 GPU 上的花费就超过上亿元。根据《财经天下》周刊报道,商汤公司的150位博士研究员,几乎每日都要在算法平台上进行数据训练迭代,单次花费就要至少50万元。

在完成技术积累后,商汤在战略上的新目标有了变化,是成为一家“能赚钱的公司”。

今年4月底,商汤一口气发布六款新产品,包括两款智能安防产品 SenseFace 3.0 平台与 SenseFoundry 方舟城市级视觉开放平台、两款AR生态产品 SenseAR 增强现实感绘制平台和 SenseAR 开发者平台、智能汽车产品SenseDrive DMS 驾驶员监控系统、以及 SenseMedia 智能图片视频审核平台。

从初期围绕视觉计算推出智能拍照、相机美颜,到如今在智慧城市(智慧安防、智慧商业、智慧楼宇)、手机、AR、自动驾驶等领域的广泛应用,商汤已从一家“人脸识别公司”扩展为包括更多产品体系的 AI 平台。

清晰的产品线,为商汤增加了多条“造血”管道,直接指向其公司的营收预期。

根据商汤官方透露的数据,自成立以来,商汤年营收平均增长率达到 400%。2017 年,公司实现正向盈利,营收在 1 亿美金左右。而目前商汤营收主要来自于四个方向:智慧城市、汽车、手机以及新型业务(其中智慧城市领域占比最大,超过 30%)。

从组建团队到实现商业化,商汤仅用了三年多。商汤联合创始人、CEO 徐立在公司快速发展过程中总结出两方面经验:

一方面,在公司内部,商汤采取了“1(基础研究)+1(产业结合)+X(行业伙伴)”模式。具体来说,一方面横向对安防、金融、零售等行业实现覆盖,另一方面通过合作伙伴在纵向产业里做深。按照徐立的说法,商汤过去是“SDK 级别”的赋能,现在是平台级别的开放。

外部环境上,中国政府对 AI 产业的扶持与鼓励,让智慧城市、金融、自动驾驶等场景的 AI 应用得以在政策上获得开放;中国市场的互联网用户规模与互联网场景长期积累的数据量,为其 AI 系统的验证与进化提供了土壤。

“未来五年到十年,中国的AI发展路线和欧美不一样。”徐立对钛媒体表示,“欧美将专注在 AI 基础研究技术的突破,他们的发展是阶跃式的;而中国是连续的,会在一些垂直行业、应用形成很好的结合。这恰恰是一个机会。”

掌握“大脑”

成立三年多,商汤累积融资额已超过10亿美元,但每年也在用数以亿计的速度消耗资本,有人认为,规模化的投入让商汤从 AI 技术到应用均构建起壁垒,也有声音指出:“商汤在烧钱”。

“很多人会误解我们,为什么商汤需要那么多机器(指超算中心),很多公司用开源系统也能做人脸识别。”徐立对钛媒体解释道。“其实,商汤是在造大脑”。

商汤联合创始人兼 CEO 徐立

徐立所说的“造大脑”,即重塑一个 AI 开发平台。从表象来看,这种做法无异于重复造车轮——不论是20年前就开源的LINUX,还是2015年 Google 开放的 TensorFlow,已经成为全球 AI 开发者的标配。

为什么商汤一定要掌握自己的大脑?

“AI 的核心在于,第一要有造脑的工具。造脑的工具如果都是别人的,造脑的能力和脑容量就受到了限制。第二是造脑的专业知识。即使有了工具,也需要有一个团队知道怎么去造脑。所以这两点是AI领域的核心差异化。”徐立说。

这样的结论源于商汤遭遇的现实局限。两年前,谷歌开源的 TensorFlow 仅支持一台服务器并行训练四张 GPU 卡片,但当时商汤的需求是要支持200台机器的训练,如果单纯依靠谷歌等开源系统进行创新,唯一的办法就是等待谷歌推出下一代“多机多卡”技术。

产品能力的提升则是商汤“造脑”后带来的直观收益。以商汤发布的智慧城市产品 SenseFoundry方舟城市级视觉开放平台为例,在企业客户不断添加业务数据后,商汤的“自循环生态系统”会利用数据对深度网络神经进行训练,最终实现人脸识别错误率能够降低到10的负11次方,但如果仅使用 Tensorflow ,准确率会降低近千倍。这种产品能力的巨大差异将直接影响安防行业客户的获取。

底层算法能够带来的时间窗口是商汤掌握大脑的另一点原因。

一个可以被参考的案例是美国 AI 初创公司 DeepMind,从 2014 年被谷歌收购,到 2016年其研发的AlphaGo 大败韩国棋手李世乭,在美国,类似的算法更迭几乎每十八个月就会导致 AI 性能的倍数级提升,这就给算法本身带来足够的时间窗口去布局。

而在用算法形成门槛后,AI 多元化就成为系统可以实现的目标。拿人脸识别来说,AI 公司已经将其从美颜拉长腿,逐渐拓展至交通安防、城市管理等更多场景,这种应用落地的方式又能为算法提供更多数据,让机器提升计算能力。

打个比方,大多数人的童年都学习过音乐和美术,即使成年后不从事相关工作,但幼年的学习在思维方式上训练了大脑。这个故事套用到“ AI 大脑”上,所谓的美颜、拉长腿、人脸识别就好比是“音乐、美术”等学科工具,只有先自主掌握大脑,再通过应用训练,大脑才能发挥作用。

“数据只是教材书本,大脑聪不聪明,直接决定了AI 系统的能力。”徐立对钛媒体说。

技术红线

从智慧城市、手机、AR再到自动驾驶,从底层算法到落地产品,商汤在四年时间不断延伸业务触角。

而已有的市场上,安防行业前有海康、大华等传统龙头,后有以“AI+安防”起家的依图;移动端的竞争者则包括了对手机市场虎视眈眈的旷视科技......随着产品线的扩展,商汤面临敌人或竞争者会越来越来多。

徐立并不这么认为:“你看到这个行业大家都在做,但各家算法的性能差距很大。”

这种由算法形成的壁垒落地在产品层面,徐立谈到了商汤可以实现的两个行业“唯一”。

一个是通过深度学习,为手机厂商提供AI双摄方案。传统双摄技术对硬件要求比较高,手机厂商需要使用一个支架将双摄像头框在一起,才能实现摄像头配准(对齐)的效果,这个支架成本在2美金左右。而商汤提供的AI双摄技术,是业内唯一不需要支架即可实现的,在减轻成本的同时完成更好的拍摄效果。以 oppo、vivo 、华为、小米等厂商各自超过8000万的年出货量来看,商汤的算法可以为它们每年省去超过1亿的成本。

通过深度学习,商汤可以为手机厂商提供AI双摄方案

另一点是为手机厂商提供整体的视觉识别应用服务。根据徐立透露,相较于部分厂商提供的单点式美颜、人脸解锁技术,商汤是业内唯一一家可以提供成像、感知、识别、理解一整套视觉内容解决方案的厂商。这一方面可以实现产品间的交叉销售,另一方面,算法涉及的诸如成像、图片增强、超分辨率等应用之间可以在深度学习引擎下相互促进准确率。

不只是商汤,利用算法以及技术壁垒在行业形成壁垒,几乎成为国内头部 AI 创业公司进行商业化落地的终极目标。

最初,商汤、旷视、依图、云从从图像视觉识别起家,初期均涉猎安防。而随着公司发展,曾经的“图像 AI 四小龙”也在具体业务中展现出差异化:旷视注重泛安防、手机等移动端应用;依图凭借“AI+医疗”拿到了 C 轮融资;云从正大力挖掘金融、银行客户。

事实上,类似的突破空间几乎存在于各个行业,徐立称这种行业需要的、但AI 系统尚未达到的能力为“技术红线”,谁能在某一领域率先突破技术红线,就能迅速占领市场份额。

以商汤与映客的合作为例,根据映客直播总监姜春生的介绍,通过商汤的视觉识别解决方案,映客的调帧时长延长了85%,识别时间缩短了31%。

在直播平台,调帧时长延长就意味着手机可以在更少的 CPU 损耗下采集更多的图像,特别是用户使用非 ios 系统的情况下,根据姜春生透露,商汤的方案让手机CPU消耗可降低25.6%;而在视觉识别层面,映客提供得主播“伸手要礼物”等手势互动,也因为AI 技术让虚拟礼物图像与主播的手势贴合得更为紧密。

同时,商汤、旷视等 AI 公司都在与今日头条、快手等平台合作,后者每年需招募上千人的团队,以审核平台可能出现的色情、暴力等非法信息

对此,徐立坦陈,当下 AI 行业在内容审核方面的准确率还没有达到人的标准,即没有高过“技术红线”,这也意味着,在一定期限内,哪家公司的算法可以在精准度上超越人类,就能对市场占有率产生重大影响。

嵌入产业

我们可以用模块化的组织来理解商汤。

技术上,商汤通过自建“大脑”(超算中心)形成更先进的算法;产品中,基于“大脑”衍生的多条线业务得以产生数据,并进一步训练底层的算法引擎——这样的技术壁垒也符合商汤创始团队的科学家背景,可在产品诞生后,如何“接地气”地卖出去,成为商汤面临的又一挑战。

“卖项目”还是“卖产品”成为摆在商汤面前的第一道选择。

根据数据统计机构 IDC 分析,2018年国内智慧城市(包括视频监控、出入口控制楼宇对讲等智能安防项目)市场规模达2万亿,在这样的市场需求环境下,“接单”并不难。AI 企业在掌握一定人脸识别技术后,也能按照项目制的方式,为政府、事业单位、社区等机构进行安防系统升级。

不过,单纯的“项目制”固然能为公司带来收入,但受限于投入的人力成本等原因,这类外包公司式的生意很难规模化,如果想突破人力成本带来的局限,就必须在了解行业需求后,针对共性需求提炼出标准化、可以大规模量产的产品,用产品能力替代人力花费的成本。

“我们必须完成可以量产的产品,不然就只能做项目,所以商汤一定是在项目和产品之间来迭代——拿到项目,找到共性,转化产品、扩大规模。”徐立对钛媒体表示。

找到产业上下游的合作伙伴,则是商汤提升产品黏性的另一种方式。

去年11月,国际通信巨头高通集团(Qualcomm Incorporated )对商汤进行战略投资,双方均未披露具体金额,但彼时高通正在加速 5G 技术的终端布局,对提升芯片的 AI 计算性能有着较大需求,这与商汤在算法侧的优势相契合。

“高通每年的芯片出货量有十亿,手机厂商很难有能力去消化这些高端芯片,但商汤具备从 OEM、手机厂商提炼出来的的 AI 应用能力,加上高通有计算硬件,就可以把人脸识别、物体追踪、AR 游戏等功能落地进智能手机内。”徐立说。

不止是高通,新的投资方也在引导商汤进入一个陌生领域。2017年8月,苏宁第一家无人店“苏宁体育Biu”开业,当中无人值守环境下的商品识别、用户定位、“刷脸”付款等技术均由商汤提供,这也为苏宁之后对商汤的投资埋下了伏笔。

除此之外,商汤也在以“投资人”的角色补足产品以及覆盖领域上的短板。去年12月,商汤与当代置业等机构共同领投了地产行业 VR 项目51VR,后者可以利用 VR/AR 设备对地产物业、自动驾驶等环境进行模拟体验,据报道,商汤目前计划投资的领域还包括游戏、AI芯片、医疗、物联网、手机以及移动互联网。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    773

    文章

    12998

    浏览量

    163130
  • 深度学习
    +关注

    关注

    73

    文章

    5222

    浏览量

    119863
  • ai技术
    +关注

    关注

    1

    文章

    1111

    浏览量

    23701

原文标题:3年融资超10亿美元,商汤拿什么成为 AI 独角兽?

文章出处:【微信号:robotn,微信公众号:产业大视野】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    商汤集团2023全年业绩亮眼,生成式AI业务爆发式增长

    商汤集团近日发布了截至2023年12月31日的经审核全年业绩报告,展现了集团在AI领域的强劲增长势头。在全新的战略布局下,商汤明确了三大业务板块:生成式AI、传统
    的头像 发表于 03-27 09:14 259次阅读

    商汤科技AI技术助力肝脏诊疗一体化

    商汤科技在肝脏诊疗领域积极探索创新AI技术的应用,成功推出了SenseCare®腹部智能临床方案,这一方案涵盖了肝脏CT、MR多模态影像辅助诊断、手术规划等多个环节,为肝脏诊疗一体化流程提供了强大的
    的头像 发表于 03-19 10:24 180次阅读

    NanoEdge AI技术原理、应用场景及优势

    NanoEdge AI 是一种基于边缘计算的人工智能技术,旨在将人工智能算法应用于物联网(IoT)设备和传感器。这种技术的核心思想是将数据处理和分析云端转移到设备本身,从而减少数据传
    发表于 03-12 08:09

    【书籍评测活动NO.30】大规模语言模型:理论到实践

    大模型实践和理论研究的过程中,历时8个月完成 《大规模语言模型:理论到实践》 一书的撰写。希望这本书能够帮助读者快速入门大模型的研究和应用,并解决相关技术问题。 本书一经上市,便摘得京东新书日榜销售
    发表于 03-11 15:16

    商汤科技与库醇科技达成合作 为垂域大模型构建高质量大规模的领域微调数据

    数字化转型,为垂域大模型构建高质量大规模的领域微调数据。   本次合作将基于商汤通用大模型进行二次开发,给模型注入领域知识, 训练一个专门根据葡萄酒爱好者问题生成关键词的大模型 。    
    的头像 发表于 01-10 09:46 474次阅读
    <b class='flag-5'>商汤</b>科技与库醇科技达成合作 为垂域大模型<b class='flag-5'>构建</b>高质量大<b class='flag-5'>规模</b>的领域微调数据

    【KV260视觉入门套件试用体验】Vitis AI 构建开发环境,并使用inspector检查模型

    /vitis-ai-cpu:latest 第二步,可以使用了………完……… (^_^),当然不是这么简单,Vitis AI 不仅仅是一个工具,而是一个综合的 AI 推断开发平台,它包括了
    发表于 10-14 15:34

    欧莱新材IPO丨持续研发投入构建核心技术壁垒

    、欧莱新材半导体集成电路靶材研发试制基地项目及补充流动资金。 持续研发投入构建核心技术壁垒 作为国家高新技术企业,欧莱新材一直以来高度重视技术
    的头像 发表于 10-12 15:13 431次阅读

    ICCV 2023生成式AI引人瞩目,商汤多项技术突破展现中国“创新力”

    AI相关的热点方向。 基于商汤AI大装置SenseCore和“日日新SenseNova”大模型体系。 在生成式AI和视觉大模型等领域, 商汤
    的头像 发表于 10-04 18:50 663次阅读
    ICCV 2023生成式<b class='flag-5'>AI</b>引人瞩目,<b class='flag-5'>商汤</b>多项<b class='flag-5'>技术</b>突破展现中国“创新力”

    存算一体芯片的技术壁垒

    作为后摩尔时代发展的必然趋势之一,存算一体越来越受到行业的关注。在存算十问的前六问中,我们梳理了存算一体的技术路线、挑战和通用性等问题,这一次我们从技术壁垒入手,邀请后摩智能的几位研发人员来谈谈
    的头像 发表于 09-22 14:16 424次阅读
    存算一体芯片的<b class='flag-5'>技术壁垒</b>

    点燃AI梦想,2023商汤奖学金申报开启

    165名优秀本科生 ,这些学生来自众多知名高校,包括 清华大学、北京大学、上海交通大学、浙江大学、中国科学技术大学 等。 在商汤奖学金的资助下,有些在专业领域持续耕耘、博士期间发表数十篇AI国际顶会高水平论文,有些参与到极具国
    的头像 发表于 09-13 16:45 1234次阅读
    点燃<b class='flag-5'>AI</b>梦想,2023<b class='flag-5'>商汤</b>奖学金申报开启

    商汤上半年营收14.33亿 生成式AI相关收入大增近7倍 上半年亏损收窄至31亿

    年上半年营收为14.33亿元,较上年同期的14.15亿元增长1.3%;毛利为6.49亿,毛利率为45.3%。 商汤一直对大模型大力持续投入也开始反应在业绩上,2023年上半年,商汤科技生成式A
    发表于 08-29 16:39 268次阅读

    雏鹰试翼,商汤教育助力“AI少年工程师”逐梦NOC大赛

    商汤教育 为 近300支参赛队伍 提供技术保障 。 共覆盖全国15个省份,4个直辖市。 立足该项赛事,商汤教育为 来自全国各地的中小学生,搭建探索AI
    的头像 发表于 07-27 11:00 527次阅读
    雏鹰试翼,<b class='flag-5'>商汤</b>教育助力“<b class='flag-5'>AI</b>少年工程师”逐梦NOC大赛

    研发投入逐年增长,威迈斯IPO上市持续夯实技术壁垒

    技术壁垒。据威迈斯IPO上市招股书披露,威迈斯研发活动始终围绕客户需求及市场发展趋势进行,以实现技术产业化为目的。公司通过持续的研发投入技术创新,形成了16项具
    的头像 发表于 05-18 17:30 354次阅读
    研发<b class='flag-5'>投入</b>逐年增长,威迈斯IPO上市持续夯实<b class='flag-5'>技术壁垒</b>

    蜂巢能源智造方法论:“规模化+数智化”角力TWh时代竞争

    进入规模化制造时代,电池行业的科技属性逐渐回归到制造属性。头部锂电厂商技术趋同趋势下,竞争核心将体现在企业的制造能力上。
    的头像 发表于 05-08 11:42 632次阅读

    如何Segger J-Link将代码IDE闪存/调试评估板?

    功...... 编程电缆接线如下... 如何 Segger J-Link 将代码 IDE 闪存/调试评估板?
    发表于 05-04 08:34