还未设置个性签名
成为VIP会员 享9项特权: 开通会员

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

商汤科技助力通用人工智能基础研究和生态构建

商汤科技SenseTime 来源:商汤科技SenseTime 作者:商汤科技SenseTime 2022-06-23 14:03 次阅读

一年一度的AI盛会再次来临!

近日,计算机视觉领域顶级国际会议CVPR 2022(Computer Vision and Pattern Recognition,即国际计算机视觉与模式识别)在美国新奥尔良正式召开。

据官方统计,今年CVPR有效论文投稿再创历史新高,竞争依旧十分激烈。

凭借对原创技术的不断投入以及SenseCore商汤AI大装置的支撑,商汤科技及联合实验室有71篇论文被录用,其中近1/4被录用为Oral口头报告,覆盖了3D视觉、自动驾驶等众多备受关注的AI研究与产业前沿领域和方向。

商汤科技还参与了多项CVPR竞赛,取得令人瞩目的成绩。

在Embodied AI 2022(2022具身智能挑战赛)中,商汤联合中科院自动化所、上海人工智能实验室,斩获RxR-Habitat赛道冠军。

作为全球具身智能研究领域的权威性竞赛,该比赛要求用自然语言控制解决室内机器人的导航问题。团队的方法达到90%以上的效果提升,导航准确率从24.08%提升至45.82%,导航保真度从37.39%提升到55.43%。

同时,在旨在推动基于深度学习的视觉编码技术而举办的CLIC(Challenge on Learned Image Compression)竞赛中,商汤团队提供的方案成功获得图像编码赛道冠军,不仅在全部三个测试码点上取得了最优的主观评测分数,还拥有所有深度学习方案中最快的解码速度。

技术创新直击行业应用痛点

商汤一直以来鼓励研究团队关注产业需求和痛点,将研究工作与实际业务场景相结合。

今年商汤入选的71篇论文,涵盖通用智能、自动驾驶、3D数字人、三维视觉等多个领域,既包括各领域基础研究突破,又直击行业应用痛点,部分研究更是兼具实用性与趣味性。

比如,在《Bailando: 3D Dance Generation via Actor-Critic GPT with Choreographic Memory》这篇论文中,研究人员提出了一种新的音乐到舞蹈框架Bailando,它可以驱动3D角色跟随音乐做出freestyle的舞蹈动作,而且不仅能保证动作的标准与美感,还能在时间上保持与不同音乐节奏的一致性。

当前,在AI、云计算等技术能力提升的背景下,数字人的应用范围日渐丰富,在社交、游戏、直播、虚拟偶像等领域逐渐融入我们的生活。商汤的这一研究无疑能让数字人更加智能、有个性,实现多样化的需求。

近年来,随着自动驾驶和激光雷达技术的发展,基于点云的目标跟踪也获得了更多的关注。针对点云数据特有的挑战和现有算法的缺陷,在论文《PTTR: Relational 3D Point Cloud Object Tracking with Transformer》中,商汤研究团队提出了一个新颖的点云跟踪框架PTTR,在多个数据集上显著提升了目标跟踪的准确性,为自动驾驶的安全运行打下了基础。

此外,在CVPR正式召开的前一周,商汤还举办了一场论文分享会,邀请到众多一作作者及学术嘉宾,分享自己的研究成果及心得。更多前沿论文解读,欢迎感兴趣的朋友移步商汤科技B站号了解(B站搜索“商汤科技SenseTime”)。

除论文外,在今年的CVPR上,商汤科技还联合北京航空航天大学刘祥龙教授团队,共同举办了面向复杂场景的鲁棒机器学习大赛——Robust Models towards Open-world Classification。

该比赛旨在加速开放世界场景下的鲁棒模型研究,推动新的以数据为中心的算法开发。大赛共吸引286只队伍、416位参赛者参加,获得了一致好评,推动了AI模型安全领域的研究探索与人才培养。

打造研究基础设施及生态

一直以来,商汤并没有把论文数量作为衡量公司技术发展水平的指标,而是通过为科研工作者提供高效科研的良好环境,鼓励和引导研究者从解决业界实际问题角度出发,做高水平、高质量的研究。

在科研环境方面,通过以SenseCore商汤AI大装置为核心的软硬件基础设施,为技术研发和落地提供重要基础支撑。研究人员能够快速实验并验证新的想法,加速创新与迭代。

在学术生态建设方面,2017年以来,商汤陆续与上海交通大学、南洋理工大学、浙江大学等十多所高校成立了联合研究院或实验室,并推动成立全球人工智能高校学术联盟,希望通过与学术界的紧密联系,促进各种学术成果的产生以及国际间的学术交流与合作。

此外,商汤持续巩固开源生态建设。基于视觉算法的开源项目OpenMMLab目前在GitHub已经拥有超过5万颗星,并成功向研究者和业界开源上千个模型。基于决策智能的OpenDILab去年在WAIC大会进行了发布,向学术和工业界开源。在大模型方向,商汤与上海人工智能实验室及高校联合发布了通用视觉技术体系"书生"INTERN,并开源了OpenGVLab,助力通用人工智能基础研究和生态构建。

这些都已成为商汤在多个前沿领域齐头并进,并在CVPR等国际顶会保持优异成绩的重要原因。未来,商汤将继续追求技术创新,推进研究在实际应用中的落地,为学术及产业界发展贡献力量。

原文标题:CVPR 2022 | 商汤再创佳绩,用技术创新直击行业痛点

文章出处:【微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

  • 计算机
    +关注

    关注

    16

    文章

    4864

    浏览量

    79195
  • AI
    AI
    +关注

    关注

    85

    文章

    20403

    浏览量

    238523
  • 人工智能
    +关注

    关注

    1561

    文章

    36388

    浏览量

    216735
  • 商汤科技
    +关注

    关注

    7

    文章

    259

    浏览量

    32046
收藏 人收藏

    评论

    相关推荐

    穿梭于货架之间的AI:数百家日本便利店开始使用机器人补货

      总部位于东京的初创企业 Telexistence 本周宣布将在日本数百家全家(FamilyMar....
    发表于 08-12 17:54 35次 阅读
    穿梭于货架之间的AI:数百家日本便利店开始使用机器人补货

    边缘AI推理将覆盖60%设备,莱迪思FPGA+sensAI 4.1组合拳如何打?

    ABI的研究调查表明,预计到2024年设备端的AI推理功能将覆盖近60%的设备。FPGA作为实现边缘....
    的头像 花茶晶晶 发表于 08-12 16:39 339次 阅读
    边缘AI推理将覆盖60%设备,莱迪思FPGA+sensAI 4.1组合拳如何打?

    英伟达AI技术 助体育运动大数据分析和收集提升内容价值

    人工智能在大数据分析应用的作用越来越大,更多的专业数据分析也开始采用上基于英伟达AI 技术来大幅提升....
    的头像 电子麦克风 发表于 08-12 16:32 360次 阅读
    英伟达AI技术 助体育运动大数据分析和收集提升内容价值

    大华视觉智能实景感知应用助力产业数智化升级创新

    大华股份研发中心副总裁李广义应邀出席大会,与现场众多专家、行业翘楚共同研讨新一代信息技术在诸多领域的....
    的头像 大华股份 发表于 08-12 13:42 157次 阅读

    NVIDIA SIGGRAPH的最新发布与重要更新

    在今年的 SIGGRAPH 2022 上,NVIDIA 宣布,为基于通用场景描述(USD)连接和构建....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:14 97次 阅读

    NVIDIA谈引发图形革命的三大驱动力

    AI、虚拟世界和数字人正在推动视觉设计进入更宽广的轨道。
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:12 93次 阅读

    Device Studio应用实例之BDF

    Device Studio(简称:DS)作为鸿之微的材料设计与仿真软件,能够进行电子器件的结构搭建与....
    的头像 鸿之微 发表于 08-12 10:38 98次 阅读

    Kneron的3D AI解决方案满足安全防范和现代化管理需求

    Kneron创办人暨执行长刘峻诚表示:“Kneron致力于发展人工智能在终端装置上的应用,3D AI....
    发表于 08-12 10:15 31次 阅读

    昇腾产业生态助推“北方算谷”数字经济发展腾飞

    “北方算谷”启幕暨沈阳人工智能计算中心上线并网仪式在辽宁省沈阳市浑南区举行。作为东北地区目前接入中国....
    的头像 华为计算 发表于 08-12 10:04 102次 阅读

    使用Eclipse Process Framework搭建嵌入式软件

      在设计医疗设备时,FDA QSR 规定的设计指南和法规可以与系统和软件开发中的最佳实践同时解决。....
    的头像 星星科技指导员 发表于 08-12 09:43 67次 阅读
    使用Eclipse Process Framework搭建嵌入式软件

    瑞为智慧机场解决方案覆盖全国2/3的千万级机场

    扎根租住行业的7年,深圳市优电智能有限公司(以下简称“优电智能”)的创始团队对这句话的理解应该更加深....
    的头像 瑞为技术Reconova 发表于 08-12 09:02 110次 阅读

    人工智能驱动、计算就绪的医疗平板电脑

    凭借安全设计理念,WMP-24K/22K/19K 还可配备 4KV 隔离 COM / LAN / U....
    的头像 星星科技指导员 发表于 08-11 16:17 238次 阅读

    为什么智能医院的医疗级平板电脑

      具有 3D 医学成像功能的 MXM 显卡还将医学成像提升到一个新的水平,并且还允许集成网络摄像头....
    的头像 星星科技指导员 发表于 08-11 15:59 208次 阅读

    人工智能注定要成为新的人工智能领先制造商吗?

    通用人工智能 (AGI) 是人造机器的概念,它可以模拟人类大脑的大规模复杂内部运作。如果没有真正的生....
    发表于 08-11 15:40 60次 阅读

    通信周动态

    行业相关 1、筑路数字经济 中兴通讯携创新终端产品亮相2022世界5G大会 8月10日,中兴通讯亮相....
    的头像 研精毕智 发表于 08-11 15:33 137次 阅读

    传感器在工业4.0预测性维护中的应用

    作为工业 4.0 的重要组成部分,本地决策系统在设备内或附近收集传感器数据,以此为依据做出正确判断,....
    的头像 十亿少男的梦 发表于 08-11 15:26 248次 阅读
    传感器在工业4.0预测性维护中的应用

    燧原科技发布基于OAI的E级液冷人工智能系统解决方案

    8月10日第四届OCP China Day 2022在北京召开,燧原科技与OCP Foundatio....
    的头像 燧原科技Enflame 发表于 08-11 14:08 210次 阅读

    17个机器学习的常用算法

    根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法的学....
    的头像 恬静简朴1 发表于 08-11 11:20 74次 阅读

    人类视觉和机器视觉到底有多大的相似性

    深度神经网络(DNNs)已经在人工智能领域取得了极大的成功,它们以图像识别、自动化机器翻译、精确医疗....
    发表于 08-11 11:03 111次 阅读

    嵌入式运动控制实现运动控制系统的微型化

     这种趋势所支持的其他应用程序包括3D打印和面向消费者的物联网设备。后者包括连接的家庭设备,如智能家....
    的头像 zlw_liang 发表于 08-11 10:38 102次 阅读
    嵌入式运动控制实现运动控制系统的微型化

    普渡机器人“葫芦”入驻波兰 带给顾客全新的消费体验

    继普渡机器人与波兰壳牌、必胜客等达成合作,波兰又一家披萨品牌连锁店Da Grasso也引入了普渡机器....
    发表于 08-11 10:26 107次 阅读

    禾赛与一清达成战略合作布局自动驾驶全生态

    一清创始人、董事长刘明表示:“一清创新始终致力于打造安全、稳定、可量产的无人驾驶整车,涵盖工业物流、....
    发表于 08-11 10:23 102次 阅读

    下一代人工智能基础设施的特征

    自动驾驶领域在近两年被大家所熟悉,主要的市场诱导因素是Tesla在辅助智能驾驶和采用全视觉技术的影子....
    发表于 08-11 10:02 70次 阅读

    华为机器视觉产业生态合作进入3.0时代

    2022年8月9日,智能视觉产业联盟第四次会议在延安召开。智能视觉产业联盟理事长段爱国、秘书长刘俊梅....
    的头像 华为机器视觉 发表于 08-11 09:57 241次 阅读

    零距离了解昇腾AI的软硬件能力

    旅行中的我们,总是在看一些关于过去的东西,比如自然的造化,历史的遗存。但或许你也会偶尔有个想法,想在....
    的头像 华为数字中国 发表于 08-11 09:54 323次 阅读

    沈阳人工智能计算中心正式上线并网

    “北方算谷”启幕暨沈阳人工智能计算中心上线并网仪式在辽宁省沈阳市浑南区举行。作为东北地区目前接入中国....
    发表于 08-11 09:52 48次 阅读

    基于昇腾AI的MoloSight针对不同的使用场景提供3种不同版本选择

    近日,基于昇腾AI,摩赛恩与华为携手推出质谱智能计算系统MoloSight,并正式加入昇腾万里伙伴计....
    的头像 华为计算 发表于 08-11 09:49 232次 阅读

    机器视觉系统的新市场包括哪些

    机器视觉 (MV) 和人工智能 (AI) 为各类前沿应用程序提供了宝贵的检测和分析功能。与所有先进技....
    的头像 新机器视觉 发表于 08-11 09:44 280次 阅读

    STD Bus 8085单板计算机开源分享

    电子发烧友网站提供《STD Bus 8085单板计算机开源分享.zip》资料免费下载
    发表于 08-11 09:34 10次 阅读
    STD Bus 8085单板计算机开源分享

    2024年设备端AI推理功能将覆盖近60%的设备

    去年莱迪思发布了sensAI 4.1解决方案,当时介绍的一个典型案例是用于PC智能和感知体验。如今,....
    的头像 电子发烧友网 发表于 08-11 09:32 183次 阅读

    NVIDIA Jetson TX2 NX GPU助力微链DaoAI加速数据处理

    微链 DaoAI是市场领先的3D 视觉和 AI 机器人系统供应商,拥有全球领先的 3D 视觉认知技术....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-11 09:31 127次 阅读

    NVIDIA发布Omniverse重要版本

    NVIDIA 新发布的工具和功能包括:Avatar Cloud Engine;DeepSearch ....
    的头像 NVIDIA英伟达 发表于 08-11 09:29 81次 阅读

    全新NVIDIA Omniverse ACE加速虚拟形象开发工作

    Omniverse Avatar Cloud Engine(ACE)为游戏、聊天机器人、数字孪生和虚....
    的头像 NVIDIA英伟达 发表于 08-11 09:24 128次 阅读

    中国人工智能核心产业规模超过4000亿元

    中国人工智能与实际经济融合进展明显,比如,在智能制造领域智能技术的应用极大提升了产品检测效率和设备利....
    发表于 08-11 09:22 78次 阅读

    NVIDIA 将为StreamLake释放更多视频云计算能力

    8 月 10 日,快手 StreamLake 品牌发布会正式举办,以“云启共生·水润万象”为主题,推....
    的头像 NVIDIA英伟达 发表于 08-11 09:19 138次 阅读

    参天生长大模型:昇腾AI如何强壮模型开发与创新之根?

    自2018年谷歌发布BERT以来,预训练大模型经过几年的发展,以强大的算法效果,席卷了以NLP为代表....
    的头像 脑极体 发表于 08-11 09:10 299次 阅读

    成都、安徽等地加强人工智能产业发展,力争2025年进入国内第一梯队!

    电子发烧友网报道(文/李弯弯)人工智能是引领新一轮科技革命和产业革命的战略性技术,各国对人工智能产业....
    的头像 Carol Li 发表于 08-11 08:27 481次 阅读
    成都、安徽等地加强人工智能产业发展,力争2025年进入国内第一梯队!

    MediaTek APU以DLA VPU为核心 高能效AI赋能全场景体验

    为新趋势而生 MediaTek APU 以深度学习加速器(DLA)、视觉处理单元(VPU),以及基于....
    发表于 08-10 19:30 106次 阅读

    小成本的V853 AI小开发板DIY设计

    全志最新发布的V853芯片拥有1T的NPU算力,还有Arm+RISC-V+NPU三核异构和丰富的音视....
    的头像 全志在线 发表于 08-10 17:36 93次 阅读

    长寿命远程无线传感器的关键

      相比之下,工业级锂离子电池可以运行长达 20 年和 5,000 次完整充电循环,具有更大的温度范....
    的头像 星星科技指导员 发表于 08-10 17:16 93次 阅读

    AI+边缘计算,让城市治理难题“看得见”

    国家“十四五”规划纲要强调“加快数字化发展,建设数字中国”,提出“以数字化助推城乡发展和治理模式创新....
    的头像 英码科技 发表于 08-10 16:59 139次 阅读
    AI+边缘计算,让城市治理难题“看得见”

    英特尔新的 Loihi 神经形态芯片模仿活体大脑

    英特尔新的 Loihi 芯片的设计方式模仿了活体动物的大脑功能。新的人工大脑内的通信是通过一系列“尖....
    发表于 08-10 16:17 37次 阅读

    人工智能的高峰和限制

    第一个高峰来源于人工智能概念的确立、以及符号主义算法的发展;第二个高峰来源于感知机、BP 网络、专家....
    的头像 city_prolove 发表于 08-10 15:00 87次 阅读

    基础密码学的概念介绍

    密码学和信息安全在如今的互联网行业当中非常重要,相关的理论知识和算法也在计算机系统的方方面面都被用到....
    的头像 算法与数据结构 发表于 08-10 14:32 80次 阅读

    基于NI USRP高思科技通感一体科研平台 赋能更多细分应用

    随着6G行至深处,作为其关键技术之一的通信感知一体化(ISAC)的研究获得了高度关注。通信感知一体化....
    的头像 恩艾NI知道 发表于 08-10 14:22 337次 阅读

    TDK开发世界上首款内置边缘人工智能的i3微模块

    工厂和生产基地需要防止机器和设备出现异常情况,以最大限度地减少停机时间。生产力可以通过预测问题和率先....
    的头像 TDK中国 发表于 08-10 14:09 121次 阅读

    fifa将采用半自动越位技术计算进球

    科技在各个领域都有用武之地,尤其是在体育运动中。最近,国际足联推出了一种系统,可以在未来的比赛中自动生成越位警报 令一些...
    发表于 08-02 21:36 1904次 阅读

    三分钟学习NCNN算法移植

    前言      本文是基于EASY EAI Nano移植NCNN部署库的方法与NCNN成功运行yolov4的Demo所做...
    发表于 07-18 18:21 891次 阅读
    三分钟学习NCNN算法移植

    香蕉派 BPI-CM4计算机模组,采用Amlogic A311D芯片方案,兼容树莓派 CM4模组

    Banana Pi BPI-CM4是一个Amlogic A311D的计算机模块,与树莓派CM4模块相同的尺寸,它也具有相同的连接引脚,这意味...
    发表于 07-12 16:01 225次 阅读

    CH573开发板通过usb线连接计算机(win7 64位),无法安装驱动,提示未知设备怎么解决

    CH573开发板通过usb线连接计算机(win7 64位),无法安装驱动,提示未知设备。      ...
    发表于 07-12 07:05 159次 阅读

    九联科技Unionpi Tiger开发套件AI人工智能开发板使用说明书

    Unionpi Tiger(A311D)是一款应用于图像处理,音视频处理和深度学习等的智能硬件。其芯片拥有强大的CPU、GPU和神经网络...
    发表于 07-11 18:25 1263次 阅读

    用于在计算机和变送器之间提供电流隔离的接口

    描述 SIMPLE_AUDIO_INTERFACE 一个简单的接口,用于在计算机和变送器之间提供电流隔离。 该项目是针...
    发表于 07-11 06:16 633次 阅读

    【STM32中国线上技术周】聚焦五大主题、31场技术演讲、74个方案展示及答疑,全面展示STM32嵌入式技术创新和生态战略!

    ▌STM32中国线上技术周简介 在STM32诞生15周年之际,意法半导体将首次举办 “STM32中国线上技术周”。通过本次线上技...
    发表于 07-05 14:02 5728次 阅读
    【STM32中国线上技术周】聚焦五大主题、31场技术演讲、74个方案展示及答疑,全面展示STM32嵌入式技术创新和生态战略!

    【Sipeed M2 Dock开发板试用体验】给小车开开天眼

    一.前言 收到Sipeed M2 Dock开发板后,我就在想怎么做一个有趣的小作品,于是我就想到了做一个自动跟随的小车,我的车体采...
    发表于 07-03 23:44 1437次 阅读

    使用两个GAL 22v10替换UE6

    描述 Commodore 8296 - 使用两个 GAL 22v10 替换 UE6 大多数有缺陷的 Commodore 8296 计算机都存在 PLA 芯片(UE...
    发表于 06-30 07:06 417次 阅读

    使用ONE GAL 22v10替换UE5

    描述 Commodore 8296 - 使用 ONE GAL 22v10 替换 UE5 大多数有缺陷的 Commodore 8296 计算机都存在 PLA 芯片(...
    发表于 06-30 07:02 444次 阅读