0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

梯度的独特分布给量化训练带来了极大挑战

lhl545545 来源:商汤科技 作者:商汤科技 2020-06-15 14:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

商汤科技CVPR 2020录用论文在多个领域实现突破,包括:对抗式生成模型、三维点云理解与分析、训练加速与模型量化、视频理解与分析、网络结构搜索等。以下为商汤及商汤联合实验室入选CVPR 2020的代表性论文。

▎研究方向:对抗式生成模型

代表性论文:《对人脸生成模型的隐空间可解释性分析》链接:https://arxiv.org/abs/1907.10786

近年来,对抗生成网络(GAN)的快速发展极大地增强了图像生成的质量,也因此得到了越来越广泛的应用。越来越多基于GAN的模型被提出来提高生成质量以及训练稳定性,但是对于生成模型的可解释性还鲜有研究。

本文以人脸生成模型为例,对GAN的隐空间进行了深入分析,目标在于理解GAN是如何将一个随机噪声转化为一张高质量图片的。本文提出了一种简单而通用的技术InterFaceGAN,用于在潜在空间中进行语义人脸编辑,可控制姿势以及其他面部属性,例如性别、年龄、眼镜等,还能够纠正GAN造成的伪影。

代表性论文:《ACGPN:基于图像的自适应生成保留虚拟换装》链接:https://arxiv.org/abs/2003.05863

本文关注基于图像的虚拟换装任务。现有方法取得了很多突破但仍然存在很大问题:(1)人物的肢体仍然是模糊的;(2)对于下装很难做到清楚的保留;(3)衣服的纹理容易产生过度形变。

为此本文利用一种语义敏感的方法,自适应的判断哪部分图像是应该保留的,解决了现有方法中无法对人物肢体与衣服有遮挡的情况的建模,极大程度地降低了生成结果中的伪影以及模糊细节;并通过引入仿射变换的共线性等性质,对变形衣服中的薄板样条插值变换起到约束,使得Logo和花纹不易扭曲变形。 ▎研究方向:三维点云理解与分析 代表性论文:《PV-RCNN: 基于Point-Voxel点云特征深度融合的3D物体检测算法》链接:https://arxiv.org/abs/1912.13192

本文关注基于点云数据的三维物体检测任务。文章提出了一个高性能的3D物体检测框架PV-RCNN,其通过构造Set Abstraction特征抽象操作将基于Point与Voxel的点云特征提取算法分别在Voxel-to-Keypoint阶段和Keypoint-to-RoIGrid 阶段深度融合,使其同时拥有可变感受野、精确的点云位置信息以及高召回率,从而有效提升3D物体检测的性能。

梯度的独特分布给量化训练带来了极大挑战

实验部分,PV-RCNN分别在竞争激烈的自动驾驶数据集KITTI以及更大规模的Waymo数据集上得到了验证。在KITTI数据集的3D物体检测榜Car类别上,PV-RCNN大幅领先其他所有算法,在三个难度上均取得了第一名。在更大规模的Waymo数据集上,PV-RCNN同样在所有难度以及不同距离上超越了现有算法,最高mAP增幅达近7个点。

▎研究方向:训练加速与模型量化

代表性论文:《用于加速卷积神经网络训练过程INT8训练技术》链接//arxiv.org/abs/1912.12607

卷积神经网络训练过程需要耗费大量的计算资源和时间,而各种深度学习硬件都提供非常高效的INT8计算支持。当把INT8计算应用到训练中同时加速网络的前传和反传过程时,梯度的独特分布给量化训练带来了极大挑战。

为了解决梯度量化带来的精度损失,论文进行了量化训练收敛稳定性的理论分析并基于此提出了“误差敏感的学习率调节”和“基于方向自适应的梯度截断”方法,将两个方法在图像分类数据集ImageNet、CIFAR和目标检测数据集PASCAL VOC、COCO上进行实验,均取得了极少的精度损失。

梯度的独特分布给量化训练带来了极大挑战

实验中也验证了该方法对Inception、MobileNet等不同网络结构的通用性。为了保证更高的加速比,论文还提出使用周期更新、量化卷积融合等技术来减少量化操作带来的时间开销。通过在GTX1080TI上实测,可以提升22%的训练过程。

研究方向:视频理解与分析 代表性论文:《TAPOS: 基于时序动作解析理解动作内部和不同动作间的语义》

动作理解是计算机视觉领域的核心问题之一,也是许多其他任务的基石,如智能视频检索,基于视觉的机器人学等。本文发现,人本身对于动作序列中子动作模式的转换是比较敏感的。

在这篇工作中,本文提出了一种时域解析器,可以挖掘人体动作中的子动作模式,并根据挖掘出的子动作模式对较复杂的动作序列进行时域上的解析。这种时域解析器不但能对一个给定的动作序列进行子动作边界划分,还可以找寻大量不同动作序列中相同的子动作模式。本文发现,对较复杂动作序列良好的时域解析可以帮助提升一些较为高层的任务的准确率,如动作识别等。

梯度的独特分布给量化训练带来了极大挑战

▎研究方向:网络结构搜索 代表性论文:《最高加速400倍,探索更好的网络评价方法EcoNas》链接:https://arxiv.org/abs/2001.01233 许多网络搜索算法需要耗费大量的算力,而这些算力绝大多数集中在候选网络(Candidate)的评估上。同样地,由于算力的限制,候选网络的评估往往需要在代理环境(Proxy)下进行,如较短的训练周期数。虽然每个NAS算法都要用到代理环境,但是代理环境对子网络评估的影响仍然是未知的。 本文的工作首次系统研究了不同代理参数对网络评估的影响。作者发现,使用更可靠的代理环境不仅可以极大压缩计算量,也有助于搜到更好的模型。基于对代理环境的研究,作者提出了一个层次化的搜索方法,EcoNAS在将进化算法加速400倍的同时,得到了更好的网络结构。

梯度的独特分布给量化训练带来了极大挑战

同样地,作者发现可靠的代理环境也可以被用于其他搜索算法中,例如权重共享算法,在不影响精度的同时,使得搜索效率进一步提升。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    3032

    浏览量

    115832
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2392

    浏览量

    84940
  • 商汤科技
    +关注

    关注

    8

    文章

    626

    浏览量

    37705
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    零基础手写大模型资料2026

    (输入与输出相加)和层归一化(对特征维度归一化)。残差连接允许梯度直接流向浅层,解决深层网络训练困难问题;层归一化则消除不同样本特征分布差异,加速收敛。例如在12层Transformer中,这种设计使
    发表于 05-01 17:44

    AI Ceph 分布式存储教程资料大模型学习资料2026

    的混合策略,存储系统既能保证在硬件故障(如硬盘损坏、节点宕机)下的数据高可靠性,又能提供比传统多副本更高的存储利用率。 在分布式环境下,数据一致性是另一个科技挑战。在模型训练的 Checkpoint
    发表于 05-01 17:35

    辽宁光伏发电专用稳压器,稳定输出380V,卓尔凡应对极寒气候挑战

    辽宁作为北方光伏产业的重要布局区域,光伏电站主要分布于辽东半岛和辽西地区,凭借充足的光照资源,实现了规模化发展。但辽宁冬季漫长寒冷、降雪频繁,夏季短暂炎热,独特的气候条件光伏发电带来了
    的头像 发表于 04-25 10:41 366次阅读
    辽宁光伏发电专用稳压器,稳定输出380V,卓尔凡应对极寒气候<b class='flag-5'>挑战</b>

    量化模型在 iMX93 NPU 上运行,但输出不正确怎么解决

    良好的精度,但 int8 输出似乎完全随机。在对一些训练数据进行测试后,应该为正的帧的范围是 -128 到 127,应该为负的帧也是如此。我是否误解了输出,或者在转换或量化模型时出了问题?
    发表于 03-18 07:53

    【瑞萨AI挑战赛】手写数字识别模型在RA8P1 Titan Board上的部署

    轻量级深度学习模型端侧部署的优质硬件平台。本文将基于RA8P1 Titan Board开发板,结合ruhmi、RT-Thread Studio等工具,从开发环境搭建、手写数字识别模型训练、模型转换量化
    发表于 03-15 20:42

    农村分布式能源管理系统:构建韧性乡村能源网络的技术路径

    一、现状 在我国乡村振兴战略与“双碳”目标的双重驱动下,农村能源结构正经历深刻变革。屋顶光伏、小型风电、生物质能等分布式能源的广泛接入,在提升清洁能源占比的同时,也传统相对薄弱的农村电网带来了功率
    的头像 发表于 02-25 13:30 317次阅读
    农村<b class='flag-5'>分布</b>式能源管理系统:构建韧性乡村能源网络的技术路径

    一键部署无损网络:EasyRoCE助力分布式存储效能革命

    分布式存储的性能瓶颈往往在于网络。如何构建一个高带宽、超低时延、零丢包的无损网络,是释放分布式存储全部潜力、赋能企业关键业务(如实时数据库、AI训练、高性能计算)的关键挑战
    的头像 发表于 08-04 11:34 1920次阅读
    一键部署无损网络:EasyRoCE助力<b class='flag-5'>分布</b>式存储效能革命

    重新思考 AI 时代的分布式计算

    层次的关注点在于这一效率突破揭示了传统分布式计算范式与AI工作负载独特需求之间的根本不匹配。AI技术浪潮对基础设施选型带来了深层挑战:当前广泛部署的
    的头像 发表于 07-31 14:25 1429次阅读
    重新思考 AI 时代的<b class='flag-5'>分布</b>式计算

    【「DeepSeek 核心技术揭秘」阅读体验】第三章:探索 DeepSeek - V3 技术架构的奥秘

    时间减少,数据处理更流畅。这让我联想到工业生产中的流水线,AI 训练在此处借鉴类似思路,通过优化任务分配和流程,突破硬件限制,追求更高效率,体现了技术发展中持续优化、突破瓶颈的智慧。 三、细粒度量化
    发表于 07-20 15:07

    虚拟储能 + 光伏储能协同发力:安科瑞优化策略破解能源管理难题

    在“双碳”目标的推动下,可再生能源的快速发展为能源系统带来了新的挑战与机遇。分布式光伏的普及使得电力供应更加清洁,但其波动性和间歇性也电网稳定运行
    的头像 发表于 07-17 09:17 1255次阅读
    虚拟储能 + 光伏储能协同发力:安科瑞优化策略破解能源管理难题

    虚拟储能系统与分布式光伏储能协同优化:开启能源管理新篇章

    引言:能源转型的新机遇 在“双碳”目标的推动下,可再生能源的快速发展为能源系统带来了新的挑战与机遇。分布式光伏的普及使得电力供应更加清洁,但其波动性和间歇性也电网稳定运行
    的头像 发表于 07-10 13:38 1448次阅读
    虚拟储能系统与<b class='flag-5'>分布</b>式光伏储能协同优化:开启能源管理新篇章

    瑞芯微模型量化文件构建

    模型是一张图片输入时,量化文件如上图所示。但是我现在想量化deepprivacy人脸匿名模型,他的输入是四个输入。该模型训练时数据集只标注了人脸框和关键点,该模型的预处理是放到模型外的,不在模型
    发表于 06-13 09:07

    分布式I/O在食品包装行业中的应用

    备分散分布,距离远近不一,这信号的采集和传输带来了极大的困难。传统的布线方式要求所有信号线都连接到主 CPU,导致布线复杂、成本高昂,且信号易受干扰。另一方面,食品包装行业对生产过程
    的头像 发表于 06-11 17:02 948次阅读
    <b class='flag-5'>分布</b>式I/O在食品包装行业中的应用

    算力网络的“神经突触”:AI互联技术如何重构分布训练范式

      电子发烧友网综合报道 随着AI技术迅猛发展,尤其是大型语言模型的兴起,对于算力的需求呈现出爆炸性增长。这不仅推动了智算中心的建设,还对网络互联技术提出了新的挑战。   在AI大模型训练
    的头像 发表于 06-08 08:11 7891次阅读
    算力网络的“神经突触”:AI互联技术如何重构<b class='flag-5'>分布</b>式<b class='flag-5'>训练</b>范式

    OCR识别训练完成后的是空压缩包,为什么?

    OCR识别 一共弄了26张图片,都标注好了,点击开始训练,显示训练成功了,也将压缩包发到邮箱了,下载下来后,压缩包里面是空的 OCR图片20几张图太少了。麻烦您多添加点,参考我们的ocr识别训练数据集 请问
    发表于 05-28 06:46