0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于STE的QAT算法

jf_pJlTbmA9 来源:jf_pJlTbmA9 作者:jf_pJlTbmA9 2023-08-21 10:46 次阅读

在对激活进行伪量化前先将激活截断在(0,1)之间, 这样的做法是基于一些经典的网络结构中,比如AlexNet与RestNet中,大部分的激活都会落在这个范围里的。

wKgZomTeyf6AHyPtAAKETnwxC-0189.jpg

对于weight,则是先通过这样的一个非线性函数对weight进行映射,tanh(w)将weight的值域缩放到-1到+1之间,再除以2倍的tanh(w)绝对最大值加上1/2最终weight被映射到了0到1之间,再对其进行量化与反量化,再将输出结果通过乘2减1仿射变换到-1到1之间。

这里的quant与dequant操作在原论文中是被表示为一个quantize_k的操作,k指的是k位的量化,其实本质上就和我们之前提到的量化公式相似,就是把1/s替换成了2^k-1。

但DoReFa-Net的这个方式对于其它一些activation取值分布较广的网络就显得有点过于死板了,所以就有另一个改进版本的算法Parameterized Clipping Activation,PACT针对activation的伪量化这一部分,将截断门限alpha设为可学习的参数,然后通过梯度下降来寻找更优的门限。

因为alpha被设为可学习参数,所以这一部分的导数就可以由小于alpha的部分为0,大于等于alpha的部分为1。

大家看到PACT的这个函数其实和ReLU很像,对大于零的部分做一个截断操作,其实PACT原本思想也是想要替代ReLU。但问题是并非所有的模型结构用的都是ReLU这个激活函数,所以为了让PACT的应用范围更广,PaddlePaddle也也对其做了一定的改进,对大于零和小于零的激活值都做了相同的限制,使它能够在某些情况下得到更好的量化范围,以降低量化损失。

除此之外,还有一个常被使用到的算法,Learned Step Size Quantization,与PACT相似的是它也是通过训练来确定量化参数,但不同的是PACT学习的是截断门限,而LSQ直接将Scale定为一个可学习的参数。

wKgZomTeygGASPp6AANHdxjij3s018.jpg

我们先来看它的计算公式,这里的r_hat指的就是经过量化与反量化后的数值,
这其实就是在对称量化公式的基础上加了个scale,完成了一个量化与反量化的过程

因为我们需要反向传播计算梯度,所以就要对这个公式进行求导 (加些对公式的解说)

对于这一块的导数,LSQ还是采用直通估计,由此我们就得到了一个最终的导数公式;

这里又可以看出,LSQ虽然也采用了直通估计,但它在截取范围内还是存在梯度计算的

而且,为了使得Scale的学习更为稳定,LSQ还为其梯度加上了一个缩放系数,这个系数主要由tensor中的元素数量决定

另外,既然是可学习参数,那么就需要为其设置一个初始值,PACT中的alpha通常会被手动设置为常数值6,而LSQ原文中scale的初始值则由tensor的L1正则确定,不过在实践过程中,其实更多的是通过统计激活分布,用EMA-minmax, KLD,MSE等PTQ的方式来计算初始的scale值。
审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 函数
    +关注

    关注

    3

    文章

    3868

    浏览量

    61309
  • 网络结构
    +关注

    关注

    0

    文章

    48

    浏览量

    10935
  • STE
    STE
    +关注

    关注

    0

    文章

    8

    浏览量

    9128
收藏 人收藏

    评论

    相关推荐

    请问ADS1259与MSP430F149连接时430上的STE端口怎么接?

    ADS1259与MSP430F149连接时,430上的STE端口怎么接呢?
    发表于 05-17 12:34

    HFW14S-2STE1LF和SFV18R-2STE1HLF富加宜(FCI)/安费诺板端优势定货连接器

    级高新元器件,优势供应行业:汽车线束、汽车电子、家电、工业机械、航空军工、民用等等联系人:张先生联系手机:***24小时在线QQ:1719878442(欢迎联系询价)SFW8R-4STAE9LFSFW28R-2STAE1LFSFW12R-1STAE9LFSFW8S-2STE9LFSFW26R-6STE1LFSFW30R-5
    发表于 10-15 17:30

    板端连接器FCI(富加宜)品牌供应商优势型号SFV10R-1STE1HLF和SFW5R-1STE1LF

    级高新元器件,优势供应行业:汽车线束、汽车电子、家电、工业机械、航空军工、民用等等联系人:张先生联系手机:***24小时在线QQ:1719878442(欢迎联系询价)62684-501100AHLFHFW11R-2STZE1LFSFW8R-2STE9LFSFW5S-2STMAE1LFSFW12R-6STE9LFSFW8R-
    发表于 10-15 17:33

    优势定货连接器供应商品牌FCI富加宜型号SFW30R-1STE1LF和SFW15R-1STE1LF及其SFW系列

    级高新元器件,优势供应行业:汽车线束、汽车电子、家电、工业机械、航空军工、民用等等联系人:张先生联系手机:***24小时在线QQ:1719878442(欢迎联系询价)62684-362100ALFSFV35R-1STBE1HLFSFV9R-2STBE1HLF10061122-511420HLFSFW18R-7STE1LF1
    发表于 10-15 17:36

    FCI富加宜SFW10S-2STE1LF和SFW12R-2STE1LF优势板端连接器型号

    级高新元器件,优势供应行业:汽车线束、汽车电子、家电、工业机械、航空军工、民用等等联系人:张先生联系手机:***24小时在线QQ:1719878442(欢迎联系询价)59453-081110EDHLFSFW4R-3STAE1LFSFW13R-1STE1LFSFV20R-2STBE1HLF62684-321100ALFSFV
    发表于 10-18 09:15

    SFW8S-2STE1LF和SLW16R-1C7LF优势订货板端连接器交期短价格优

    级高新元器件,优势供应行业:汽车线束、汽车电子、家电、工业机械、航空军工、民用等等联系人:张先生联系手机:***24小时在线QQ:1719878442(欢迎联系询价)SLW16S-1C7LFSLW4S-1C7LFSFW16R-1STE1LFSFW8S-2STME1LFSFW6R-2STE1LFSFW15S-2STE1LFS
    发表于 10-18 09:17

    FCI板端连接器SLW16S-1C7LF和SLW4S-1C7LF和SFW16R-1STE1LF及其SFW系列优势型号

    类型:FFC & FPC Connectors 工厂包装数量:2000 子类别:FFC & FPC Connectors 零件号别名:SFW16R1STE1LFSFW16R-1STE1LFSFW8S-2STME1LFSFW6R-2STE1LFSFW15S-2STE1LFSLW10S-1C7LFSFW20R-
    发表于 05-08 09:10

    Intel QAT加速卡逻辑实例有哪些

    Intel QAT加速卡逻辑实例1. QAT相关的名词组织关系在本手册中描述的平台上,处理器可以连接到一个或多个英特尔®通信芯片组8925至8955系列(PCH)设备。 从软件角度来看,每个PCH
    发表于 07-16 08:16

    Intel® QAT加速卡之Linux上编程详解

    QATSoftware for Linux1. Introduction该程序员指南提供了有关软件体系结构和使用指南的信息。 相关的英特尔®QAT软件库文档中记录了有关使用英特尔
    发表于 07-22 08:37

    STE相比于之前的AMTE/MTE主要特点有哪些

    STE相比于之前的AMTE/MTE主要特点有哪些?vango验证和出货生产芯片的测试原理和基本方法是什么?
    发表于 11-12 06:00

    Atari ST/STE EPROM墨盒的资料分享

    描述Atari ST/STE EPROM 墨盒该 EPROM 盒板有 4 个 EPROM 插槽,每个插槽可用于 27C256 EPROM,从而可以填充整个 128kB 盒空间。两个插槽用于 ROM4
    发表于 07-04 07:37

    英特尔QuestAsvices技术(英特尔®QAT

    ® QuickAssist Technology (Intel® QAT) Engine with OpenSSL 1.1.0.
    的头像 发表于 10-29 06:31 2470次阅读

    利用NVIDIA TensorRT实现推理的QAT伪量化

    在这篇文章中,我们简要介绍了基本的量化概念和 TensorRT 的量化工具箱,然后回顾了 TensorRT 8 . 0 是如何处理 Q / DQ 网络的。我们对量化工具箱提供的 resnet50qat 示例进行了快速演练。
    的头像 发表于 03-31 16:51 3204次阅读

    Atari ST/STE EPROM墨盒开源分享

    电子发烧友网站提供《Atari ST/STE EPROM墨盒开源分享.zip》资料免费下载
    发表于 07-06 09:20 0次下载
    Atari ST/<b class='flag-5'>STE</b> EPROM墨盒开源分享

    JW5116兼容芯洲SCT2330SCT2433STE 方案

    JW5116杰华特完全兼容芯洲DCDCSCT2330SCT2433STE方案
    发表于 04-24 16:50 2次下载