资料介绍
软件简介
EMLL(Edge ML Library)为加速终端侧设备上机器学习的推理而设计,提供基于端侧处理器的高性能机器学习计算函数库。EMLL支持fp32、fp16、int8等数据类型,已在有道词典笔、翻译王和超级词典等硬件产品的机器翻译和语音识别引擎中应用,大幅降低了推理延迟。
特点
高性能
EMLL实现的矩阵乘法函数,为端侧人工智能中常见的扁平矩阵作了专门的优化,为各常见ARM处理器作了特定的优化。对于cortex-A35/A53/A55处理器,本库针对它们的流水线特点,使用了汇编级别的优化。
下面是单精度矩阵乘法的测试结果:
矩阵乘法的通式为 C[MxN] = A[MxK] B[KxN];所列数据为全行主序和全列主序的最好性能。
易用性
EMLL使用的函数接口在参数设计上力求简洁直接,矩阵乘法去掉了不常用的LD*参数,矩阵和向量的传递通过指针和整数维度分别传递。本库的构建和运行不依赖第三方计算库。
扩展性
对于矩阵乘法和量化函数,EMLL 库提取了它们和架构无关的代码作为通用的宏,这些宏可以在支持新的CPU架构时大大节省所需的代码量。
EMLL 应用接口
EMLL提供基于 C 的接口,详情请见 Usage_ZH.md。
函数类型 | 函数名称 | 函数参数 |
---|---|---|
矩阵乘法 | data_type + "gemm" | 源矩阵排列顺序,各矩阵地址,M,N,K,beta,并行线程数 |
全连接层(单精度) | "fc" | src/weight/bias/output的地址,M,K,N,源矩阵排列顺序,(并行线程数) |
量化 | "quantize_" + "symmetric"/"asymmetric" + input_type + output_type | 输入数组,输出数组,(输出零点值),缩放值,数组大小,输入范围 |
重量化 | "requantize_" + "symmetric/asymmetric" + "_XtoY" | 输入数组,输出数组,(输出零点值),输出缩放值,数组大小,输入范围 |
偏置 | "bias" + data_type | 被偏置的矩阵,标量偏置,平行于主方向的向量偏置,平行于次方向的向量偏置,矩阵大小 |
各函数支持的数据类型
处理器 | 矩阵乘法 | 偏置 | 量化 | 重量化 |
---|---|---|---|---|
ARMv7a 32-bit | fp32,(u)int8 | fp32,int32 | fp32 -> (u)int16/(u)int8 | int32 -> (u)int16/(u)int8,int16 -> (u)int8 |
ARMv8a 64-bit | fp32,fp16,(u)int8 | fp32,int32 | fp32 -> (u)int16/(u)int8 | int32 -> (u)int16/(u)int8,int16 -> (u)int8 |
EMLL 支持在 Linux 和安卓系统上运行。
EMLL 支持用 GCC 和 Clang 编译。
- 5G和高性能计算驱动增长.zip
- 机器学习必学的Python代码示例集 10次下载
- Python机器学习应用 19次下载
- 高性能单片机器件在高校中的应用及选型 10次下载
- 高效高性能LED恒流驱动电源芯片AX2028 24次下载
- 一种可分享数据和机器学习模型的区块链 15次下载
- 高性能低成本的蓝牙模块CSR6576原理图 13次下载
- 机器学习的个人学习笔记 16次下载
- 高性能计算到底是什么?使用了哪些技术和知识 0次下载
- 机器学习教程之机器学习的十三个经典课件资料免费下载 34次下载
- 机器学习教程之使用matlab研究机器学习的资料概述 31次下载
- 机器学习入门资料之机器学习的详细资料介绍 5次下载
- 机器学习入门教程之机器学习资料合集免费下载包括了资料和复习题 22次下载
- python机器学习和深度学习的学习书籍资料免费下载 89次下载
- 高性能计算发展与应用 0次下载
- 高性能芯片有哪些特征? 353次阅读
- 关于HPC的高性能计算测试方法 1477次阅读
- 机器学习基本过程 5305次阅读
- 一个高性能异步计算框架介绍 523次阅读
- 在云计算成功使用AI所需的五种机器学习技能 1311次阅读
- 机器学习适合云计算运维吗 468次阅读
- 对机器学习算法公平性的研究 2868次阅读
- 机器学习教程之机器学习概念的深度解析 3601次阅读
- 开发者应该学习哪种编程语言才能获得机器学习或数据科学这类工作呢? 2551次阅读
- 什么是机器学习?机器学习能解决什么问题?(案例分析) 1.5w次阅读
- 深度学习的概念、发展状况以及和机器学习的区别和应用 7553次阅读
- 量子计算与量子机器学习的解析 5563次阅读
- 基于边界攻击以及决策的类攻击 提出了部署机器学习系统安全性的新问题 3925次阅读
- 机器学习综述——机器学习理论基础与发展脉络 7616次阅读
- 如何区分深度学习与机器学习 1720次阅读
下载排行
本周
- 1山景DSP芯片AP8248A2数据手册
- 1.06 MB | 532次下载 | 免费
- 2RK3399完整板原理图(支持平板,盒子VR)
- 3.28 MB | 339次下载 | 免费
- 3TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 4DFM软件使用教程
- 0.84 MB | 295次下载 | 免费
- 5元宇宙深度解析—未来的未来-风口还是泡沫
- 6.40 MB | 227次下载 | 免费
- 6迪文DGUS开发指南
- 31.67 MB | 194次下载 | 免费
- 7元宇宙底层硬件系列报告
- 13.42 MB | 182次下载 | 免费
- 8FP5207XR-G1中文应用手册
- 1.09 MB | 178次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537798次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191187次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多