0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ARM发布两款针对移动终端的AI芯片架构:物体检测和机器学习处理器

mK5P_AItists 2018-02-23 11:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

ARM发布了两款针对移动终端的AI芯片架构,物体检测(Object Detection,简称OD)处理器机器学习(Machine Learning,简称ML)处理器。

以往,ARM都是架构准备好了,才发公告。这次一反常态,没货却先发公告:OD处理器,计划在第一季度才能提供给合作伙伴;ML处理器得等到年中,这也看出了ARM很焦急。

毕竟在过去的几个月中,尤其是在移动端圈子里,机器学习在半导体行业中很热。

好几家提供芯片架构的公司都宣布了提供消费者解决方案,连华为都开始自主研发架构了。那么多玩家入场,ARM却没啥动作。

直到现在,ARM才把重点放在了Armv8.2的CPU ISA扩展上,该扩展借助半精度浮点和整数点产品来简化和加速神经网络的专用指令。

除了CPU的改进之外,还看到了G72中机器学习的GPU改进。虽然这两项改进都有所帮助,但想要最大性能和效率,这些改进还不够。

在测试Kirin 970的NPU和Qualcomm的DSP时,可以看出,专用架构上运行推理的效率,比在CPU上运行的效率高出一个数量级以上。

正如ARM官方解释的那样,Armv8.2和GPU的改进只是建立机器学习解决方案的第一步,还必须研究对专用解决方案的需求。

ARM也从合作的小伙伴那里感受到了行业的压力,才熬出来ML处理器。

下面简单介绍一下这次发布的两个新的架构:机器学习ML处理器以及OD处理器。

ML处理器,是专门为加速神经网络模型推理所设计的。这种架构比传统的CPU和GPU架构有明显的优势。

在执行机器学习任务时,这款ML处理器可为数据优化内存管理。

这款处理器具有数据可高度重复使用的特点,能最大限度地减少数据的输入和输出,从而实现高性能和高效率。

ARM发布了两款针对移动终端的AI芯片架构:物体检测和机器学习处理器

ML处理器,理论上可在1.5W功率下,有超过4.6TOPs(8位整数)的理论吞吐量,最高可达3TOPs / W。

虽然TOPs值并不能完全体现处理器的性能,不过它对于行业标准化仍然有用。

作为一个完全独立的独立IP(电路功能)模块,ML处理器具有自己的ACE-Lite接口,可集成到SoC中,也可以集成到DynamiQ中。

此外,ARM没有透露ML处理器更多的架构信息。

OD处理器,是针对物体检测的任务进行了优化。尽管ML处理器也能完成相同的任务,但OD处理器可以更快。给单项任务提供专用架构,才能够获得最大效率。

ARM也考虑到了可能会出现OD和ML处理器集成在一起用的情况:OD处理器负责把图像中的目标处理区分割出来,然后把它们传递给ML处理器,进行更细颗粒度的处理。

ARM还提供大量软件,帮助开发人员将他们的神经网络模型应用到不同的NN框架中。从今天开始,这些软件大家可以在ARM开发者网站找到,同时也在Github上提供。

考虑到SoC开发的周期,基于新架构的芯片大概得在2019年年中或年末才能发布。ARM这次,可以说半导体及架构供应商中响应AI趋势比较慢的企业了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9583

    浏览量

    393485
  • AI
    AI
    +关注

    关注

    91

    文章

    40935

    浏览量

    302512
  • 机器学习
    +关注

    关注

    67

    文章

    8561

    浏览量

    137208

原文标题:拥抱AI大趋势,ARM发布两款AI芯片架构

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    树莓派5还是香橙派5 Pro?两款热门开发板的详细对比

    的旗舰级单板计算机,能够胜任从日常应用到轻量级服务的多种任务。从纸面参数来看,香橙派5 Pro在多方面配置上确实有一定优势。以下是两款产品的详细对比。 1. 处理器与核心硬件 两款
    发表于 03-04 19:29

    鸿蒙版AI终端主板AIoT-3576E彩页

    AIoT-3576E是一AI终端主板,基于RK3576八核处理器,主频最高达2.2GHz,内置高达6TOPS算力AI加速
    发表于 01-14 15:03 0次下载

    Banana Pi BPI-CM6 计算模块将 8 核 RISC-V 处理器带入 CM4 外形尺寸

    Banana Pi BPI-CM6是一紧凑型“计算模块”,本质上是一块小型高性能计算机板,它采用的是 RISC-V 处理器,而非更常见的 ARM 芯片。其
    发表于 12-20 09:01

    瑞芯微SOC智能视觉AI处理器

    RK3568B2: 一性能均衡、接口丰富的中高端AIoT应用处理器,是RK3568的优化版本,主打稳定与可靠性。CPU/GPU: 延续RK3568的4核A55 + G52 GPU架构,性能可靠
    发表于 12-19 13:44

    探索RISC-V在机器人领域的潜力

    Pro则运行控制节点,通过Wi-Fi网络接收Gazebo发布的传感信息(如激光雷达数据),并发布控制指令(速度指令)来驱动机器人模型移动
    发表于 12-03 14:40

    今日看点:高通发布云端AI芯片;艾为电子推出低功耗Hyper-Hall™芯片 高通发布云端AI芯片 近日,美国高通公

      高通发布云端AI芯片 近日,美国高通公司宣布推出两款新型人工智能芯片AI200和
    发表于 10-28 10:43 1166次阅读

    集创北方推出首移动终端AI画质增强独显芯片

    集创北方隆重推出首12纳米AI-PQ画质增强独显芯片。该芯片聚焦移动终端用户对高画质、高帧率、
    的头像 发表于 10-23 11:32 784次阅读

    全志A733:高性能八核AI处理器,智能终端优选

    实现大规模量产。此外,其芯片产品已广泛应用于扫地机器人、四机器狗等设备,如小米仿生四足机器人“铁蛋”就采用了该公司的芯片。   全志科技A7
    的头像 发表于 10-20 08:12 8214次阅读
    全志A733:高性能八核<b class='flag-5'>AI</b><b class='flag-5'>处理器</b>,智能<b class='flag-5'>终端</b>优选

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    1.1RISC-VISA 扩展 1.2 向量协处理器 1.3 与各级存储耦合的NPU 1.4 针对Transformer 模型的架构优化 SwiftTron是一专用的开源
    发表于 09-12 17:30

    AI 芯片浪潮下,职场晋升新契机?

    芯片设计为例,从最初的架构选型,到算法适配、性能优化,每个环节都考验着工程师的专业素养。在设计一面向智能安防领域的 AI 芯片时,需要深
    发表于 08-19 08:58

    打破X86/ARM垄断!国产全新自主架构CPU处理器重磅发布

    3C6000系列、工控及移动终端处理器龙芯2K3000/3B6000M,以及相关整机和解决方案,标志着龙芯在自主芯片领域又迈出了坚实的一步。   龙芯中科董事长胡伟武在
    的头像 发表于 06-28 00:40 9316次阅读
    打破X86/<b class='flag-5'>ARM</b>垄断!国产全新自主<b class='flag-5'>架构</b>CPU<b class='flag-5'>处理器</b>重磅<b class='flag-5'>发布</b>

    龙芯发布新一代处理器,进军服务AI处理器市场

    芯片、工控领域及移动终端处理器龙芯2K3000/3B6000M芯片,以及相关整机和解决方案。信息技术产业主管领导、专家学者、企业合作伙伴及媒
    发表于 06-26 15:18 2258次阅读
    龙芯<b class='flag-5'>发布</b>新一代<b class='flag-5'>处理器</b>,进军服务<b class='flag-5'>器</b>和<b class='flag-5'>AI</b><b class='flag-5'>处理器</b>市场

    龙芯处理器支持WINDOWS吗?

    )。 Windows的适配:微软官方仅支持x86/x64和ARM架构处理器,未推出针对LoongArch或MIPS的Windows版本。 技术限制 指令集不兼容:Windows系统的
    发表于 06-05 14:24

    Arm 与微软合作,为基于 Arm 架构的 PC 和移动设备应用提供超强 AI 体验

    ArmKleidiAI与ONNXRuntime的集成,为Windows和安卓操作系统带来了显著的AI性能优化,实现高达2.6倍的AI推理速度提升,从而加速应用体验。联合作者:Arm终端
    的头像 发表于 06-03 16:47 976次阅读
    <b class='flag-5'>Arm</b> 与微软合作,为基于 <b class='flag-5'>Arm</b> <b class='flag-5'>架构</b>的 PC 和<b class='flag-5'>移动</b>设备应用提供超强 <b class='flag-5'>AI</b> 体验

    Cadence推出Tensilica NeuroEdge 130 AI处理器

    楷登电子(美国 Cadence 公司,Nasdaq:CDNS)近日宣布推出 Cadence Tensilica NeuroEdge 130 AI处理器(AICP)。这是一新型处理器
    的头像 发表于 05-17 09:38 1546次阅读