0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ARM发布全新架构CPU、GPU及AI内核 性能全面提升

DPVg_AI_era 来源:yxw 2019-05-29 17:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,ARM发布了下一代架构设计方案,三款重磅利器腾空出世:Cortex-A77 CPU、Mali-G77 GPU和ARM ML处理器,性能全面提升。ARM表示,新的旗舰级IP将定义2020年高端智能手机性能,提供新一代的人工智能体验。

ARM祭出了三把利器。

昨日,全球领先半导体知识产权(IP)提供商ARM重磅发布了下一代架构设计方案,其中包括:

Cortex-A77 CPU;

Mali-G77 GPU;

ARM ML处理器。

ARM表示,新的旗舰级IP将定义2020年高端智能手机性能,提供新一代的人工智能体验。

而在此前,新智元也报道了ARM宣布暂停与华为的合作的相关消息,或许此次ARM发布的旗舰级IP将与华为无缘。

不过,华为目前已经获得了ARM8架构的永久授权(ARM8是ARM公司的32/64位指令集,目前的处理器都是这一指令集的产物)。也有可能完全自主设计ARM处理器,并掌握核心技术和完整知识产权,具备长期自主研发ARM处理器的能力。

(对Cortex和Mali不了解?没关系,新智元在文末附了它俩的全家福!)

代号Deimos,新一代CPU性能大幅提升

去年的ARM发布的Cortex-A76其实是一个非常成功的核心架构,全新的架构体系与7nm TSMC工艺的结合,带来了巨大的性能和效率飞跃,麒麟980和骁龙855就是很好的例子。

但ARM真正的竞争对手主要来自苹果的CPU设计团队。仅从CPU来说,目前,苹果的A11、A12仍然有着较为明显的性能、效率优势。

ARM发布的Cortex-A77代号为Deimos(戴莫斯,畏惧之神),与上一代A76可谓是一脉相承,很大程度上保持了上一代的特性。

从官方给出的参数来看,有如下几个关键特性:

依旧采用Armv8.2架构,支持 AArch32 和 AArch64;

64KB L1指令和数据缓存;

256或512KB L2缓存;

以及高达4Mb L3缓存

ARM表示,Cortex-A77和Cortex-A76保持相同的3.GHz峰值频率目标。但预计厂商不会在新一代Soc达到这么高的频率。

Cortex-A77将更多的计算能力用于设备安全的边缘计算上。这些计算能力使用范围包括AI摄像机、视觉场景检测、3D扫描、生物特征用户ID(人脸识别)、语音识别、游戏中的ML和AR中的ML等。

从性能角度来看,Cortex-A77相比于A76有了许多性能上改进:

单线程性能提升20%;

FP性能提升35%;

内存宽带提升15%。

更高的性能也意味着能更好地响应支持AR的新应用程序以及带来的体验。通过Cortex-A77,手机游戏领域的增强现实技术在未来几年有望实现大幅增长。并且Cortex-A77还将支持5G,爱立信在2018年11月的移动报告中预测,到2024年,将有大约15亿台智能手机设备具备5G功能。

而众所周知,对于计算密集型ML、AR和其他新出现的设备来说,5G是一个基本需求。它将带来更快的速度、大带宽(5到20 Gbps)、8K分辨率的流媒体和360度视频。

ARM GPU采用全新架构Valhall,性能大跃进

除了Cortex-A77之外,ARM还重磅发布了新一代Mali-G77。

划重点:Mali-G77采用了全新架构,Valhall。而在G71-G76采用的架构都是Bifrost。

Mali-G77在性能、密度和效率方面取得了一些重大改进。虽然去年的Mali-G76引入了对执行引擎计算架构的一些重大更改,但G77的改进更大,并且脱离了ARM相对不同寻常的计算核心设计。

据ARM官方宣称,Mali-G77较前代产品相比:

效能提升30%、性能提升30%、机器学习性能提升60%;

每mm²性能较A76预计提升1.4倍;

在相同的工艺和相同的性能下,实现30%的同比能效改进;

并且比Mali-G72节省50%的功耗。

从官方给出的性能来看,ARM Mali-G77的性能已然接近目前苹果A12的性能,同时也超过了高通Adreno 640的性能。

ARM ML NPU

随着智能手机和计算机继续利用AI来实现摄影中的场景识别或增强现实中的物体识别等功能。同时,许多公司也构建了专门的神经处理单元来处理这些任务,从而减轻了CPU和GPU的压力。

而此次,ARM还发布了其最新的NPU,提供了高达两倍的能效,并且是上一代内存压缩的三倍。与开源的ARM NN软件框架相结合,ARM表示该芯片的八核版本可提供高达32 TOP/s的性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9611

    浏览量

    394337
  • 内核
    +关注

    关注

    4

    文章

    1479

    浏览量

    43140
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11370

    浏览量

    226394
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5321

    浏览量

    136206

原文标题:ARM发布全新架构CPU、GPU及AI内核,华为或将无缘

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm首款自研AGI CPU尽显Arm能效之优!单线程释放强大性能,同等机架塞更多CPU功耗还更低

    最近,Arm 发布首款自研的数据中心 CPUArm AGI CPU,专为代理式 AI 基础设施
    的头像 发表于 03-27 09:12 421次阅读
    <b class='flag-5'>Arm</b>首款自研AGI <b class='flag-5'>CPU</b>尽显<b class='flag-5'>Arm</b>能效之优!单线程释放强大<b class='flag-5'>性能</b>,同等机架塞更多<b class='flag-5'>CPU</b>功耗还更低

    Arm亲自下场!自研首款数据中心AGI CPU发布

    Arm今日发布首款由 Arm 设计的数据中心 CPU——Arm AGI CPU,专为代理式
    的头像 发表于 03-25 08:39 3213次阅读
    <b class='flag-5'>Arm</b>亲自下场!自研首款数据中心AGI <b class='flag-5'>CPU</b><b class='flag-5'>发布</b>!

    OrangePi RV2 深度技术评测:RISC-V AI融合架构的先行者

    需求 5. 局限与不足 5.1 性能天花板明显 CPU 通用算力仅相当于入门级 ARM,无法胜任重度计算或桌面级应用 GPU 能力弱,图形界面体验一般,不适合图形密集型应用 5.2 软
    发表于 03-03 20:19

    全球首创!RISC-V+AI架构性能服务器CPU成功点亮

    自主研发、全球首创的RISC-V+AI融合架构智算服务器CPU已顺利完成芯片点亮,并成功启动Linux操作系统。本次芯片点亮是蓝芯算力和联想CFC团队联合技术攻关的成果。   蓝芯算力此次推出的RISC-V+
    的头像 发表于 02-28 09:22 6871次阅读

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    Blackwell 架构 GPU 中的中端专业图形卡,高度仅为全高 GPU 的二分之一。如果您需要的是一块半高显卡,能适配小机箱,功耗不高,还要具备 AI 及光线追踪
    的头像 发表于 11-28 09:39 7289次阅读
    NVIDIA RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>性能</b>测试

    Arm助力MediaTek天玑9500重塑旗舰体验

    Arm 合作伙伴产品上“芯”!近日,MediaTek 发布了天玑 9500 旗舰 5G 智能体 AI 芯片,该芯片基于启用 SME2 的全新 Arm
    的头像 发表于 10-10 11:28 1468次阅读

    微软Visual Studio 2026 发布AI 深度融合、性能提升

    “  微软发布 Visual Studio 2026 预览版,新版本以深度融合的 AI Copilot 为核心,结合全新的 Fluent Design 界面与显著的性能
    的头像 发表于 09-16 11:17 2475次阅读
    微软Visual Studio 2026 <b class='flag-5'>发布</b>!<b class='flag-5'>AI</b> 深度融合、<b class='flag-5'>性能</b><b class='flag-5'>提升</b>

    适应边缘AI全新时代的GPU架构

    电子发烧友网站提供《适应边缘AI全新时代的GPU架构.pdf》资料免费下载
    发表于 09-15 16:42 47次下载

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    的同时,能够利用更小、更快的数字格式,提升模型的整体性能。 1.3Transformer 模型中的矩阵乘法计算 2、存内计算AI芯片 存内计算已经成为应对大模型不断增加的计算量和能耗需求、减少大模型
    发表于 09-12 17:30

    全新Arm Lumex CSS平台实现两位数性能提升

    及下一代个人电脑加速其人工智能 (AI) 体验的先进计算平台。Lumex CSS 平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能 Arm CPU
    的头像 发表于 09-10 16:14 1134次阅读
    <b class='flag-5'>全新</b><b class='flag-5'>Arm</b> Lumex CSS平台实现两位数<b class='flag-5'>性能</b><b class='flag-5'>提升</b>

    Arm神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术,移动设备上实现PC级别的AI图形性能

    Arm 神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术,首次在移动设备上实现 PC 级别的 AI 图形性能,为未来的端侧
    的头像 发表于 08-14 17:59 2997次阅读

    Arm KleidiAI与XNNPack集成实现AI性能提升

    Arm KleidiAI 首次集成到 XNNPack 已过去整整一年。KleidiAI 是一款高度优化的软件库,旨在加速 Arm CPU 上的人工智能 (AI) 推理。在过去一年中
    的头像 发表于 08-08 15:19 3171次阅读
    <b class='flag-5'>Arm</b> KleidiAI与XNNPack集成实现<b class='flag-5'>AI</b><b class='flag-5'>性能</b><b class='flag-5'>提升</b>

    如何在裸机环境中运行KleidiAI微内核

    Arm KleidiAI 是一款具有突破性意义的软件库,专为提升 Arm CPU 上的人工智能 (AI)
    的头像 发表于 08-08 15:16 4087次阅读
    如何在裸机环境中运行KleidiAI微<b class='flag-5'>内核</b>

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知
    发表于 06-18 19:31

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP
    的头像 发表于 05-29 10:12 5148次阅读