0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

升腾910和含光800性能对比 昇腾910和含光800性能对比

工程师邓生 2023-08-31 17:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

有网友关注升腾910和含光800性能对比;升腾910一般认为就是华为的昇腾910;而含光800则是阿里巴巴发布的含光800AI芯片。

2019年9月25日,阿里巴巴发布含光800AI芯片;含光800是高性能的AI推理芯片。该芯片推理性能达到78563 IPS,能效比500 IPS/W。

含光800AI芯片基于RISC-V和阿里自有算法,含光800芯片性能的突破得益于软硬件的协同创新:硬件层面采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。

含光800AI芯片相比传统GPU算力,性价比提升100%。根据云栖大会的现场演示结果显示,比如拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。

据阿里介绍含光NPU采用TSMC 12nm工艺制程,可提供全球最高单芯片AI推理性能。 在HGAI模型的推理应用中,含光NPU每秒钟可处理高达78000 IPS的图片,是同类处理器的数十倍性能。

目前含光800目前已被应用到阿里巴巴旗下的的多个业务场景,比如图像视频分析、城市大脑、搜索优化等等。

2019年8月23日,华为发布AI芯片Ascend 910(昇腾910)。

据华为官方介绍,昇腾910AI处理器,基于自研华为达芬奇架构3D Cube技术,实现业界最佳AI性能与能效,架构灵活伸缩,支持云边端全栈全场景应用。

除了基于达芬奇架构的AI核外,昇腾910还集成了多个CPU、DVPP和任务调度器(Task Scheduler),因而具有自我管理能力,可以充分发挥其高算力的优势。

昇腾910集成了HCCS、PCIe 4.0和RoCE v2接口,为构建横向扩展(Scale Out)和纵向扩展(Scale Up)系统提供了灵活高效的方法。HCCS是华为自研的高速互联接口,片内RoCE可用于节点间直接互联。最新的PCIe 4.0的吞吐量比上一代提升一倍。

昇腾910算力是国际顶尖AI芯片的2倍,相当50个当前最新最强的CPU;其训练速度,也比当前最新最强的芯片提升了50%-100%。同时华为还发布了配套的新一代AI开源计算框架MindSpore。两者搭配性能最大化利用芯片算力。

新一代的AI开源计算框架MindSpore创新编程范式,使得工程师更容易使用;该计算框架可满足终端、边缘计算、云全场景需求,能更好保护数据隐私;可开源,形成广阔应用生态。

昇腾910半精度(FP16)算力达256 TFLOPS。(还有一个说法是昇腾910的半精度(FP16)算力达到320 TFLOPS);而整数精度(INT8)算力达到 640 TOPS,(还有一个说法是整数精度(INT8)算力达到512 Tera-OPS;小编认为一个数值可能是设计参数值,一个可能是极值)功耗 310W,采用 7nm 先进工艺。此外,昇腾 910 集成了 HCCS、PCIe 4.0 和 RoCE v2 接口,为构建横向扩展 (Scale Out)和纵向扩展(Scale Up)系统提供了灵活高效的方法。

比如华为的Atlas 900 AI训练集群,算力达到了256 PFLOPS。要实现这样的算力,如果采用通用CPU需要6195个机柜,用GPU需要208个机柜,而NPU如昇腾只要128个机柜,这归功于昇腾架构对深度学习业务的优化。而且最终,华为只用了16个机柜来实现。

此外,昇腾910为国产AI芯片助力,华为盘古大模型从算力(昇腾算力,昇腾的底层架构也是华为自创的)、芯片使能、AI框架(MindSpore AI计算框架)到AI平台(AI开发生产线ModelArts)实现了全栈自主创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20154

    浏览量

    247439
  • RISC-V
    +关注

    关注

    48

    文章

    2806

    浏览量

    51953
  • AI芯片
    +关注

    关注

    17

    文章

    2072

    浏览量

    36584
  • 昇腾910
    +关注

    关注

    0

    文章

    14

    浏览量

    7155
  • 含光800
    +关注

    关注

    0

    文章

    3

    浏览量

    1793
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    太诱电感与村田电感的性能对比及选型

    太诱与村田电感的性能对比及选型分析 一、高频性能对比 村田电感 高频结构优势 :高频电路用电感以绕线型(LQW系列)和薄膜型(LQP系列)为主。绕线型采用氧化铝芯与铜线螺旋结构,Q值极高(典型值
    的头像 发表于 12-09 16:21 361次阅读
    太诱电感与村田电感的<b class='flag-5'>性能对比</b>及选型

    不同辐照度和温度下,TOPCon与PERC晶硅伏组件的电性能对比

    伏应用中,额定功率相同的不同类型晶硅组件在实际运行中发电量存在差异,这一现象对新兴TOPCon与传统PERC技术的性能评估提出了迫切需求。由于缺乏TOPCon组件长期户外发电的充分数据,其在实际
    的头像 发表于 11-10 09:03 239次阅读
    不同辐照度和温度下,TOPCon与PERC晶硅<b class='flag-5'>光</b>伏组件的电<b class='flag-5'>性能对比</b>

    薄膜电阻与陶瓷电容性能对比

    薄膜电阻与陶瓷电容在性能上各有优势,薄膜电阻以高精度、低温漂、低噪声见长,适用于精密测量与高频电路;陶瓷电容则以高频特性、微型化与高可靠性为核心优势,广泛应用于电源管理与射频电路。以下是对两者的详细
    的头像 发表于 11-04 16:33 409次阅读
    薄膜电阻与陶瓷电容<b class='flag-5'>性能对比</b>

    国产AI芯片真能扛住“算力内卷”?海思的这波操作藏了多少细节?

    最近行业都在说“算力是AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思910B,实测下来有点超出预期——7nm工艺下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    发表于 10-27 13:12

    DLP® LightCrafter™ DLPC910评估模块技术解析与应用指南

    Texas Instruments DLPLCRC910EVM评估模块基于 DLP® LightCrafter™ DLPC910控制器。DLPLCRC910EVM参考设计可帮助使用DLPC91
    的头像 发表于 08-20 11:31 813次阅读
    DLP® LightCrafter™ DLPC<b class='flag-5'>910</b>评估模块技术解析与应用指南

    睿海光电800G模块助力全球AI基建升级

    在全球数字化转型加速的背景下,超高速模块作为数据中心与AI算力网络的核心部件,正经历从400G向800G、1.6T的迭代浪潮。在这一赛道中,深圳市睿海光电科技有限公司(以下简称“睿海光电”)凭借
    发表于 08-13 19:05

    投入式水位计与传统浮子式仪器性能对比分析

    在水位监测领域,投入式水位计与浮子式仪器是两类主流设备。南京峟思将从工程实用性角度出发,对两者进行五大核心性能对比,为岩土工程、水利安全监测领域的采购及技术人员提供客观参考。一、测量原理与精度投入式
    的头像 发表于 07-28 13:44 308次阅读
    投入式水位计与传统浮子式仪器<b class='flag-5'>性能对比</b>分析

    800KVA伏储能并网变压器性能全解析

    800KVA伏储能并网变压器知识科普:技术、性能、选配与容量配置——卓尔凡电力科技的卓越之选 一、引言 在全球对清洁能源的需求日益增长的今天,13650169149卓尔凡伏储能并网
    的头像 发表于 04-11 10:57 908次阅读
    <b class='flag-5'>800</b>KVA<b class='flag-5'>光</b>伏储能并网变压器<b class='flag-5'>性能</b>全解析

    DeepSeek推动AI算力需求:800G模块的关键作用

    : 飞速(FS)模块支持最新的标准协议,确保与多种现有设备和网络架构的兼容性,并支持验证告警、DDM数据及模块识别的准确性,保障系统正常运行。这一特性使得飞速(FS)800G模块品质可靠,
    发表于 03-25 12:00

    厚声电阻与旺诠合金电阻的性能对比

    厚声电阻与旺诠合金电阻在性能上各有千秋,以下是对两者的详细对比: 一、厚声电阻性能特点 1、尺寸与阻值范围广泛: 厚声电阻提供了多种尺寸选择,如01005、0201、0402、0603等,以满足
    的头像 发表于 02-27 14:40 698次阅读
    厚声电阻与旺诠合金电阻的<b class='flag-5'>性能对比</b>

    DLPC910忽然无法正常启动,怎么解决?

    1、DLPC910忽然无法正常启动,分析可能是DLPR910的问题。这里想问一下DLPR910内的程序是可以被覆盖的吗? 2、如果真的是误操作导致DLPR910的配置程序丢失,请问有
    发表于 02-26 08:43

    改性EVA胶膜在伏封装中的抗PID性能对比研究

    伏组件的抗PID性能影响组件的发电效率和使用寿命,被伏行业广泛关注。EVA胶膜是伏组件的主要封装材料之一,其具有优异的性价比,但随着
    的头像 发表于 01-22 09:02 1407次阅读
    改性EVA胶膜在<b class='flag-5'>光</b>伏封装中的抗PID<b class='flag-5'>性能对比</b>研究

    为什么400G模块和800G模块如此火爆?

    算力中心作为承载大量计算任务的核心设施,需要快速、稳定的网络环境,400G和800G模块应运而生,尤其是800G模块的需求尤为旺盛。800
    的头像 发表于 12-23 14:41 1070次阅读

    单片机Debug工具性能对比 单片机调试常用命令

    。以下是对单片机调试工具性能的简要对比以及一些常用的调试命令。 单片机Debug工具性能对比 Keil uVision 性能 :Keil uVision 是一款功能强大的集成开发环境(
    的头像 发表于 12-19 09:56 2182次阅读

    TNC连接器对比分析:与其他射频连接器的性能对

    德索工程师说道在射频连接器领域,TNC连接器以其卓越的性能和广泛的应用而著称。以下是TNC连接器与其他射频连接器的性能对比分析: TNC连接器vs SMA连接器 频率范围:TNC连接器的工作频率
    的头像 发表于 12-17 10:58 1578次阅读
    TNC连接器<b class='flag-5'>对比</b>分析:与其他射频连接器的<b class='flag-5'>性能对</b>决