0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为发布最外那个算力AI芯片

h1654155282.3538 来源:沈苗 2019-08-23 17:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

华为全场景AI方案构建完成!

在今天深圳的发布会上,华为副董事长、轮值董事长徐直军发布了最新商用AI芯片昇腾910(Ascend 910),以及首款国产的全场景AI计算框架——MindSpore计算框架。

至此,从去年发布“五大AI战略”,短短一年时间,在各方压力下的华为,已经迅速完成了全场景AI方案的全部部件构建。华为表示,接下来会专注于各部件的优化和升级。

在答记者问的环节徐直军也提到,“516事件”(美国商务部以国家安全为由,将华为公司及其70家附属公司列入出口管制「实体名单」)对华为战略推荐和全场景产品研发没有任何影响,尽管外部环境发生了很多变化,但是整个AI战略和产品商用依然在稳步推进,也达到了预期结果。

而对于华为在计算框架生态的构建上,如何与谷歌和Facebook等已经长期耕耘的公司竞争的问题,徐直军表示,华为的优势在于有自己的移动终端产品,并且利用算力和计算框架结合,可以打造很多其他框架不能实现的功能。

其实在8月21日开幕的第31届Hot Chips大会上,华为作为主角之一与AMDIntelARM等巨头同台亮相时,就推出了AI芯片所用的“Da Vinci(达芬奇)”架构,以及昇腾310、昇腾910芯片和麒麟810芯片。

昇腾310、昇腾910芯片早在去年10月10日的华为全链接2018大会上就已首次亮相。

聚焦低功耗的昇腾310已经量产商用,那今天发布的昇腾910(Ascend 910)AI处理器和MindSpore计算框架又有什么新的亮点呢?

最新商用AI芯片昇腾910发布

先看昇腾910,据华为介绍,这款芯片在算力方面超过了预期,同等规格下,昇腾910达到并超过了C级规格,能在一个时钟周期下完成4096次计算。

这个成绩得益于基于达芬奇架构的AI核的计算核心,除了标量和矢量计算单元,AI核集成了3D立方体计算引擎,与CPUGPU相比,有两个数量级上的提升。

昇腾910更是集成了32个立方体计算引擎,能够输出256TFLOPS(每秒256万亿次浮点指令),所以昇腾910不仅是一个AI芯片,更是一个高度集成的片上系统,集成了CPU、DVBP及任务管理器。

同时昇腾910拥有自治能力,使其可以独立完成整个AI训练流程,最小化和Host的交互,从而发挥其强大的算力。

再看昇腾910的通信机制,昇腾910集成了HCCS、PCLe和RoCE三种高速接口,其中自研的HCCS可以提供单接口240Gbps的传输,从而实现芯片构建训练系统的性能和灵活性的大幅提升。

华为也表示,将继续面向未来投资,针对不同场景进行研发,提供更强大经济的算力需求。昇腾310、昇腾910仅仅是一个开始,未来将推出昇腾920。

在价格上,华为也表示,这款芯片的售价还没有确定,但是绝不会高于同性能芯片的售价。

发布首款国产全场景AI计算框架——MindSpore

接下来,华为还发布了一款全场景AI计算框架——MindSpore。

徐直军表示,目前国内还没有一款能够对标Tensorflow的全场景AI计算框架,MindSpore希望能够弥补国内的这一空白。

在性能上,MindSpore对开发者非常友好,能够有效减少模型开发时间,降低开发门槛。相同场景需求下,减少模型代码量20%,效率能够整体提升50%以上。

具体来说,MindSpore自动微分采用Source 2 Source方式实现,在性能和可编程性上,明显优于业界图和运算符重载方式,同时能够实现任意算子的微分表达和编译优化,实现反向算子自动生成,从而极大方便模型开发。

随着数据集和模型规模越来越大,模型并行成为必然,手工切分的模型并行存在门槛高、效率低、调优难的缺陷,而MindSpore只需要定义单机模型,即可实现多机混合并行运行,无需了解AI集群细节。

MindSpore同时支持静态图和动态图,且可用一条语句实现无缝切换,从而让调试也变得简单而高效。

不仅有开发态的高效,运行态的友好同样是MindSpore的追求目标。MindSpore大大提高了运算性能,并且除了支持华为的昇腾910外,也支持其他业界其他CPU、GPU。

MindSpore还提供了Ascend Native运行技术,助力昇腾算力最佳发挥。主从控制模式中,CPU和GPU交互,引入内存和数据开销,在芯片上完成神经网络模型所需要的所有控制和执行。

至于很多人问为什么有了TensorFlow还要开发MindSpore,徐直军表示:目前没有任何一个国产框架支持全场景。华为目前的业务包括云、端、边,这些都需要全场景支持的AI框架。在不同的运行环境中,架构上支持可大可小,适应全部场景部署。

在隐私保护方面,MindSpore不带有隐私信息的梯度模型,能够在保证保护用户隐私的前提下,跨场景协同。

总的来说,支持端、边、云独立和协同的统一训练和推理的MindSpore计算框架,降低了AI的开发和使用门槛,释放AI生产力,最大程度发挥AI芯片算力潜力,从而鼓励开发人员共同打造AI生态,推动AI产业落地。

华为称,MindSpore将在明年一季度开源,让更多开发者参与将MindSpore打造好。

华为全场景AI构建方案完成

最后,让我们再回顾一下华为去年发布的AI五大战略:

投资基础研究:在计算视觉、自然语言处理、决策推理等领域构筑数据高效(更少的数据需求)、能耗高效(更低的算力和能耗),安全可信、自动自治的机器学习基础能力

打造全栈方案:打造面向云、边缘和端等全场景的、独立的以及协同的、全栈解决方案,提供充裕的、经济的算力资源,简单易用、高效率、全流程的AI平台

投资开放生态和人才培养:面向全球,持续与学术界、产业界和行业伙伴广泛合作,打造人工智能开放生态,培养人工智能人才

解决方案增强:把AI思维和技术引入现有产品和服务,实现更大价值、更强竞争力

内部效率提升:应用AI优化内部管理,对准海量作业场景,大幅度提升内部运营效率和质量

而今年芯片和计算架构的发布,也是华为对这一战略的落地实践。这也标志着华为全场景AI构建方案完成。

目前从世界范围来看,在桌面CPU上,Intel和AMD处于绝对的统治地位;GPU方面,则是英伟达在领跑;至于手机处理器,则基本握在了ARM手中。尽管华为有备胎计划,但是性能方面预计很难超过这些技术成熟、人才资本雄厚的企业。

深圳半导体协会秘书长常军锋曾指出,国外半导体巨头通过国际标准、行业标准、专利保护建立了技术壁垒。

AI芯片,则成为了国产芯片弯道超车的绝佳机会。

AI芯片从发育到成熟落地,国内基本和国外大厂处于同一起跑线上,并且如今华为昇腾系列已经商业化,昇腾910作为是目前单芯片计算密度最大的芯片,计算力也超过了谷歌及英伟达竞品。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    217

    文章

    35783

    浏览量

    260712
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296586
  • AI芯片
    +关注

    关注

    17

    文章

    2063

    浏览量

    36567
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为发布AI容器技术Flex:ai平均利用率提升30%

    电子发烧友网综合报道 2025年11月21日,在上海举办的“2025 AI容器应用落地与发展论坛”上,华为正式发布并开源了创新AI容器技术Flex:
    的头像 发表于 11-26 08:31 7120次阅读

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    MWC Doha 2025|美格智能全新发布60 Tops AI、支持Linux系统的SNM982高AI模组

    11月25日,在MWCDoha展会期间,美格智能全新发布基于高通QCS8650平台研发设计的SNM982高AI模组。搭载Linux5.15系统,
    的头像 发表于 11-25 16:34 572次阅读
    MWC Doha 2025|美格智能全新<b class='flag-5'>发布</b>60 Tops <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>、支持Linux系统的SNM982高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>AI</b>模组

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下
    发表于 10-27 13:12

    华为联合发布智能网研究报告

    华为全联接大会2025期间,以“引领AI DC创新,共赢智能未来”为主题的首届数据中心创新峰会上,华为联合中国信通院、泰国KBTG、尼日利亚Fidelity共同发布《智能
    的头像 发表于 09-25 09:37 445次阅读

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的
    的头像 发表于 09-19 15:26 1147次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的
    的头像 发表于 09-19 15:25 429次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的未来:提升还是智力

    持续发展体现在: 1、收益递减 大模型的基础的需要极大的,这首先源于昂贵的高性能AI芯片,然后是宝贵的电力、水等与环境相关的资源。 收益递减体现在: ①模型大小 ②训练数据量 ③训
    发表于 09-14 14:04

    华为联合中国移动研究院发布路由AI推理及视联网应用样板”

    2025年8月20日;在第九届未来网络发展大会期间,华为联合中国移动研究院发布路由AI推理及视联网应用样板”,标志着
    的头像 发表于 08-25 19:23 1017次阅读

    2025端侧AI芯片爆发:存一体、非Transformer架构谁主浮沉?边缘计算如何选型?

    各位技术大牛好!最近WAIC 2025上端侧AI芯片密集发布,彻底打破传统困局。各位大佬在实际项目中都是如何选型的呢?
    发表于 07-28 14:40

    一文看懂AI集群

    最近这几年,AI浪潮席卷全球,成为整个社会的关注焦点。大家在讨论AI的时候,经常会提到AI集群。AI
    的头像 发表于 07-23 12:18 966次阅读
    一文看懂<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>集群

    芯片的生态突围与革命

    电子发烧友网报道(文 / 李弯弯)大芯片,即具备强大计算能力的集成电路芯片,主要应用于高性能计算(HPC)、人工智能(AI)、数据中心、
    的头像 发表于 04-13 00:02 2610次阅读

    DeepSeek推动AI需求:800G光模块的关键作用

    随着人工智能技术的飞速发展,AI需求正以前所未有的速度增长。DeepSeek等大模型的训练与推理任务对的需求持续攀升,直接推动了服务
    发表于 03-25 12:00

    企业AI租赁模式的好处

    构建和维护一个高效、可扩展的AI基础设施,不仅需要巨额的初期投资,还涉及复杂的运维管理和持续的技术升级。而AI
    的头像 发表于 12-24 10:49 1657次阅读