0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为借助异构计算架构CANN推动技术行业落地

7riU_gh_3a181fa 来源:华为计算 作者:华为计算 2021-12-16 17:29 次阅读

12月,第十九届CCF全国嵌入式系统大会(CCF ESTC 2021)在山东青岛召开。本届会议由中国计算机学会(CCF)主办,CCF嵌入式系统专委与西安电子科技大学青岛技术研究院联合承办。旨在加强从事嵌入式系统研究领域国内外学者之间的联系与交流,了解相关国际发展动态和研究热点,促进我国多学科交叉融合与嵌入式系统产业的发展。华为昇腾CANN亮相本次大会,与行业分享创新技术,为人工智能技术融入产业带来新的启发。

会议邀请了院士和国内外嵌入式系统领域的顶级专家学者作大会特邀报告,还通过专题论坛和分会场口头报告、科技成果展示、学术论文交流等形式多样的活动充分进行技术交流,推动“政产学研用”合作,引领技术进步,支撑产业发展。

会上,华为昇腾CANN生态高级总监王海彬发表了《昇腾CANN释放硬件澎湃算力》的主题演讲,分享在当前波涛汹涌的AI浪潮中,华为如何借助异构计算架构CANN(Compute Architecture for Neural Networks)进行技术创新和生态开展,持续使能科研和产业关键突破,推动技术行业落地。

于AI浪潮中迎接挑战

王海彬提到,AI作为新的通用目的技术将深刻推动社会发展进程。目前的人工智能正从单点技术走向真正的通用技术,同时AI计算也面临计算新范式、异构计算兴起、对大集群的需求日益提升,推理部署场景复杂、效率低下等问题,如何让AI用得上、用得起、用得好成为人工智能发展的关键。华为推出的异构计算架构CANN将助力解决人工智能技术面临的算力问题、多样性场景下开发效率低、编程易用性差的诸多现状。

CANN 5.0 厚积薄发,以硬实力破解困境

CANN作为昇腾处理器的AI异构计算架构,对上支持业界多种主流的AI框架,对下友好适配多异构处理器,发挥呈上启下的关键作用,是提升昇腾AI处理器计算效率的关键平台,同时针对多样化应用场景,提供高效易用的编程方式,成为了破解当前人工智能技术困境的关键。

华为昇腾CANN生态高级总监王海彬《昇腾CANN释放硬件澎湃算力》主题演讲

CANN1.0诞生于2018年,并在快速迭代过程中,从软件层面持续进行技术沉淀并迎来了一个又一个突破。2020年底,基于CANN的鹏城云脑II推出,并获得 AIPerf榜单第一;2021年4月,依托CANN关键技术的中文NLP超大模型盘古发布,其参数超过2000亿,具备业界领先的语言理解和模型生成能力,带来了前所未有的商业价值。CANN5.0作为全新一代AI异构计算架构版本,通过软硬件结合优化再度获得大幅性能提升,将昇腾AI处理器的澎湃算力发挥到极致。

原本在3.0版本需要6.25分钟训练的BERT模型,在CANN 5.0的加持下缩短了一倍多,只需2.69分钟就能完成训练;同时,原本需要28秒训练的ResNet模型,通过5.0版本缩短到了16秒。此外,常用小规模训练场景(分类、检测、语义分割、NLP等)实现性能翻倍;在分类、翻译、检测典型推理场景下,性能也可达到30%到140%的提升。

CANN5.0性能大幅提升的关键在于技术的持续突破和创新。通过深耕细作不断挖掘昇腾AI处理器的潜能,CANN在软件层面实现了更高效的任务调度和更智能的数据切分,借助任务自动流水、算子深度融合、自适应梯度切分、AutoTune智能计算调优等关键技术诠释了昇腾AI极致性能的风采。并依托自动分解和并行技术,将超大模型的处理同普通模型一样简单。

CANN5.0还提供了全套推理引擎软件包ATC Suite1.0,面向客户网络提供图级别、算子级别的自动调优能力;同时通过强大的多媒体处理能力,能轻松应对多路复杂的音视频处理场景;支持在线及离线推理方式,助力开发者更加灵活地实现高性能推理应用。

生态全面开展,CANN与开发者携手并进

作为华为昇腾CANN生态高级总监,王海彬分享了在过去的一年中,CANN面向开发者的生态开展情况。

迄今为止,CANN的社区活跃度较去年提升3倍;累计与超过200家高校研究团队开展合作,众智项目贡献400+个模型及800+个算子;目前CANN已经支持昇腾开发者人数达到58W, 其中核心开发者近9000人,已经成为了社区贡献的主力。并在接下来的2022年中,希望有更多的开发者与CANN携手点燃燎原之火,共建昇腾AI繁荣生态。

在汹涌的AI时代浪潮中,AI技术领域面临重重困难和挑战,CANN作为人工智能基础软件平台,将持续在基础能力和关键技术上突破创新,并肩负起时代赋予的使命任务,和万千个人开发者、专家学者、行业伙伴一起,共迎挑战,共创机遇,共享未来!

原文标题:昇腾CANN,࿓硬࿓核࿓!

文章出处:【微信公众号:华为计算】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    215

    文章

    33568

    浏览量

    247040
  • AI
    AI
    +关注

    关注

    87

    文章

    26363

    浏览量

    263957
  • 人工智能
    +关注

    关注

    1775

    文章

    43716

    浏览量

    230494

原文标题:昇腾CANN,࿓硬࿓核࿓!

文章出处:【微信号:gh_3a181fa836b6,微信公众号:华为计算】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    高通NPU和异构计算提升生成式AI性能 

    异构计算的重要性不可忽视。根据生成式AI的独特需求和计算负担,需要配备不同的处理器,如专注于AI工作负载的定制设计的NPU、CPU和GPU。
    的头像 发表于 03-06 14:15 199次阅读

    OPPO发布自研芯片软硬融合技术栈“潮汐架构”,同时宣布退出芯片领域

    据了解,这一架构是OPPO与其合作伙伴联发科技深度协同开发的结果。其充分挖掘芯片底层潜能,实现异构计算单元的高效动态调度。
    的头像 发表于 01-09 09:26 274次阅读

    润开鸿基于高性能RISC-V开源架构DAYU800通过OpenHarmony兼容性测评

    算力达4TOPs,支持全链路安全防护,包含丰富的异构计算和高速IO资源,可用于平板、智慧大屏、智能NVR、AR/VR和低速UGV等高性能旗舰产品,支持医疗成像、视频会议、家用机器人和无人机等典型场景
    发表于 12-14 17:33

    科学计算与Julia技术研讨会 | 张先轶:从OpenBLAS到异构计算软件栈

    蓬勃发展,新兴科学计算语言不断涌现,Julia以其高性能、动态性成为其中的佼佼者。 12月9日上午1020 ,澎峰科技创始人 张先轶博士 将 在 主论坛:Julia与数字化和AI 上 作 “ 从OpenBLAS到异构计算软件栈” 主题演讲,期待与大家见面 ! 研讨会完整详
    的头像 发表于 11-30 19:35 399次阅读
    科学<b class='flag-5'>计算</b>与Julia<b class='flag-5'>技术</b>研讨会 | 张先轶:从OpenBLAS到<b class='flag-5'>异构计算</b>软件栈

    异构众核系统高性能计算架构

    随着计算机技术的发展,单核处理器已经难以满足高性能计算的需求,众核处理器成为了一种有效的解决方案。众核处理器是指在一个芯片上集成多个处理器核心,通过并行计算提高性能和能效,众核处理器可以分为同构
    的头像 发表于 11-30 08:27 433次阅读
    <b class='flag-5'>异构</b>众核系统高性能<b class='flag-5'>计算</b><b class='flag-5'>架构</b>

    什么是异构集成?什么是异构计算异构集成、异构计算的关系?

    异构集成主要指将多个不同工艺节点单独制造的芯片封装到一个封装内部,以增强功能性和提高性能。
    的头像 发表于 11-27 10:22 2717次阅读
    什么是<b class='flag-5'>异构</b>集成?什么是<b class='flag-5'>异构计算</b>?<b class='flag-5'>异构</b>集成、<b class='flag-5'>异构计算</b>的关系?

    昇腾AI框架全栈深度介绍

    澎湃算力,同步推出针对AI场景的异构计算架构CANN(Compute Architecture for Neural Networks)
    的头像 发表于 10-22 16:19 1693次阅读
    昇腾AI框架全栈深度介绍

    请问模型推理只用到了kpu吗?可以cpu,kpu,fft异构计算吗?

    请问模型推理只用到了kpu吗?可以cpu,kpu,fft异构计算吗?
    发表于 09-14 08:13

    新一代计算架构异构计算技术是什么 异构走向超异构案例分析

    异构计算架构是一种将不同类型和规模的硬件资源,包括CPU、GPU、FPGA等,进行异构集成的方法。它通过独特的软件和硬件协同设计,实现了计算资源的灵活调度和优化利用,从而大大提高了
    发表于 08-23 09:57 445次阅读
    新一代<b class='flag-5'>计算</b><b class='flag-5'>架构</b>超<b class='flag-5'>异构计算技术</b>是什么 <b class='flag-5'>异构</b>走向超<b class='flag-5'>异构</b>案例分析

    异构计算场景下构建可信执行环境

    本文转载自 OpenHarmony TSC 《峰会回顾第4期 | 异构计算场景下构建可信执行环境》 演讲嘉宾 | 金意儿 回顾整理 | 廖涛 排版校对 | 李萍萍 嘉宾简介 金意儿,华为可信计算
    发表于 08-15 17:35

    异构计算的初步创新

    更 高,x16带宽(双向)从64 GB/s提 升到了128 GB/s;目前规范制定已迭 代至6.0版本,带宽再翻倍。 异构计算的初步创新:在
    的头像 发表于 06-19 11:26 447次阅读
    <b class='flag-5'>异构计算</b>的初步创新

    AI边缘计算盒子是如何推动边缘AI应用落地

    AI边缘计算盒子(AI Edge Computing Box)是一种集成了边缘计算和AI算法处理能力的设备,可以用于推动边缘AI应用的落地。以下是AI边缘
    的头像 发表于 05-26 14:08 684次阅读

    使用Synopsys协议连续体满足计算高速链路设计的异构验证和确认要求

    数据是推动云/边缘计算关键用例和人工智能进步的新燃料。数据处理的各个方面(收集、存储、移动、处理和分散)都带来了独特的设计实现和验证挑战。对异构计算的需求使特定于应用程序的加速器呈指数级增长,
    的头像 发表于 05-25 16:43 272次阅读
    使用Synopsys协议连续体满足<b class='flag-5'>计算</b>高速链路设计的<b class='flag-5'>异构</b>验证和确认要求

    PrimeSimSPICE:异构计算模型实现数量级性能突破

    随着对更高计算性能的需求不断增加,HPC 行业正朝着异构计算模型发展,其中 GPU 和 CPU 协同工作以执行通用计算任务。在这种异构计算
    的头像 发表于 05-24 16:53 580次阅读
    PrimeSimSPICE:<b class='flag-5'>异构计算</b>模型实现数量级性能突破

    异构计算面临的挑战和未来发展趋势

    导读超异构异构的本质区别在哪里?这篇文章通过对异构计算的历史、发展、挑战、以及优化和演进等方面的分析,来进一步阐述从异构走向异构融合(即超
    的头像 发表于 04-26 15:18 594次阅读
    <b class='flag-5'>异构计算</b>面临的挑战和未来发展趋势