0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

燧原科技如何立足于国产云端AI算力攻克通用性与性能双重挑战

燧原科技Enflame 来源:燧原科技Enflame 作者:燧原科技Enflame 2021-10-29 11:06 次阅读

由中国工程院信息电子工程学部主办,浪潮信息承办,2021年人工智能计算大会(AICC)于北京成功召开。作为全球AI计算领域最具影响力的技术盛会,本次大会以“智算·新际”为主题,邀请到众多专家学者与产业领袖,就智能算力发展、人工智能产业创新以及产业数字化转型展开精彩分享。燧原科技副总裁邓辉先生受邀出席“AI芯片创新技术”分论坛,并就燧原科技如何立足于国产云端AI算力攻克通用性与性能双重挑战发表演讲。

起点

长期处于自主创新空白的云端训练AI算力一切要从2012年那场改变人工智能发展史的ImageNet图像分类竞赛开始谈起。在当时的比赛中,“深度学习之父”、图灵奖获得者——多伦多大学Geoffrey Hinton教授首次提出深度卷积神经网络模型“AlexNet”,参数量达6000万。AlexNet的出现是人工智能技术发展史上重要的转折点,它将沉寂已久的深度学习技术再次推至历史舞台。除了革命性的“大模型”,Geoffrey Hinton教授创新性地采用了异构算力GPU作为训练加速资源。“AI加速”这个概念由此进入广大AI科研工作者与产业落地先锋的视野。

新一轮技术文明由此开始,可这并没有带来我国自主创新AI算力的繁荣,一直以来,AI加速产品与技术都被GPU厂商所垄断,尤其是在云端训练领域,由于云端数据中心整体架构的高度复杂性、大规模分布式AI训练带来的巨大挑战及其本身要支撑的业务多样性等原因,云端训练是国内厂商切入难度最为高的一个领域,长期处于空白的状态,燧原科技作为行业领头羊于2019年发布邃思1.0云端训练芯片,开始了攻坚技术壁垒、打破垄断的征程。

挑战

云端专用AI训练产品的性能与通用性互联网是人工智能技术与产业发展的沃土,人工智能在互联网的广泛应用得益于各类深入人们生活的终端应用所产生的大量数据,而云计算作为关键的底层技术支撑,正与互联网共同以孪生体姿态不断地蓬勃发展,为我们带来了空前的数据井喷与突破人类认知的巨量模型,对超强算力产生了爆炸性的需求;传统GPU架构虽然早期开创了人工智能发展的篇章,但随着人工智能产业蓬勃发展,在规模效应的驱使下,DSA架构带来的更经济的成本与更高效的计算能力使得专用AI训练产品变得越来越有优势。然而由于专用AI训练产品天生缺乏生态积累,在模型泛化与通用性上一直是业界痛点。因此如何保证比GPU更高效的AI模型计算能力,同时兼顾一定的通用性是云端AI训练芯片面临的最大挑战。燧原科技副总裁邓辉先生表示:“我们把性能与通用性作为产品成功最重要的衡量标准,经过3年的努力,这两方面的能力在我们第二代产品上取得飞跃。”

燧原

中国首家发布二代云端训练加速产品组合的企业燧原科技以助力发展我国集成电路和人工智能产业、推动AI算力普惠化为使命,秉承“做大芯片、拼硬科技”的原则,自2019年12月推出第一代云端训练芯片邃思1.0以后,率先实现国产AI芯片数据中心与千卡液冷集群的商业落地,并于2021年7月在世界人工智能大会(WAIC)发布邃思2.0,是中国唯一一家推出二代云端训练加速产品组合的企业。

基于燧原科技自研的GCU-CARE计算引擎,邃思2.0进行了大规模的架构升级,针对人工智能计算的特性进行深度优化,夯实了支持通用异构计算的基础。支持全面的计算精度,涵盖从FP32、TF32、FP16、BF16到INT8;并在单精度算力方面达到与7nm GPU相当的性能水平:单精度FP32峰值算力最高达到40 TFLOPS,单精度张量TF32峰值算力最高达到160 TFLOPS,大大提高了能效比。同时搭载了4颗HBM2E片上存储芯片,高配支持64 GB内存,带宽最高可达1.8 TB/s。GCU-LARE也全面升级,提供双向300 GB/s互联带宽,支持数千张云燧CloudBlazer加速卡互联,实现优异的线性加速比。

而同步升级的驭算TopsRider软件平台,成为燧原科技构建原始创新软件生态的基石。通过软硬件协同架构设计,充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,支持主流深度学习框架下的各类模型训练;利用Horovod分布式训练框架与GCU-LARE互联技术相互配合,为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口,为客户模型的优化提供了自定义的开发能力。

基于邃思2.0,燧原科技推出了云燧T20人工智能训练加速卡与云燧T21人工智能训练OAM模组,能够通过300GB/s的独立片间互联通道提供灵活的多芯片算力扩展方案,支持单机多卡、单机柜多节点、多机柜大机群多种部署方式。

未来

更多的AI解决方案与产品孵化除了强劲的原始创新芯片支撑,AI算力的腾飞与人工智能产业的发展需要依托于健全的生态合作体系。在演讲的最后,燧原科技副总裁邓辉先生表示:“未来,我们期望在人工智能领域和浪潮以及更多的合作伙伴一起合作打造更多AI解决方案和产品,助力中国AI产业蓬勃发展。”

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    447

    文章

    47808

    浏览量

    409183
  • AI
    AI
    +关注

    关注

    87

    文章

    26462

    浏览量

    264089
  • 燧原科技
    +关注

    关注

    0

    文章

    98

    浏览量

    8143

原文标题:原始创新架构助力云端AI算力腾飞

文章出处:【微信号:gh_1222367b8780,微信公众号:燧原科技Enflame】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    龙芯:自主研发CPU提升性能,单核通用性能提高20倍

    张戈强调,龙芯CPU的主要IP核均为自主研发,这使得其性价比得到显著提升。他指出,国产CPU与主流CPU的差距主要体现在单核性能上,而非多核性能。近年来,龙芯CPU的单核通用性能已提升
    的头像 发表于 04-25 15:26 160次阅读

    国产RISC-V MCU推荐

    ) 低功耗40纳米工艺,具有超高的射频性能、稳定性、通用性和可靠,以及超低的功耗,满足不同的功耗需求,适用于各种应用场景。 ESP32是业内集成度领先的Wi-Fi+蓝牙解决方案,外部元器件仅有20个
    发表于 04-17 11:00

    使用国产的FPGA开发,需要哪些准备

    准备抽时间学习FPGA开发,国产的,有通用软件可以用吗啊?还是每个厂家有自己的开发工具?有没有类似Keil那样的IDE开发FPGA?
    发表于 04-14 19:14

    谷歌发布Axion新款数据中心AI芯片,性能超越x86及云端

    谷歌预计将通过Google Cloud提供Axion AI芯片给客户。谷歌强调这款基于ARM的CPU产品具有优越的性能表现,甚至超越了传统的x86芯片及云端通用ARM芯片。
    的头像 发表于 04-10 16:32 468次阅读

    NanoEdge AI的技术原理、应用场景及优势

    NanoEdge AI 是一种基于边缘计算的人工智能技术,旨在将人工智能算法应用于物联网(IoT)设备和传感器。这种技术的核心思想是将数据处理和分析从云端转移到设备本身,从而减少数据传输延迟、降低
    发表于 03-12 08:09

    【换道赛车:新能源汽车的中国道路 | 阅读体验】新能源汽车值得买吗?未来又会如何发展

    的未来将走向何方等宏观性问题。而这些不仅关系消费者的切身利益,也为许多身处其中而又不能窥见全貌的从业者指明方向,虽然新能源汽车未来的发展道路仍然是机遇与挑战并存,但只要我们坚守本心,立足于自身,那么创建出一条属于我们自己的新能源汽车赛道,并非天方夜谭。
    发表于 03-08 17:33

    国产光耦2024:发展机遇与挑战全面解析

    随着科技的不断进步,国产光耦在2024年正面临着前所未有的机遇与挑战。本文将深入分析国产光耦行业的发展现状,揭示其在技术创新、市场需求等方面的机遇和挑战
    的头像 发表于 02-18 14:13 343次阅读
    <b class='flag-5'>国产</b>光耦2024:发展机遇与<b class='flag-5'>挑战</b>全面解析

    国产FPGA+OMAPL138开发板体验】(原创)5.FPGA的AI加速源代码

    ; for (int k = 0; k < 8; k = k + 1) begin // 累加计算每个元素,就像AI不断考虑各种可能 C[i][j] = C[i][j] + (A[i][k] * B
    发表于 02-12 16:18

    立足算力,聚焦AI!顺网科技全面走进AI智算时代

    立足算力,聚焦AI”,顺网科技进军AI智算时代的号角已被吹响。 1月18日,顺网科技(300113.SZ)以“跃迁·向未来”为主题的战略升级暨产品升级发布会在杭州圆满召开。发布会上,顺网科技公布
    的头像 发表于 01-19 10:57 223次阅读
    <b class='flag-5'>立足</b>算力,聚焦<b class='flag-5'>AI</b>!顺网科技全面走进<b class='flag-5'>AI</b>智算时代

    RH119:高性能双重比较数据表 ADI

    电子发烧友网为你提供ADI(ADI)RH119:高性能双重比较数据表相关产品参数、数据手册,更有RH119:高性能双重比较数据表的引脚图、接线图、封装手册、中文资料、英文资料,RH11
    发表于 10-08 16:02
    RH119:高<b class='flag-5'>性能</b><b class='flag-5'>双重</b>比较数据表 ADI

    英码科技精彩亮相火爆的IOTE 2023,多面赋能AIoT产业发展!

    产品,包括覆盖多层次力的智能工作站(边缘计算盒子)、AI加速卡等;同时向大家展示自研的AI技术服务——“深元”0代码移植工具链和创新的行业解决方案,赋能更多AIoT产业生态企业快速
    发表于 09-25 10:03

    阿丘助力攻克动力电池复杂瑕疵检测难题

    阿丘科技-首选AI专家动力电池复杂瑕疵检测由于动力电池工艺流程复杂、安全性以及质量一致性要求高,产能和质量控制成为这一行业的重要关注点。基于AI的解决方案,正是帮助动力电池行业提升品质和良率的重要
    的头像 发表于 09-14 08:26 596次阅读
    阿丘助<b class='flag-5'>力攻克</b>动力电池复杂瑕疵检测难题

    如何使用双重CAN

    应用:该代码展示了如何使用双重CAN。 BSP 版本: NUC230/240 Series BSP CMSIS v3.01.001 硬件: NuEdu-EVB-NUC240 v2.0
    发表于 08-22 07:08

    浅谈兆芯、海光、鲲鹏等国产通用芯片的发展道路

    ,那么,国产“芯”要如何才能走得稳走得久呢?兆芯、海光、鲲鹏等国产通用芯片的道路或许能给国产手机厂商们一些启发。
    的头像 发表于 06-02 06:49 1474次阅读

    事实证明,国产BI软件的财务数据分析性价比极高!

    丰富的BI大数据分析经验和财务数据分析通用需求进行整合,打磨出一套标准化财务数据分析方案的软件。财务分析方案的标准化,有效降低踩坑风险,提高了方案的通用性(适用)。企业仅需在下载安装后,进行简单
    发表于 05-16 11:06