0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

燧原科技发布了首款面向云端的高性能推理卡

姚小熊27 来源:人工智能实验室 作者:人工智能实验室 2020-12-22 10:09 次阅读

云端AI推理需求将在2022年迎来爆发。继去年底发布首款面向数据中心的AI训练芯片“邃思”及加速卡“云燧T10”后,燧原科技又发布了首款面向云端的高性能推理卡。

疫情加快了数据中心建设步伐和AI应用的速度。“传统数据中心和AI没有直接关系,就是X86+GPU加一堆存储和数据搬运,但现在数据中心越来越多引入AI加速平台。AI的渗透率会越来越高,我们预计渗透率会从5%到25%-30%,市场非常庞大。”燧原科技CEO赵立东在接受第一财经专访时表示。

12月21日,燧原科技发布首款面向数据中心的AI推理产品 “云燧i10”。该公司是腾讯投资的国内AI芯片初创企业。2018年8月,燧原科技由腾讯领投获得Pre-A轮融资3.4亿元人民币。今年5月,燧原科技宣布完成B轮融资7亿元人民币,由半导体产业基金武岳峰资本领投,腾讯、上海双创等跟投。

按使用场景划分,AI芯片主要分为云端和终端芯片。目前主流的神经网络深度学习包括训练和推断两个部分。云端追求高性能,开发成本更大,终端更侧重低成本和低功耗。目前中国AI初创企业主要布局在终端和边缘侧。

赵立东认为,面向数据中心的高性能AI计算芯片及分布式集群作为人工智能产业的基础设施,从架构升级到应用场景的落地,都蕴含了巨大的市场空间和机遇。

除了训练侧,云端AI推理的需求也不断攀升。研究机构赛迪顾问报告显示,从2019年到2021年三年中国AI芯片市场规模仍将保持50%以上的增长速度,到2021年,市场规模将达到305.7亿元。其中,随着大规模地方性数据中心的建设陆续完成,云端训练芯片增长速度放缓;而随着各领域市场需求的释放,云端推断芯片、终端推断芯片市场增长速度将持续呈上升趋势。

数据显示,从2019年到2024年,云端训练芯片的年复合增长率为32%,而云端推理的增长率将达69%。到2022年,中国云端推理芯片市场规模将达到189亿元,首次超过云端训练市场规模。

赵立东表示,AI真正起步在过去五六年,国内更晚,BAT等大企业从2018、2019年才开始大量采购英伟达V100训练芯片,“训练跟推理的关系是训练出来的模型被部署到推理产品上使用。当模型、算法不成熟,你需要不断训练、迭代,成熟了才能被部署到推理上去真正应用。从2018年开始到2022年,很多场景的算法和模型经过这几年开始逐渐成熟,真正规模化应用。当推理芯片销售收入超过训练芯片,很多算法、模型已经开始被广泛应用了。对AI领域来讲,2022年是个重要的节点。”

在生态合作方面,燧原科技COO张亚林称:“云燧i10已完成与浪潮、新华三及Supermicro等服务器厂商推理服务器的适配。可适用于视频图像、语音、自然语言处理、知识图谱等多种应用场景,并针对内容理解、推荐、识别等高精度场景做了优化。”

据悉,云燧i10是单槽位标准卡,支持PCIe 4.0,FP32算力达17.6TFLOPS,BF16/FP16算力70.4TFLOPS,将于明年第一季度上市。同时,燧原科技发布了推理引擎“鉴算TopsInference”。

燧原科技的云端训练产品已实现商业落地。今年9月,燧原科技称,“云燧T10”和由其组成的多卡分布式训练集群已在云数据中心落地,正式进入商用阶段。腾讯是燧原科技的重要合作伙伴,赵立东告诉第一财经,双方将进一步加强合作的广度和深度。不过,他指出,“腾讯是我们起步期(破冰)的重要伙伴,起步是最难的,从0到1。腾讯给我们很大帮助,是我们第一个具有战略意义的重要客户,但绝对不是唯一的。”

据介绍,燧原科技有三大目标市场,一是云服务提供商,包括公有云、私有云、混合云等,这类企业有大量的流量和数据,需要训练算法加速AI相关应用;二是专注于金融、保险、医疗、交通等领域的行业服务商;三是AI超算中心和智慧城市等领域。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    447

    文章

    47769

    浏览量

    409072
  • AI
    AI
    +关注

    关注

    87

    文章

    26424

    浏览量

    264034
  • 燧原科技
    +关注

    关注

    0

    文章

    98

    浏览量

    8143
收藏 人收藏

    评论

    相关推荐

    Arm Ethos-U85:满足物联网面向AI时代的高性能需求

    随着人工智能 (AI) 不断对我们的日常生活产生越来越大的影响,其推理任务也逐渐从云端迁移到边缘侧和端侧。
    的头像 发表于 04-09 17:04 451次阅读
    Arm Ethos-U85:满足物联网<b class='flag-5'>面向</b>AI时代的<b class='flag-5'>高性能</b>需求

    北醒正式上线AD2-S-X3高性能激光雷达,面向全球发售

    3月30日,北醒正式上线AD2-S-X3高性能激光雷达,面向全球发售。
    的头像 发表于 04-02 10:17 199次阅读

    Torch TensorRT是一个优化PyTorch模型推理性能的工具

    那么,什么是Torch TensorRT呢?Torch是我们大家聚在一起的原因,它是一个端到端的机器学习框架。而TensorRT则是NVIDIA的高性能深度学习推理软件工具包。Torch TensorRT就是这两者的结合。
    的头像 发表于 01-09 16:41 386次阅读
    Torch TensorRT是一个优化PyTorch模型<b class='flag-5'>推理性能</b>的工具

    润开鸿基于高性能RISC-V开源架构DAYU800通过OpenHarmony兼容性测评

    近期,江苏润开鸿数字科技有限公司(以下简称“润开鸿”)基于高性能RISC-V开源架构处理器研发的OpenHarmony标准系统开发平台HH-SCDAYU800通过OpenHarmony 3.2.2
    发表于 12-14 17:33

    HarmonyOS:使用MindSpore Lite引擎进行模型推理

    场景介绍 MindSpore Lite 是一 AI 引擎,它提供面向不同硬件设备 AI 模型推理的功能,目前已经在图像分类、目标识别、人脸识别、文字识别等应用中广泛使用。 本文介绍
    发表于 12-14 11:41

    256核!赛昉发布全新RISC-V众核子系统IP平台

    (Dubhe-90)的高性能RISC-V众核子系统IP平台。 StarLink-700是赛昉科技自研的支持缓存一致性的Interconnect Fabric IP,是国内Mesh架构互联总线IP
    发表于 11-29 13:37

    面向低轨通信小卫星的物联网平台的QLS1046-Space使高性能协议变为现实

    电子发烧友网站提供《面向低轨通信小卫星的物联网平台的QLS1046-Space使高性能协议变为现实.pdf》资料免费下载
    发表于 09-14 11:26 0次下载
    <b class='flag-5'>面向</b>低轨通信小卫星的物联网平台的QLS1046-Space使<b class='flag-5'>高性能</b>协议变为现实

    面向高性能和可扩展计算系统的IBM b-type网络

    电子发烧友网站提供《面向高性能和可扩展计算系统的IBM b-type网络.pdf》资料免费下载
    发表于 08-28 14:39 0次下载
    <b class='flag-5'>面向</b><b class='flag-5'>高性能</b>和可扩展计算系统的IBM b-type网络

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    HHB 实现在典型网络性能比第三方工具平均提升 88%,并增加支持运行 Transformer、TensorFlow、PyTorch 等 170 余个主流框架 AI 模型。 基于此,平头哥发布
    发表于 08-26 14:14

    2023RISC-V中国峰会,澎峰科技成果发布抢先看!

    ) HS-1是全球256核RISC-V计算型服务器。主要面向高密度计算场景设计,单主板搭载两颗64核RISC-V CPU,双芯CCIX互联。整机具备有4TFlops 64位浮点算力,满载支持16条
    发表于 08-15 18:28

    求助,为什么将不同的权重应用于模型会影响推理性能

    生成两个 IR文件(相同的 .xml 文件,但不同的 .bin 文件) 具有不同重量的类似模型,以不同的 fps (27fps 和 6fps) 运行 更多样化的权重是否会影响 Myriad X 上的推理性能
    发表于 08-15 07:00

    如何提高YOLOv4模型的推理性能

    使用 PyTorch 对具有非方形图像的 YOLOv4 模型进行了训练。 将 权重转换为 ONNX 文件,然后转换为中间表示 (IR)。 无法确定如何获得更好的推理性能
    发表于 08-15 06:58

    英特尔面向中国市场发布Gaudi2处理器,加速大模型训练和推理

    推出的Gaudi2 AI加速器,将通过其合作伙伴浪潮提供给中国客户。   Gaudi2在训练和推理上的出色表现   英特尔此次推出的Gaudi2深度学习加速器暨Gaudi2夹层卡HL-225B,以第一代Gaudi高性能架构为基础,以多方位
    的头像 发表于 07-17 00:01 1277次阅读
    英特尔<b class='flag-5'>面向</b>中国市场<b class='flag-5'>发布</b>Gaudi2处理器,加速大模型训练和<b class='flag-5'>推理</b>

    Fujitsu、NVIDIA、AMD和Intel高性能处理器架构分析

    商用高性能计算处理器市场主要被NVIDIA、AMD和Intel3家公司长期占据,在面向E级计算 的 高 性 能 处 理 器 中,AMD 最 新 的Instinct MI250X处理器双精度浮点运算
    发表于 06-30 09:49 659次阅读
    Fujitsu、NVIDIA、AMD和Intel<b class='flag-5'>高性能</b>处理器架构分析

    面向后E级计算的高性能处理器技术参考和借鉴

    商用高性能计算处理器市场主要被NVIDIA、AMD和Intel3家公司长期占据,在面向E级计算 的 高 性 能 处 理 器 中,AMD 最 新 的Instinct MI250X处理器双精度浮点运算
    发表于 06-19 09:34 356次阅读
    <b class='flag-5'>面向</b>后E级计算的<b class='flag-5'>高性能</b>处理器技术参考和借鉴