燧原科技发布了首款面向云端的高性能推理卡-电子发烧友网

云端AI推理需求将在2022年迎来爆发。继去年底发布首款面向数据中心的AI训练芯片“邃思”及加速卡“云燧T10”后，燧原科技又发布了首款面向云端的高性能推理卡。

疫情加快了数据中心建设步伐和AI应用的速度。“传统数据中心和AI没有直接关系，就是X86+GPU加一堆存储和数据搬运，但现在数据中心越来越多引入AI加速平台。AI的渗透率会越来越高，我们预计渗透率会从5%到25%-30%，市场非常庞大。”燧原科技CEO赵立东在接受第一财经专访时表示。

12月21日，燧原科技发布首款面向数据中心的AI推理产品 “云燧i10”。该公司是腾讯投资的国内AI芯片初创企业。2018年8月，燧原科技由腾讯领投获得Pre-A轮融资3.4亿元人民币。今年5月，燧原科技宣布完成B轮融资7亿元人民币，由半导体产业基金武岳峰资本领投，腾讯、上海双创等跟投。

按使用场景划分，AI芯片主要分为云端和终端芯片。目前主流的神经网络深度学习包括训练和推断两个部分。云端追求高性能，开发成本更大，终端更侧重低成本和低功耗。目前中国AI初创企业主要布局在终端和边缘侧。

赵立东认为，面向数据中心的高性能AI计算芯片及分布式集群作为人工智能产业的基础设施，从架构升级到应用场景的落地，都蕴含了巨大的市场空间和机遇。

除了训练侧，云端AI推理的需求也不断攀升。研究机构赛迪顾问报告显示，从2019年到2021年三年中国AI芯片市场规模仍将保持50%以上的增长速度，到2021年，市场规模将达到305.7亿元。其中，随着大规模地方性数据中心的建设陆续完成，云端训练芯片增长速度放缓；而随着各领域市场需求的释放，云端推断芯片、终端推断芯片市场增长速度将持续呈上升趋势。

数据显示，从2019年到2024年，云端训练芯片的年复合增长率为32%，而云端推理的增长率将达69%。到2022年，中国云端推理芯片市场规模将达到189亿元，首次超过云端训练市场规模。

赵立东表示，AI真正起步在过去五六年，国内更晚，BAT等大企业从2018、2019年才开始大量采购英伟达V100训练芯片，“训练跟推理的关系是训练出来的模型被部署到推理产品上使用。当模型、算法不成熟，你需要不断训练、迭代，成熟了才能被部署到推理上去真正应用。从2018年开始到2022年，很多场景的算法和模型经过这几年开始逐渐成熟，真正规模化应用。当推理芯片销售收入超过训练芯片，很多算法、模型已经开始被广泛应用了。对AI领域来讲，2022年是个重要的节点。”

在生态合作方面，燧原科技COO张亚林称：“云燧i10已完成与浪潮、新华三及Supermicro等服务器厂商推理服务器的适配。可适用于视频图像、语音、自然语言处理、知识图谱等多种应用场景，并针对内容理解、推荐、识别等高精度场景做了优化。”

据悉，云燧i10是单槽位标准卡，支持PCIe 4.0，FP32算力达17.6TFLOPS，BF16/FP16算力70.4TFLOPS，将于明年第一季度上市。同时，燧原科技发布了推理引擎“鉴算TopsInference”。

燧原科技的云端训练产品已实现商业落地。今年9月，燧原科技称，“云燧T10”和由其组成的多卡分布式训练集群已在云数据中心落地，正式进入商用阶段。腾讯是燧原科技的重要合作伙伴，赵立东告诉第一财经，双方将进一步加强合作的广度和深度。不过，他指出，“腾讯是我们起步期（破冰）的重要伙伴，起步是最难的，从0到1。腾讯给我们很大帮助，是我们第一个具有战略意义的重要客户，但绝对不是唯一的。”

据介绍，燧原科技有三大目标市场，一是云服务提供商，包括公有云、私有云、混合云等，这类企业有大量的流量和数据，需要训练算法加速AI相关应用；二是专注于金融、保险、医疗、交通等领域的行业服务商；三是AI超算中心和智慧城市等领域。
责任编辑：YYX

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉