0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

燧原科技发布了首款面向云端的高性能推理卡

姚小熊27 来源:人工智能实验室 作者:人工智能实验室 2020-12-22 10:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

云端AI推理需求将在2022年迎来爆发。继去年底发布首款面向数据中心的AI训练芯片“邃思”及加速卡“云燧T10”后,燧原科技又发布了首款面向云端的高性能推理卡。

疫情加快了数据中心建设步伐和AI应用的速度。“传统数据中心和AI没有直接关系,就是X86+GPU加一堆存储和数据搬运,但现在数据中心越来越多引入AI加速平台。AI的渗透率会越来越高,我们预计渗透率会从5%到25%-30%,市场非常庞大。”燧原科技CEO赵立东在接受第一财经专访时表示。

12月21日,燧原科技发布首款面向数据中心的AI推理产品 “云燧i10”。该公司是腾讯投资的国内AI芯片初创企业。2018年8月,燧原科技由腾讯领投获得Pre-A轮融资3.4亿元人民币。今年5月,燧原科技宣布完成B轮融资7亿元人民币,由半导体产业基金武岳峰资本领投,腾讯、上海双创等跟投。

按使用场景划分,AI芯片主要分为云端和终端芯片。目前主流的神经网络深度学习包括训练和推断两个部分。云端追求高性能,开发成本更大,终端更侧重低成本和低功耗。目前中国AI初创企业主要布局在终端和边缘侧。

赵立东认为,面向数据中心的高性能AI计算芯片及分布式集群作为人工智能产业的基础设施,从架构升级到应用场景的落地,都蕴含了巨大的市场空间和机遇。

除了训练侧,云端AI推理的需求也不断攀升。研究机构赛迪顾问报告显示,从2019年到2021年三年中国AI芯片市场规模仍将保持50%以上的增长速度,到2021年,市场规模将达到305.7亿元。其中,随着大规模地方性数据中心的建设陆续完成,云端训练芯片增长速度放缓;而随着各领域市场需求的释放,云端推断芯片、终端推断芯片市场增长速度将持续呈上升趋势。

数据显示,从2019年到2024年,云端训练芯片的年复合增长率为32%,而云端推理的增长率将达69%。到2022年,中国云端推理芯片市场规模将达到189亿元,首次超过云端训练市场规模。

赵立东表示,AI真正起步在过去五六年,国内更晚,BAT等大企业从2018、2019年才开始大量采购英伟达V100训练芯片,“训练跟推理的关系是训练出来的模型被部署到推理产品上使用。当模型、算法不成熟,你需要不断训练、迭代,成熟了才能被部署到推理上去真正应用。从2018年开始到2022年,很多场景的算法和模型经过这几年开始逐渐成熟,真正规模化应用。当推理芯片销售收入超过训练芯片,很多算法、模型已经开始被广泛应用了。对AI领域来讲,2022年是个重要的节点。”

在生态合作方面,燧原科技COO张亚林称:“云燧i10已完成与浪潮、新华三及Supermicro等服务器厂商推理服务器的适配。可适用于视频图像、语音、自然语言处理、知识图谱等多种应用场景,并针对内容理解、推荐、识别等高精度场景做了优化。”

据悉,云燧i10是单槽位标准卡,支持PCIe 4.0,FP32算力达17.6TFLOPS,BF16/FP16算力70.4TFLOPS,将于明年第一季度上市。同时,燧原科技发布了推理引擎“鉴算TopsInference”。

燧原科技的云端训练产品已实现商业落地。今年9月,燧原科技称,“云燧T10”和由其组成的多卡分布式训练集群已在云数据中心落地,正式进入商用阶段。腾讯是燧原科技的重要合作伙伴,赵立东告诉第一财经,双方将进一步加强合作的广度和深度。不过,他指出,“腾讯是我们起步期(破冰)的重要伙伴,起步是最难的,从0到1。腾讯给我们很大帮助,是我们第一个具有战略意义的重要客户,但绝对不是唯一的。”

据介绍,燧原科技有三大目标市场,一是云服务提供商,包括公有云、私有云、混合云等,这类企业有大量的流量和数据,需要训练算法加速AI相关应用;二是专注于金融、保险、医疗、交通等领域的行业服务商;三是AI超算中心和智慧城市等领域。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54739

    浏览量

    471704
  • AI
    AI
    +关注

    关注

    91

    文章

    42408

    浏览量

    303364
  • 燧原科技
    +关注

    关注

    0

    文章

    162

    浏览量

    10651
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    高性能串口通信:PCI - 1620与PCI - 1622

    高性能串口通信:PCI - 1620与PCI - 1622 在电子工程师的日常工作中,串口通信是实现设备通信的关键组件。今天就来为大家详细介绍两
    的头像 发表于 05-13 12:05 257次阅读

    平头哥发布智能网卡磐脉920

    近日,在2026数字中国建设峰会上,阿里平头哥发布旗下首智能网卡「磐脉920」,这是国内首个内置PCIe Switch的400G智能网卡,最大支持400Gbps吞吐带宽,可应用于万智算集群、通算集群和
    的头像 发表于 05-07 15:44 199次阅读

    如何在边缘AI应用场景中实现高性能、低功耗推理(上)

    RA生态工作室关注我们为什么选择边缘AI?AI市场已经发生了根本性变革。过去,AI处理主要在云端完成。EndPoint设备从传感器收集数据并将其发送到云端进行推理处理和决策,结果被发
    的头像 发表于 03-03 14:18 6737次阅读
    如何在边缘AI应用场景中实现<b class='flag-5'>高性能</b>、低功耗<b class='flag-5'>推理</b>(上)

    如何在边缘AI应用场景中实现高性能、低功耗推理(上)

      为什么选择边缘AI? AI市场已经发生了根本性变革。过去,AI处理主要在云端完成。End Point设备从传感器收集数据并将其发送到云端进行推理处理和决策,结果被发送回End Point设备
    的头像 发表于 02-27 07:48 1w次阅读
    如何在边缘AI应用场景中实现<b class='flag-5'>高性能</b>、低功耗<b class='flag-5'>推理</b>(上)

    新品 | AI Pyramid AI Pyramid-Pro,面向本地推理与智能交互的高性能AI PC

    AIPyramid是一金字塔形状的高性能AIPC,专为本地AI推理与边缘智能应用而生。内置AxeraAX8850SoC,集成八核Cortex-A55处理器与24TOPS@INT8NPU,轻松应对
    的头像 发表于 02-06 17:24 4046次阅读
    新品 | AI Pyramid AI Pyramid-Pro,<b class='flag-5'>面向</b>本地<b class='flag-5'>推理</b>与智能交互的<b class='flag-5'>高性能</b>AI PC

    原科技训推一体芯片L600适配阶跃星辰基座模型Step 3.5 Flash

    2026年2月2日,阶跃星辰发布并开源最新基座模型 Step 3.5 Flash,该模型面向实时 Agent 工作流场景打造,兼顾推理速度、智能水平和使用成本,为开发者提供一个“更快
    的头像 发表于 02-02 17:50 1716次阅读
    <b class='flag-5'>燧</b>原科技训推一体芯片L600适配阶跃星辰基座模型Step 3.5 Flash

    今日看点:消息称 AMD、高通考虑导入 SOCAMM 内存;曦望发布新一代推理GPU芯片启望S3

    曦望发布新一代推理GPU芯片启望S3 近日,浙江杭州GPU创企曦望(Sunrise)发布新一代推理GPU芯片启望S3,并推出面向大模型
    发表于 01-28 11:09 1461次阅读

    ESP32-E22 发布!乐鑫三频 Wi-Fi 6E 高性能协处理器!启明云端乐鑫代理

    乐鑫科技(688018.SH)正式发布ESP32-E22。这是乐鑫推出的Wi-Fi6ESoC,标志着公司进军高性能无线连接领域的战略新起点,新一代产品矩阵由此全面开启。作为一
    的头像 发表于 01-20 18:18 1337次阅读
    ESP32-E22 <b class='flag-5'>发布</b>!乐鑫<b class='flag-5'>首</b><b class='flag-5'>款</b>三频 Wi-Fi 6E <b class='flag-5'>高性能</b>协处理器!启明<b class='flag-5'>云端</b>乐鑫代理

    迈向云端算力巅峰:昆仑芯K200 AI加速全面解读

    昆仑芯K200作为云端AI加速,在K100架构基础上全面升级。其INT8算力达256 TOPS,配备16GB HBM内存与512GB/s带宽,专为千亿参数大模型训练与高并发推理优化。采用全高全长双
    的头像 发表于 12-14 11:17 2514次阅读
    迈向<b class='flag-5'>云端</b>算力巅峰:昆仑芯K200 AI加速<b class='flag-5'>卡</b>全面解读

    Valens与 Imavix 联手推出业界首基于MIPI A-PHY 的机器视觉平台,CIS 同步发布符合A-PHY标准的摄像头

    ”Imavix”)宣布,推出业内量产级基于MIPI A-PHY的机器视觉平台,用于在机器视觉领域实现高性能的 A-PHY 连接标准。该平台将助力摄像头厂商开发出比传统机器视觉摄像头体积更小、可靠性更高且成本
    的头像 发表于 12-03 14:06 713次阅读

    今日看点:高通发布云端AI芯片;艾为电子推出低功耗Hyper-Hall™芯片 高通发布云端AI芯片 近日,美国高通公

    芯片中,专攻AI负载加速与能效优化,现已升级适配高性能计算场景。   AI200芯片专为机架级AI推理设计,将于2026年投入商业使用,AI250则计划于2027年上市。   这两芯片不仅可作为独立组件使用,还可作为PCIe扩
    发表于 10-28 10:43 1277次阅读

    伟创力重磅发布全球面向千兆瓦级数据中心的AI基础设施平台

    伟创力重磅发布全球面向千兆瓦级数据中心的AI基础设施平台,平台集成了电源和冷却产品、计算能力和服务,专为AI和高性能计算而设计,帮助数据
    的头像 发表于 10-23 15:08 1059次阅读

    全国产通用GPU芯片发布 沐曦集成推出曦云C600

    沐曦集成电路(南京)有限公司近日正式发布全国产通用GPU——曦云C600,这标志着国产高性能GPU实现历史性突破。 据新华日报报道显示
    的头像 发表于 10-19 20:04 4.7w次阅读

    原科技联合曦智科技推出国内xPU-CPO光电共封芯片

    在今年的2025世界人工智能大会上,原科技联合曦智科技推出了国内xPU-CPO光电共封芯片,为本土的数据中心光互连技术树立了一个新标杆。 NEWS 由ChatGPT引领的大语言模型浪潮使
    的头像 发表于 08-07 09:26 2.7w次阅读
    <b class='flag-5'>燧</b>原科技联合曦智科技推出国内<b class='flag-5'>首</b><b class='flag-5'>款</b>xPU-CPO光电共封芯片

    原科技国产万集群通过中国信通院权威认证

    近日,中国信息通信研究院(以下简称“中国信通院”)成功召开万智算集群服务推进方阵年中总交流会。会议期间,中国信通院重磅发布首批《大规模智算集群服务成熟度》评估结果。原科技作为算力
    的头像 发表于 07-04 16:50 1433次阅读