0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

天数智芯正式发布通用GPU推理产品“智铠100”,峰值算力高达384TOPS@int8

Felix分析 来源:电子发烧友网 作者:吴子鹏 2022-12-22 01:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)12月20日,天数智芯在全新通用GPU产品线上发布会上正式发布该公司第二款产品——智铠100,面向人工智能推理应用。

“2021年3月,天数智芯发布了公司第一款产品天垓100,是国内第一款通用GPU训练产品,实现了我国高端通用GPU从0到1的突破。目前,天垓100已经覆盖20多个行业,适配300多个应用模型。”天数智芯总裁盖鲁江表示,“智铠100作为公司第二款产品,瞄准推理应用市场,可广泛应用于金融、医疗、教育、安防、互联网、智能语音、车路协同、智能中心等领域,标志着天数智芯成为国内唯一拥有云边协同、训推组合的完整通用算力系统全方案提供商。”

天数智芯于今年5月成功点亮智铠100,在2022世界人工智能大会上,智铠100首次公开亮相,被誉为“镇馆之宝”,吸引了众多行业用户的关注。

pYYBAGOjEqGALF05ABfIn-P0hys113.png 

那么,智铠100的真实性能如何呢?在本次发布会上,天数智芯产品线总裁邹翾对智铠100进行了全面的介绍。根据他的介绍,智铠100具有计算性能高、应用覆盖广和使用成本低三大特点。

pYYBAGOjErWAJtZ8ABPL2h9XnFY490.png 

在计算性能高方面,智铠100支持FP32、FP16、INT8等多精度混合计算,峰值算力表现为384TOPS@int8、96TFlops@FP16、24TFlops@FP32。
pYYBAGOjEsuACLzgABZVhf3pqx8411.png 

此外,智铠100加速卡提供32GB的HBM存储配置,800GB/s的理论峰值带宽,16路PCIe 4.0通道,以及128路并发的多种视频规格解码能力。

pYYBAGOjEt6AWPg-ABbefK0ulI8001.png 

邹翾指出,和目前行业内的主流方案相比,智铠100在CV/自然语言处理,以及推荐/滤波/统计分析等方面,基本都能提供2-3倍实际使用性能。

poYBAGOjE2CAUhY4ABNc2NLfUfs116.png 

在应用覆盖广方面,上面已经提到,智铠100能够满足多个行业的推理应用需求。同时,为了让这些行业的用户更好地使用智铠100,天数智芯在智铠100上做了专门的优化。智铠100能够提供多达800余条通用指令集,500多个算子函数,支持国内外主流深度学习开发框架,拥有丰富编程接口拓展和高性能函数库,可以灵活支持各种算法模型,便于客户自定义开发。

pYYBAGOjE3OAXl3PABWsmgnHHTI287.png 

在使用成本低方面,智铠100具备开发易迁移的特点,全面支持推理及训练一体化方案,能够在不额外增加购置成本的情况下完成增量训练工作,有效减少用户的成本支出。发布会上,有嘉宾在分享时讲到,智铠100带来了非常好的使用体验,在实际的算法迁移过程中,并不需要对上层算法做太多修改就能够完成迁移。并且,智铠100不仅迁移速度快,而且性能表现稳定,可以满足相关应用的需求。

目前,天数智芯在国内通用GPU市场已经打开局面。2022年4月,天垓100累计订单金额已经接近2亿元,目前这一数字已经超过了5亿元。智铠100的出现进一步丰富了天数智芯的产品阵容,并吸引了产学研多方面的关注。发布会上,极视角生态合作负责人叶炤阳介绍,该公司已经在算法开发训练、算法推理部署平台上部署天垓100和智铠100产品。让我们期待2023年天数智芯在智铠100上拿出亮眼的成绩单。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134447
  • 天数智芯
    +关注

    关注

    0

    文章

    100

    浏览量

    6500
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MWC Doha 2025|美格智能全新发布60 Tops AI、支持Linux系统的SNM982高AI模组

    11月25日,在MWCDoha展会期间,美格智能全新发布基于高通QCS8650平台研发设计的SNM982高AI模组。搭载Linux5.15系统,AI
    的头像 发表于 11-25 16:34 570次阅读
    MWC Doha 2025|美格智能全新<b class='flag-5'>发布</b>60 <b class='flag-5'>Tops</b> AI<b class='flag-5'>算</b><b class='flag-5'>力</b>、支持Linux系统的SNM982高<b class='flag-5'>算</b><b class='flag-5'>力</b>AI模组

    AI模组TS-SG-SM9系列产品规格书

    腾视科技AI模组TS-SG-SM9系列搭载能高集成度处理器CV186AH/BM1688片,功耗低、强、接口丰富、兼容性好。7.2-
    发表于 10-27 17:12 0次下载

    小白必读:到底什么是FP32、FP16、INT8

    网上关于的文章,如果提到某个芯片或某个智中心的,都会写:在FP32精度下,英伟达H100
    的头像 发表于 10-20 14:34 622次阅读
    小白必读:到底什么是FP32、FP16、<b class='flag-5'>INT8</b>?

    天玑9500 性能大爆发!NPU AI或达100TOPS

    机芯片中首发落地。而几家终端厂商今天迭代的新机也基于强做了一些AI新奇特的玩法。   据称,天玑9500搭载第九代AI处理器NPU,可提供100TOPS的AI
    的头像 发表于 08-21 11:12 3455次阅读
    天玑9500 性能大爆发!NPU AI<b class='flag-5'>算</b><b class='flag-5'>力</b>或达<b class='flag-5'>100TOPS</b>

    科技上线赤兔推理引擎服务,创新解锁FP8大模型

    的模型轻量化部署方案。用户通过远程平台预置的模型镜像与AI工具,仅需50%的GPU即可解锁大模型
    的头像 发表于 07-30 21:44 722次阅读

    为什么无法在GPU上使用INT8INT4量化模型获得输出?

    安装OpenVINO™ 2024.0 版本。 使用 optimum-intel 程序包将 whisper-large-v3 模型转换为 int 4 和 int8,并在 GPU 上使用 OpenVINO™ 运行
    发表于 06-23 07:11

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    。。) 原理学习 在「芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中,作者详解了从帕斯卡架构到40系的Hopper架构的技术演变进化,按照出版时间算是囊括了NVIDIA最新产品
    发表于 06-18 19:31

    控一体新物种发布!百TOPS,地瓜为具身机器人量产“夯地基”

        电子发烧友网(文/莫婷婷)近期,地瓜机器人正式发布了RDK S100控一体化机器人开发套件,采用大小脑超级异构,提供80TOPS和128T
    的头像 发表于 06-18 09:09 1.7w次阅读
    <b class='flag-5'>算</b>控一体新物种<b class='flag-5'>发布</b>!百<b class='flag-5'>TOPS</b><b class='flag-5'>算</b><b class='flag-5'>力</b>,地瓜为具身机器人量产“夯地基”

    原超低能耗NPU可为移动端大语言模型推理提供超40 TOPS

    原股份今日宣布其超低能耗且高性能的神经网络处理器(NPU)IP现已支持在移动端进行大语言模型(LLM)推理,AI可扩展至40 TOPS
    的头像 发表于 06-11 10:47 634次阅读

    新品 | 26+6TOPS强悍!飞凌嵌入式FCU3501嵌入式控制单元发布

    飞凌嵌入式FCU3501嵌入式控制单元基于瑞微RK3588处理器开发设计,4xCortex-A76+4xCortex-A55架构,A76主频高达2.4GHz,A55核主频高达1.8GHz,支持
    的头像 发表于 05-15 11:57 2264次阅读
    新品 | 26+6<b class='flag-5'>TOPS</b>强悍<b class='flag-5'>算</b><b class='flag-5'>力</b>!飞凌嵌入式FCU3501嵌入式控制单元<b class='flag-5'>发布</b>

    iTOP-3588S开发板四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    能力6TOPS的NPU,赋能各类AI场景。 强大的视频编解码8K编码+8K解码,持 8Kp6
    发表于 05-15 10:36

    6TOPSNPU加持!RK3588如何重塑8K显示的边缘计算新边界

    ,RK3588都能快速解析复杂的8K视频流。以交通监控为例,传统设备在处理8K分辨率的交通视频时,往往难以实时识别车牌和行人动作,而RK3588凭借6TOPS的强大
    发表于 04-18 15:32

    迅为iTOP-RK3588S开发板/核心板瑞微RK3588S处理器6TOPS内置NPU

    能力6TOPS的NPU,赋能各类AI场景。 强大的视频编解码8K编码+8K解码,持 8Kp6
    发表于 04-10 11:13

    首款高AI SoC芯片P1:性能与应用全解析

    推出首款高AI SOC芯片P1,采用6nm工艺,集成45TOPS AI,支持
    的头像 发表于 03-14 16:32 1361次阅读
    此<b class='flag-5'>芯</b>首款高<b class='flag-5'>算</b><b class='flag-5'>力</b>AI SoC芯片P1:性能与应用全解析

    迅为iTOP-RK3588S开发板/核心板6TOPS的NPU视频编解码8K编码+8K解码

    能力6TOPS的NPU,赋能各类AI场景。 强大的视频编解码8K编码+8K解码,持 8Kp6
    发表于 02-20 14:24