0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国产首个4K级高性能GPU “风华1号”重磅发布,性能实现突破

芯动科技Innosilicon 2021-12-02 17:04 次阅读

2021年11月26日,首款国产高性能4K级显卡GPU芯片“风华1号”在上海正式发布。中国一站式IP和芯片定制服务领军企业芯动科技在会上正式发布了“风华1号”的性能参数, 并通过现场多项4K级重度渲染演示,揭开了这款集众多自主技术创新、备受瞩目的国产GPU芯片的神秘面纱。

IMG_256芯动云计算总裁敖海先生概括“风华1号”GPU性能突破

IMG_256芯动云计算总裁敖海先生发布“风华1号”GPU芯片

“风华1号”GPU性能大幅领先, 成倍提升了现有国产GPU水平。“风华1号”单芯片A卡渲染能力达到160GPixel/秒,FP32浮点性能达到5T FLOPS;3D图形渲染处理管线定制优化,支持Linux/龙芯/Windows/安卓操作系统图形框架,同时支持4路4K@60、16路1080P@60fps或32路720P@30fps,集渲染+低延迟编解码+AI计算于一体;AI性能为25TOPS(INT8);芯片支持32路SRIOV虚拟化,内置中国专利的物理不可克隆PUF技术,保护信息安全;显存技术采用全球领先的GDDR6/GDDR6X Combo自研技术,单比特最大传输速率达到19Gbps;显存带宽最高可达304GB/s,显存容量最大可扩展至16GB;主机接口支持PCIe4.0X16,且向下兼容PCIe3.0/2.0X8;视频输出接口方面,“风华1号”配置自研HDMI2.1/DP1.4/VGA等超高清接口,支持多路独立输出。风华1号”实测功耗表现非常优秀,桌面4K重度渲染典型芯片功耗在20W左右,多路重度云渲染典型功耗在50W左右。“风华1号”还首次成功实施了中国自主标准的Innolink Chiplet多晶粒技术, 通过Innolink chiplet扩展,“风华1号”GPU显卡服务器用B卡,在A卡基础上直接性能翻倍, 渲染能力达到320GPixel/秒,FP32浮点性能达到10T FLOPS;同时支持32路1080P@60fps和64路720P@30fps强渲染+低延迟编解码+AI计算,显存达到32GB。

IMG_256

芯动科技在发布会现场进行了“风华1号”A卡的渲染演示,众多与会嘉宾、客户和合作伙伴近距离观看了“风华1号”在国产CPU操作系统桌面上办公上网、CAD设计、图形工作站、EDA设计、GIS实景地图、重度游戏benchmark、OpenGL4.0 Heaven、Vulkan框架下运行Windows游戏、多路云游戏等多种高清渲染场景下的流畅表现,不时发出赞许和夸奖。有业内人士甚至抑制不住好奇心,亲自操作测试演示室的机器,确认得到满意的体验。会场火热气氛中,还出现了不速之客,居然乘机偷走一块展示的显卡,导致警方介入,为大会增添了一点特别的花絮。

微信图片_20211128204649.jpg与会者参观GPU展台

微信图片_20211128204715.jpg与会者参观“风华1号”演示间

多位与会嘉宾表示,“风华1号”的正式发布意义重大,技术含金量高,一改过去国产显卡不好用的体验,实现了国产5G数据中心服务器GPU和4K桌面GPU这两大应用场景从0到1的突破。“风华1号”显卡实现了多个第一, 如第一款渲染能力达到5T-10T FLOPS的国产GPU显卡,第一款图形API达到OpenGL4.0以上,并能实际演示4.0 benchmark的GPU,还是第一款支持多路渲染+编解码+AI服务,硬件虚拟化和chiplet可延展的国产GPU等。“风华1号”大幅提升了国产GPU的渲染能力,在5G数据中心渲染性能对标国外服务器级别显卡,效果惊艳全场。在发布会期间的交流洽谈过程中,不少客户当场表达了合作和购买意向。

“风华1号”大型芯片的诞生,绝非偶然,其实是芯动科技15年如一日,长期深耕核心技术厚积薄发的必然。芯动科技工程副总毛鸣明在演讲时提到,“15年来芯动科技低调务实,敢为人先,攻关克难,团队十年坐得板凳冷,付出的努力和心血是难以想象的。光是行业创纪录的200多次先进工艺流片,就可见一斑。芯动连续11年细分市场遥遥领先,在重大开发投入的情况下,还能持续盈利,为各国产半导体代工厂和300家全球知名客户提供顶尖IP和芯片定制,包括中兴通讯、华为海思瑞芯微、君正、微软、AMD亚马逊等知名公司逾50亿颗先进SOC芯片背后,都有用到芯动技术。芯动以前是幕后英雄,在to B的圈子非常有名, 为众多客户一次流片成功并做到自主可控, 成就客户,也成就了自己,芯动在长期研发中积累了GPU所需要的全套高端IP、图形芯片内核定制技术和先进工艺经验, 所以‘风华1号’能够一炮打响、性能超群”。

据悉,“风华1号”上搭载的GDDR6X顶级难度的显存技术,目前全球只有英伟达和芯动科技两家拥有,“核心技术是买不来的,英伟达的高带宽显存技术一直自研,是其保持其竞争优势和70%利润率的一大利器,芯动科技在这方面能与其并驾齐驱,确保了GPU性能和工艺量产的灵活性和性价比”,这是芯动科技GDDR6X研发负责人高专的切身感悟。“GDDR6X的PAM4并行技术超级难做,英伟达与美光在一栋楼里共同研发两年才研发出来;而芯动团队是全球唯一一家,仅凭有限的远程技术支持,只用一年时间就做出来了, 连AMD都没有做到,所以美光的架构师都不禁感叹我们的研发实力之强,令他们印象深刻。事实上,如果没有我们团队十多年的技术基础积累和200次流片打磨的经验,这个成果是无法实现的,芯动科技绝对是国内硬科技企业的代表。”

“风华1号”的成功不是靠资本堆砌出来的, 它是芯动团队怀揣芯片报国的使命感,为客户定制而结出的硕果。正如芯动首席算法科学家杨喜乐博士在发布会上所说的,她自从博士毕业之后,在英国Imagination公司,作为顶级架构师,25年来一直从事GPU核心图形引擎的建模和创新,能够回国投身到国产GPU图形引擎的持续创新,她既感到驾轻就熟,又感到十分欣慰!杨喜乐博士是全球GPU芯片领域从几何物理渲染到计算引擎领域的知名专家,持有GPU 3D计算机图形学核心领域顶级图形专利共计125项,目前Imagination、苹果等公司最新的核心GPU产品的设计、优化和迭代都离不开她的专利和算法。她在芯动科技提出了性能优越的下一代创新GPU架构和方法,带领来自全球顶尖GPU企业的专家团队,推动国产GPU的发展,助力国产GPU自主可控。杨博士在发布会上生动讲述了GPU技术的前世今生,以及为什么芯动团队能够做好GPU。杨博士感叹, 这绝不像互联网的同质化竞争,“现代GPU的理论基础太深、开发应用坑太多了,技术发展日新月异,竞争极其激烈。要拿出一款对标行业先进水平的图形GPU,且流畅兼容各种应用,绝不是一朝一夕的事,对团队紧密协作能力要求很高,必须踏踏实实地长期市场化打磨,靠PPT烧钱只会是死路一条。没有一个跨多领域和有大量流片交付经验的复合型技术团队,不懂GPU底层算法架构和软硬件创新,不能根据实际情况和自身实力长期潜心持续演进架构和开发,不可能在这个领域成功。风华1号的诞生,倾注了数百名芯动GPU工程师的心血,其中凝聚了芯动自有的众多技术积累和来自世界著名GPU公司的顶尖人才的联合参与,风华1号仅仅是个开始,风华2号和3号已经在路上了”。

微信图片_20211128204704.jpg世界知名GPU图形学专家杨喜乐博士分享GPU的前世今生

芯动DX团队负责人、前AMD的图形框架开发的领军人物章涛表示,“投身芯动开发GPU软件感觉非常棒!芯动团队从老板到员工,都是专心做事的文化,没有政治斗争,大家团结互助一起努力,这样的团队没有理由不成功!欢迎更多的有识之士加入我们,一起成就国产GPU大业。明年我们就会发布我们风华显卡Windows操作系统的DX框架。”

fc3a10513066589b2f7cd27ea22155e来自AMD的领军人物章涛先生畅谈加入芯动科技的工作感受

在谈到风华1号的架构时,芯动科技SoC体系架构师何颖先生十分形象地展示了全球知名GPU架构演进和风华1号的架构开发过程,“现代GPU架构已经被成千上万专利所保护,没有哪个初创公司的GPU架构是自己完全从无到有开发出来的,大家无一例外都是在一定授权基础上的开发,那些宣称架构完全自研的初创公司,都是经不起深究的。我们获得授权的架构和苹果M1的GPU一样,并针对未来国产GPU生态建设和国内使用环境进一步深度定制,加上我们自研的核心技术和大量创新,确保了国产GPU持续演进和自主可控。”

在发布环节,芯动云计算总裁敖海先生正式发布了“风华1号”的各项参数和性能,现场进行了大屏幕4K级演示。“风华1号”显卡无论是在国产办公、桌面重度渲染、GIS地图、国产EDA/CAD软件,还是重度游戏benchmark渲染上,都展示了游刃有余的流畅。强劲的实力,引得现场观众阵阵惊叹。无怪乎到场的国产EDA公司--芯和半导体CTO代文亮博士激动地上台表示,“风华1号”的诞生恰逢其时,他对“风华1号”能够支持芯和和华大九天的国产EDA工具感到非常振奋,对芯动科技“锲而不舍,众志成城”的企业文化和芯动人强悍的执行力赞不绝口。

微信图片_20211128204614.jpg芯动云计算总裁敖海先生概括“风华1号”GPU多个第一

IMG_258芯动云计算总裁敖海先生现场演示“风华1号”GPU OpenGL4.0重度应用Heaven

敖海在发布会结尾总结道,“我们的使命是让风华GPU走进千家万户,让大家习惯用国产的GPU办公和娱乐。‘风华1号’是芯动人努力和成果的结晶,这只是风华系列GPU赋能国产生态的开始。芯动正在加紧与合作伙伴进行‘风华1号’适配调优,在向数据中心和国产桌面GPU等合作伙伴送样的同时,新一代GPU芯片已经在路上了。先进工艺的强悍迭代能力是芯动的固有优势,我们靠自有IP和定制能力以及代工厂合作伙伴的支持,不断演进先进技术,确保性能持续领先、供应链安全和优势性价比。芯动计划在未来三年里持续每年量产两颗以上、性能不断大幅度提升的GPU芯片,并满足用户的定制需求。明年初‘风华2号’和‘风华3号’将接踵而至, 2022年我们计划投片5纳米加光追技术,赋能国产GPU产业链我们志在必得,请大家拭目以待”。

“风华1号”的诞生正当其时,填补了国产4K级桌面显卡和服务器显卡两大空白,支持国产新基建5G数据中心、桌面、元宇宙、云游戏、云桌面等千亿级产业。“风华1号”是芯动赋能国产GPU生态链的开始,相信不久的将来,国产高性能GPU就会走进千家万户,全球客户都可以使用风华GPU,在办公、娱乐中体验科技带来的流畅和快乐!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4410

    浏览量

    126635
  • GPU芯片
    +关注

    关注

    1

    文章

    285

    浏览量

    5681
  • 芯动科技
    +关注

    关注

    2

    文章

    90

    浏览量

    9748
收藏 人收藏

    评论

    相关推荐

    高性能NVMe主机控制器,Xilinx FPGA PCIe 3

    独立的数据写入AXI4-Stream/FIFO接口和数据读取AXI4-Stream/FIFO接口,非常适合于超高容量和超高性能的应用。此外,NVMe Host Controller IP支持RAID存储
    发表于 04-20 14:41

    高性能NVMe主机控制器,Xilinx FPGA NVMe Host Accelerator IP

    )读写、DMA读写和数据擦除功能,提供用户一个简单高效的接口实现高性能存储解决方案。NVMe Host Controller IP DMA读写的顺序传输长度可以配置,最小是4K-Byte,最大
    发表于 04-10 22:55

    Xilinx FPGA高性能NVMe SSD主机控制器,NVMe Host Controller IP

    )读写、DMA读写和数据擦除功能,提供用户一个简单高效的接口实现高性能存储解决方案。NVMe Host Controller IP DMA读写的顺序传输长度可以配置,最小是4K-Byte,最大
    发表于 03-27 17:23

    Xilinx FPGA NVMe主机控制器IP,高性能版本介绍应用

    高效的接口实现高性能存储解决方案。NVMe Host Controller IP DMA读写的顺序传输长度可以配置,最小是4K-Byte,最大是512K-Byte。顺序传输长度配置为
    发表于 03-09 13:56

    开放式高实时高性能PLC控制器解决方案-基于米尔电子STM32MP135

    迈向完全数字化中高端控制提供一个非常好的选择。 STM32MP135处理器简介STM32MP135系列处理器具备1GHz高主频,实现高性能的同时,具备更低的功耗,为工业控制产品稳定可靠的执行提供坚实
    发表于 03-07 20:06

    紫光同创新品开发板,盘古PGX系列PGX-MINI 4K开发板,板卡集成下载器~

    /Logos2/Titan2/Compa全系列,即将重磅上市! 本期推荐:盘古PGX系列PGX-MINI 4K开发板,基于紫光同创Compa系列低功耗CPLD。 产品详情
    发表于 03-01 19:02

    紫光同创新品开发板,盘古PGX系列PGX-MINI 4K开发板,板卡集成下载器

    /Logos2/Titan2/Compa全系列,即将重磅上市! 本期上新:盘古PGX系列PGX-MINI 4K开发板,基于紫光同创Compa系列低功耗CPLD。 产品详情 产品实拍
    发表于 03-01 15:16

    重磅新品】盘古100K开发板,紫光同创PG2L100H,Logos2系列,性能全面提升

    丰富,可以充分满足高速数据的缓存处理需求 海量的外围接口,充分满足多方位开发需求 三:核心板产品概述 盘古100K核心板是基于紫光同创Logos2系列(PG2L100H-FBB484)开发的全新国产高性能
    发表于 12-29 16:31

    紫光同创FPGA开发套件,高性能国产FPGA方案

    紫光同创FPGA开发套件,高性能国产FPGA方案,100%国产化,全系列产品,方案可定制,满足多方面需求
    发表于 11-16 17:25

    【昉·星光 2 高性能RISC-V单板计算机体验】星光 2 功耗测评

    星光 2是迄今最高性能单板机。 搭载高性能昉·惊鸿7110搭载64位高性能四核RISC-V CPU,2MB的二缓存,工作频率最高可达1.5 GHz。昉·惊鸿7110具有多个的高速本地
    发表于 09-28 10:34

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    HHB 实现了在典型网络性能比第三方工具平均提升 88%,并增加支持运行 Transformer、TensorFlow、PyTorch 等 170 余个主流框架 AI 模型。 基于此,平头哥发布
    发表于 08-26 14:14

    赛昉科技发布首个国产高性能RISC-V多核子系统IP平台

    基于Dubhe-90、Dubhe-80以及赛昉科技自主研发的片上一致性互联IP——昉·星链-500(StarLink-500),赛昉科技重磅发布首个国产
    发表于 08-17 10:18 265次阅读
    赛昉科技<b class='flag-5'>发布</b><b class='flag-5'>首个</b><b class='flag-5'>国产</b><b class='flag-5'>高性能</b>RISC-V多核子系统IP平台

    支持双NVIDIA GPU 研华新品高性能边缘AI系统AIR-500D重磅推出!

    近期,全球物联网方案提供厂商研华隆重发布了一款支持双NVIDIA RTX GPU的全新高性能Al系统—AIR-500D。该解决方案预装Intel Xeon D-1700处理器和双高性能
    的头像 发表于 08-03 15:22 408次阅读
    支持双NVIDIA <b class='flag-5'>GPU</b> 研华新品<b class='flag-5'>高性能</b>边缘AI系统AIR-500D<b class='flag-5'>重磅</b>推出!

    芯动科技风华2号四屏桌面显卡与统信UOS完成认证

    与统信UOS操作系统在 功能性、兼容性、稳定性、流畅性 等方面均完全满足认证要求, 产品已顺利进入量产落地阶段 ,不断为客户提供安全稳定可靠保障。 风华2号是一款4K高性能渲染的四屏桌面和工控
    的头像 发表于 07-06 14:10 368次阅读
    芯动科技<b class='flag-5'>风华</b>2号四屏桌面显卡与统信UOS完成认证

    多选择大内存,总有一个适合的迅为RK3568瑞芯微开发板国产翼辉SylixOS实时操作系统

    、支持OpenGLES1.1/2.0/32OpenCL 2.0、Vulkan 1.1、内嵌高性能2D加速硬件。 内置 NPU:内置独立NPU算力达0.8T可用于轻量级人工智能应用 4K高性能VPU
    发表于 05-08 11:29