0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国产首个4K级高性能GPU “风华1号”重磅发布,性能实现突破

芯动科技Innosilicon 2021-12-02 17:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2021年11月26日,首款国产高性能4K级显卡GPU芯片“风华1号”在上海正式发布。中国一站式IP和芯片定制服务领军企业芯动科技在会上正式发布了“风华1号”的性能参数, 并通过现场多项4K级重度渲染演示,揭开了这款集众多自主技术创新、备受瞩目的国产GPU芯片的神秘面纱。

IMG_256芯动云计算总裁敖海先生概括“风华1号”GPU性能突破

IMG_256芯动云计算总裁敖海先生发布“风华1号”GPU芯片

“风华1号”GPU性能大幅领先, 成倍提升了现有国产GPU水平。“风华1号”单芯片A卡渲染能力达到160GPixel/秒,FP32浮点性能达到5T FLOPS;3D图形渲染处理管线定制优化,支持Linux/龙芯/Windows/安卓操作系统图形框架,同时支持4路4K@60、16路1080P@60fps或32路720P@30fps,集渲染+低延迟编解码+AI计算于一体;AI性能为25TOPS(INT8);芯片支持32路SRIOV虚拟化,内置中国专利的物理不可克隆PUF技术,保护信息安全;显存技术采用全球领先的GDDR6/GDDR6X Combo自研技术,单比特最大传输速率达到19Gbps;显存带宽最高可达304GB/s,显存容量最大可扩展至16GB;主机接口支持PCIe4.0X16,且向下兼容PCIe3.0/2.0X8;视频输出接口方面,“风华1号”配置自研HDMI2.1/DP1.4/VGA等超高清接口,支持多路独立输出。风华1号”实测功耗表现非常优秀,桌面4K重度渲染典型芯片功耗在20W左右,多路重度云渲染典型功耗在50W左右。“风华1号”还首次成功实施了中国自主标准的Innolink Chiplet多晶粒技术, 通过Innolink chiplet扩展,“风华1号”GPU显卡服务器用B卡,在A卡基础上直接性能翻倍, 渲染能力达到320GPixel/秒,FP32浮点性能达到10T FLOPS;同时支持32路1080P@60fps和64路720P@30fps强渲染+低延迟编解码+AI计算,显存达到32GB。

IMG_256

芯动科技在发布会现场进行了“风华1号”A卡的渲染演示,众多与会嘉宾、客户和合作伙伴近距离观看了“风华1号”在国产CPU操作系统桌面上办公上网、CAD设计、图形工作站、EDA设计、GIS实景地图、重度游戏benchmark、OpenGL4.0 Heaven、Vulkan框架下运行Windows游戏、多路云游戏等多种高清渲染场景下的流畅表现,不时发出赞许和夸奖。有业内人士甚至抑制不住好奇心,亲自操作测试演示室的机器,确认得到满意的体验。会场火热气氛中,还出现了不速之客,居然乘机偷走一块展示的显卡,导致警方介入,为大会增添了一点特别的花絮。

微信图片_20211128204649.jpg与会者参观GPU展台

微信图片_20211128204715.jpg与会者参观“风华1号”演示间

多位与会嘉宾表示,“风华1号”的正式发布意义重大,技术含金量高,一改过去国产显卡不好用的体验,实现了国产5G数据中心服务器GPU和4K桌面GPU这两大应用场景从0到1的突破。“风华1号”显卡实现了多个第一, 如第一款渲染能力达到5T-10T FLOPS的国产GPU显卡,第一款图形API达到OpenGL4.0以上,并能实际演示4.0 benchmark的GPU,还是第一款支持多路渲染+编解码+AI服务,硬件虚拟化和chiplet可延展的国产GPU等。“风华1号”大幅提升了国产GPU的渲染能力,在5G数据中心渲染性能对标国外服务器级别显卡,效果惊艳全场。在发布会期间的交流洽谈过程中,不少客户当场表达了合作和购买意向。

“风华1号”大型芯片的诞生,绝非偶然,其实是芯动科技15年如一日,长期深耕核心技术厚积薄发的必然。芯动科技工程副总毛鸣明在演讲时提到,“15年来芯动科技低调务实,敢为人先,攻关克难,团队十年坐得板凳冷,付出的努力和心血是难以想象的。光是行业创纪录的200多次先进工艺流片,就可见一斑。芯动连续11年细分市场遥遥领先,在重大开发投入的情况下,还能持续盈利,为各国产半导体代工厂和300家全球知名客户提供顶尖IP和芯片定制,包括中兴通讯、华为海思瑞芯微、君正、微软、AMD亚马逊等知名公司逾50亿颗先进SOC芯片背后,都有用到芯动技术。芯动以前是幕后英雄,在to B的圈子非常有名, 为众多客户一次流片成功并做到自主可控, 成就客户,也成就了自己,芯动在长期研发中积累了GPU所需要的全套高端IP、图形芯片内核定制技术和先进工艺经验, 所以‘风华1号’能够一炮打响、性能超群”。

据悉,“风华1号”上搭载的GDDR6X顶级难度的显存技术,目前全球只有英伟达和芯动科技两家拥有,“核心技术是买不来的,英伟达的高带宽显存技术一直自研,是其保持其竞争优势和70%利润率的一大利器,芯动科技在这方面能与其并驾齐驱,确保了GPU性能和工艺量产的灵活性和性价比”,这是芯动科技GDDR6X研发负责人高专的切身感悟。“GDDR6X的PAM4并行技术超级难做,英伟达与美光在一栋楼里共同研发两年才研发出来;而芯动团队是全球唯一一家,仅凭有限的远程技术支持,只用一年时间就做出来了, 连AMD都没有做到,所以美光的架构师都不禁感叹我们的研发实力之强,令他们印象深刻。事实上,如果没有我们团队十多年的技术基础积累和200次流片打磨的经验,这个成果是无法实现的,芯动科技绝对是国内硬科技企业的代表。”

“风华1号”的成功不是靠资本堆砌出来的, 它是芯动团队怀揣芯片报国的使命感,为客户定制而结出的硕果。正如芯动首席算法科学家杨喜乐博士在发布会上所说的,她自从博士毕业之后,在英国Imagination公司,作为顶级架构师,25年来一直从事GPU核心图形引擎的建模和创新,能够回国投身到国产GPU图形引擎的持续创新,她既感到驾轻就熟,又感到十分欣慰!杨喜乐博士是全球GPU芯片领域从几何物理渲染到计算引擎领域的知名专家,持有GPU 3D计算机图形学核心领域顶级图形专利共计125项,目前Imagination、苹果等公司最新的核心GPU产品的设计、优化和迭代都离不开她的专利和算法。她在芯动科技提出了性能优越的下一代创新GPU架构和方法,带领来自全球顶尖GPU企业的专家团队,推动国产GPU的发展,助力国产GPU自主可控。杨博士在发布会上生动讲述了GPU技术的前世今生,以及为什么芯动团队能够做好GPU。杨博士感叹, 这绝不像互联网的同质化竞争,“现代GPU的理论基础太深、开发应用坑太多了,技术发展日新月异,竞争极其激烈。要拿出一款对标行业先进水平的图形GPU,且流畅兼容各种应用,绝不是一朝一夕的事,对团队紧密协作能力要求很高,必须踏踏实实地长期市场化打磨,靠PPT烧钱只会是死路一条。没有一个跨多领域和有大量流片交付经验的复合型技术团队,不懂GPU底层算法架构和软硬件创新,不能根据实际情况和自身实力长期潜心持续演进架构和开发,不可能在这个领域成功。风华1号的诞生,倾注了数百名芯动GPU工程师的心血,其中凝聚了芯动自有的众多技术积累和来自世界著名GPU公司的顶尖人才的联合参与,风华1号仅仅是个开始,风华2号和3号已经在路上了”。

微信图片_20211128204704.jpg世界知名GPU图形学专家杨喜乐博士分享GPU的前世今生

芯动DX团队负责人、前AMD的图形框架开发的领军人物章涛表示,“投身芯动开发GPU软件感觉非常棒!芯动团队从老板到员工,都是专心做事的文化,没有政治斗争,大家团结互助一起努力,这样的团队没有理由不成功!欢迎更多的有识之士加入我们,一起成就国产GPU大业。明年我们就会发布我们风华显卡Windows操作系统的DX框架。”

fc3a10513066589b2f7cd27ea22155e来自AMD的领军人物章涛先生畅谈加入芯动科技的工作感受

在谈到风华1号的架构时,芯动科技SoC体系架构师何颖先生十分形象地展示了全球知名GPU架构演进和风华1号的架构开发过程,“现代GPU架构已经被成千上万专利所保护,没有哪个初创公司的GPU架构是自己完全从无到有开发出来的,大家无一例外都是在一定授权基础上的开发,那些宣称架构完全自研的初创公司,都是经不起深究的。我们获得授权的架构和苹果M1的GPU一样,并针对未来国产GPU生态建设和国内使用环境进一步深度定制,加上我们自研的核心技术和大量创新,确保了国产GPU持续演进和自主可控。”

在发布环节,芯动云计算总裁敖海先生正式发布了“风华1号”的各项参数和性能,现场进行了大屏幕4K级演示。“风华1号”显卡无论是在国产办公、桌面重度渲染、GIS地图、国产EDA/CAD软件,还是重度游戏benchmark渲染上,都展示了游刃有余的流畅。强劲的实力,引得现场观众阵阵惊叹。无怪乎到场的国产EDA公司--芯和半导体CTO代文亮博士激动地上台表示,“风华1号”的诞生恰逢其时,他对“风华1号”能够支持芯和和华大九天的国产EDA工具感到非常振奋,对芯动科技“锲而不舍,众志成城”的企业文化和芯动人强悍的执行力赞不绝口。

微信图片_20211128204614.jpg芯动云计算总裁敖海先生概括“风华1号”GPU多个第一

IMG_258芯动云计算总裁敖海先生现场演示“风华1号”GPU OpenGL4.0重度应用Heaven

敖海在发布会结尾总结道,“我们的使命是让风华GPU走进千家万户,让大家习惯用国产的GPU办公和娱乐。‘风华1号’是芯动人努力和成果的结晶,这只是风华系列GPU赋能国产生态的开始。芯动正在加紧与合作伙伴进行‘风华1号’适配调优,在向数据中心和国产桌面GPU等合作伙伴送样的同时,新一代GPU芯片已经在路上了。先进工艺的强悍迭代能力是芯动的固有优势,我们靠自有IP和定制能力以及代工厂合作伙伴的支持,不断演进先进技术,确保性能持续领先、供应链安全和优势性价比。芯动计划在未来三年里持续每年量产两颗以上、性能不断大幅度提升的GPU芯片,并满足用户的定制需求。明年初‘风华2号’和‘风华3号’将接踵而至, 2022年我们计划投片5纳米加光追技术,赋能国产GPU产业链我们志在必得,请大家拭目以待”。

“风华1号”的诞生正当其时,填补了国产4K级桌面显卡和服务器显卡两大空白,支持国产新基建5G数据中心、桌面、元宇宙、云游戏、云桌面等千亿级产业。“风华1号”是芯动赋能国产GPU生态链的开始,相信不久的将来,国产高性能GPU就会走进千家万户,全球客户都可以使用风华GPU,在办公、娱乐中体验科技带来的流畅和快乐!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134455
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6394
  • 芯动科技
    +关注

    关注

    2

    文章

    102

    浏览量

    10594
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何用FPGA实现4K视频的输入输出与处理

    在游戏、影视和显示领域,4K 已经成为标配。而今天,我们就来聊聊——如何用 FPGA 实现 4K 视频的输入输出与处理。
    的头像 发表于 10-15 10:47 1663次阅读
    如何用FPGA<b class='flag-5'>实现</b><b class='flag-5'>4K</b>视频的输入输出与处理

    国产全功能GPU新标杆:芯动科技“风华3”重塑技术边界

    革命者”三大标签,在AI计算、图形渲染、行业应用等领域实现全面突破,标志着我国在高性能GPU领域迈入国际先进行列。     大模型算力天花板:112GB显存重构AI训练范式   “
    的头像 发表于 09-26 15:43 6900次阅读
    <b class='flag-5'>国产</b>全功能<b class='flag-5'>GPU</b>新标杆:芯动科技“<b class='flag-5'>风华</b>3<b class='flag-5'>号</b>”重塑技术边界

    国产领军的全功能 GPU “风华3” 重磅发布,多个第一赋能千行百业人工智能+

    2025年9月22日,国产GPU标志性产品,芯动科技“风华3”全功能GPU新品发布
    的头像 发表于 09-25 10:17 908次阅读
    <b class='flag-5'>国产</b>领军的全功能 <b class='flag-5'>GPU</b> “<b class='flag-5'>风华</b>3<b class='flag-5'>号</b>” <b class='flag-5'>重磅</b><b class='flag-5'>发布</b>,多个第一赋能千行百业人工智能+

    破局·领航 | 匠芯创M7000系列六款总线型工业高性能实时处理器DSP重磅发布

    匠芯创科技于慕尼黑展会国际电机驱动技术论坛重磅发布M7000系列工业高性能DSP实时处理器及全场景解决方案。全球产业专家、企业代表及媒体齐聚,共同见证
    的头像 发表于 08-07 15:38 1262次阅读
    破局·领航 | 匠芯创M7000系列六款总线型工业<b class='flag-5'>级</b><b class='flag-5'>高性能</b>实时处理器DSP<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>

    国产真自研高性能图形 GPU 重磅发布:跑分超 RTX4060,畅玩《黑神话・悟空》

    系列。   砺算科技创始人、CEO 宣以方表示,砺算 7G100 系列 GPU 从计算核心到指令集完全由自主设计,基于自研 “天图” 架构,并配备自研指令集、自研软件栈,完全掌握 GPU 架构的自主权,系国产真自研
    发表于 07-26 21:45 5578次阅读
    <b class='flag-5'>国产</b>真自研<b class='flag-5'>高性能</b>图形 <b class='flag-5'>GPU</b> <b class='flag-5'>重磅</b><b class='flag-5'>发布</b>:跑分超 RTX4060,畅玩《黑神话・悟空》

    首个HDR Vivid 4K超高清直播频道诞生

    2025年6月28日,深圳卫视4K超高清直播频道正式上线,这是全国首个全链路应用HDR Vivid(菁彩影像)技术标准的4K超高清直播频道,标志着深圳卫视率先迈入超高清视听新时代。
    的头像 发表于 07-04 10:19 1749次阅读

    中科曙光构建全国产化基因组学高性能计算平台

    近日,中科曙光承建的国内某研究所基因组学高性能计算平台正式交付。这是国内生物信息学领域首个从底层硬件到上层软件实现完全自主可控,并深度融合高性能计算与人工智能算力的平台,成功填补了该领
    的头像 发表于 06-26 17:36 830次阅读

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我一直从事的事芯片
    发表于 06-18 19:31

    飞腾D2000 ITX:国产自主可控的工业高性能主板解决方案

    。 核心性能突破 ·国产八核引擎:搭载飞腾D2000处理器(2.3GHz主频)+X100芯片组,4GB显存支持多屏4K输出 ·军工
    的头像 发表于 06-10 16:12 958次阅读
    飞腾D2000 ITX:<b class='flag-5'>国产</b>自主可控的工业<b class='flag-5'>级</b><b class='flag-5'>高性能</b>主板解决方案

    正点原子Linux最小系统板RK3506B资料发布!超低功耗,满载功耗低发热小,实现性能与能效双突破

    功耗,满载功耗低发热小,实现性能与能效双突破! 一、视频介绍 UI性能演示视频:https://www.bilibili.com/video/BV
    发表于 05-15 15:27

    索尼 FCB-ER9500:高性能 4K 摄像机模组的卓越表现

    索尼 FCB-ER9500:高性能 4K 摄像机模组的卓越表现
    的头像 发表于 03-04 16:14 1096次阅读

    风华电容的性价比:如何成为国产替代的首选?

    的性价比,正逐步成为国产替代的首选。 一、风华电容的性价比优势 性价比是消费者在选择产品时最为关注的因素之一。风华电容之所以能够在国产替代中脱颖而出,很大程度上得益于其卓越的性价比。
    的头像 发表于 02-14 15:37 989次阅读
    <b class='flag-5'>风华</b>电容的性价比:如何成为<b class='flag-5'>国产</b>替代的首选?

    米尔国产FPGA SoC芯选择,安路飞龙DR1M90核心板重磅发布

    工业FPGA FPSoC——发布MYC-YM90X SOM模组及评估套件。该产品采用安路飞龙DR1M90,95K LEs 可编程逻辑,片上集成 64位2*Cortex-A35 @1G
    发表于 01-10 14:32

    国产高性能CPU--米尔瑞芯微RK3576赋能AIoT、工业、智能显示终端

    的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性: 8核心 6 TOPS超强算力 双千兆以太网 8K@30fps/4K@120fps 解码
    发表于 01-03 17:05

    集特国产风华2显卡性能如何?

    国产计算机找集特智能。 这个显卡有点故事—集特GXC501,搭载风华2,百分百国产化BOM,每一颗物料都滚动着中国的热血! VGA+DP+HDMI显示接口,也可拆分为DP+HDMI
    的头像 发表于 12-13 15:17 1196次阅读
    集特<b class='flag-5'>国产</b><b class='flag-5'>风华</b>2<b class='flag-5'>号</b>显卡<b class='flag-5'>性能</b>如何?