0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU难以超越CUDA生态?国产GPU厂商:干就对了!

晶芯观察 来源:电子发烧友网 作者:黄晶晶 2022-01-27 12:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄晶晶)当业界更多的将英伟达定义成一家软件公司的时候,其建立在GPU+CUDA生态上的商业模式也成为其领先的关键。而如今,国产GPU这几年发展得非常快,具有一批面向图形和计算的先锋企业。在中国集成电路设计业2021年会(ICCAD2021)上,包括电子发烧友网在内的媒体采访了芯原股份创始人、董事长兼总裁戴伟民,芯动科技工程副总裁毛鸣明,芯动科技VP/技术总监高专,以及沐曦高级销售总监王磊等。我们国产GPU的市场定位在哪里,产业生态如何建设,他们进行了深入分析和探讨。

国产GPU找准产品定位

GPU赛道有三类产品,AI人工智能、FP双精度浮点运算和图形渲染。目前许多初创公司从AI开始发力,再往双精度浮点运算和图形渲染扩展。芯动科技VP/技术总监高专介绍,芯动选择的赛道与之相反,是以最复杂的图形渲染为出发点,通过打通渲染结合各种智能计算能力,贴近服务国内产业链,并提供差异化定制竞争能力。高专坦言,走渲染这条路开始会比较艰难,像通用计算堆核就可以,但渲染管线建模复杂得多,渲染的复杂程度决定了前半程充满挑战。

那么国产GPU市场在国际巨头的包围下如何切入市场呢?高专认为有两个方面,一是新赛道上弯道超车,比如基于云端的渲染需求呈现爆发式增长,比如元宇宙概念的兴起,芯动GPU架构适合这类应用,能够提供相应的产品,“云这个比较新的赛道也是有差异化的,其实需要和一些主流客户绑定,比较适合芯动科技GPU的架构和定制策略”。另外虚拟化技术由于和传统的市场有一定的竞争关系,“云上面的应用越广越多,虚拟化越来越普及的话,其实是蚕食了现有的市场,芯动科技可以抓住的架构和生态上有优势的点进行突破”。

二是在桌面笔记本终端市场,对于国产GPU厂商也会有一定的机会,要进入这样的市场还是需要找到一个立足点,用户对价格超级敏感,虽然可能很久不赚钱,但可以走入千家万户。高专对此很乐观:“我们支持国内客户生态进行量身定做的迭代,可以兼容国产操作系统还有Windows DX,并不是孤军奋战。芯动科技在高端工艺迭代和供应链产能方面特别擅长,我们为客户走量和铺货速度非常快,极致提升性价比,持之以恒的决心和执行力是很强的。只要给我们一个抓手,一到两年的时间,我们就能为这个市场提供各种高性价比产品。我们公司一直都是盈利的,持续投入能力很强,从设计到量产到系统支持,我们都有足够的资源和人才。”

芯原是GPU IP供应商,已经具有20年的研发经验,从最早涉足手机GPU,到后来汽车仪表盘的图形渲染,如今很多汽车仪表盘的GPU都使用了芯原的IP。芯原股份创始人、董事长兼总裁戴伟民表示,如今GPU行业呈现百放齐放的状态非常好,原来很难招聘GPU人才,现在资本进来、GPU创业增多,都给行业带来了积极作用。这里面可能并非每家公司都能生存发展下来,但其中沉淀了大量的GPU技术人才。

芯原股份创始人、董事长兼总裁戴伟民


戴伟民还认为,国产GPU厂商看到了云端GPU、服务器GPU的需求,也看到了图形GPU的市场,若是一味地去拼消费级PC的市场并不合时宜,关键还是要找到国产GPU发展的差异化。

成立于2020年9月的沐曦集成电路,致力于为异构计算提供高性能GPU芯片和解决方案,产品主要应用方向包含传统GPU及移动应用,以及人工智能、智慧城市、数据中心云计算自动驾驶、生命科学、数字孪生、元宇宙等高性能异构计算前沿领域。沐曦高级销售总监王磊表示,沐曦自研GPU的切入点是对科学计算、机器学习和AI训练等方面有迫切市场需求的计算领域。沐曦对基于应用的可重构GPU架构进行架构创新,同时也会抓住后摩尔时代所赋予的机遇。

沐曦高级销售总监王磊


在市场方面,王磊表示,沐曦瞄准最迫切的市场应用,最痛点的需求,在标杆行业形成口碑,逐步迭代并取得更多行业的认可和市场份额。

兼容CUDA与共建并举,Vulkan生态呼声高

王磊认为,硬件的性能门槛并不高,通过产品迭代可以接近巨头,然而客户更在意的是好不好用,这就是生态问题。当前很多公司的策略是先做兼容,再做自己的生态,这是比较科学的办法,若一开始就建自己的生态,其难度更大。

芯动科技工程副总裁毛鸣明表示,从生态方面来看,芯动从图形渲染方面入手,有业界包括Vulkan在内的多个主流标准的API框架,芯动把API的接口支持做好,用自己的软硬件架构创新和高端工艺迭代能力,做差异化性能调优等,就可以切入到GPU图形渲染的市场,避免一上来就跟非常强大的CUDA生态PK。而CUDA生态由英伟达打造,更倾向于用来做AI计算。

毛鸣明坚信:“最终GPU市场应用最广的必将是高端渲染结合通用计算的领域,我们做出来的产品一定能兼顾,并且真正满足渲染市场需求而不是资本需求。我们贴近客户需求的模式,与客户共赢,与行业共赢。我们欢迎有意向的客户与芯动携手,各种定制需求我们都会考虑,打造具有顶尖差异化优势的产品,赋能我们客户的生态。”

因此,芯动现阶段采取的策略是避免一入场就正面挑战CUDA生态。另外,现在业界比较支持和大力发展的Vulkan生态,应避免走OpenGL的老路,变成一个非常庞大且复杂的API,Vulkan生态建设值得关注和投入。

Vulkan是一个跨平台的2D和3D绘图应用程序接口(API),最早由Khronos Group在2015年提出。Vulkan针对实时3D程序设计,旨在提供更低的CPU开销与更直接的GPU控制。戴伟民也表示,Khronos联盟一直在推动除CUDA之外的生态,包括英伟达也在这个联盟,还有华为、芯原是联盟董事会成员。如今Khronos联盟比较看好Vulkan的生态发展。


小结:

无论是面向高性能计算还是图形渲染,国产GPU是在近几年才开始加速追赶国际巨头。不过,从采访交流中我们也能感受到厂商们对GPU赛道的兴奋,现在正是取得国产GPU突破的关键时期。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5272

    浏览量

    136075
  • 生态
    +关注

    关注

    0

    文章

    27

    浏览量

    9226
  • 国产芯片
    +关注

    关注

    2

    文章

    399

    浏览量

    31862
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国产来袭!2nm AI GPU

    的时间和成本内实现。   近日,据媒体报道,上海棣山科技有限公司(以下简称“棣山科技”)对外披露其2nm高端AI GPU芯片最新研发进展。据悉,该公司自主攻关的这款芯片已达到国际前沿设计水平,目前核心研发工作仍处于原型验证关键阶段。   国产 2n
    的头像 发表于 04-15 07:02 8412次阅读

    国产GPU再下一城,群起突围英伟达+AMD

    电子发烧友网报道(文/黄晶晶)去年底以来国产GPU厂商陆续开启上市辅导,最近摩尔线程、沐曦IPO获受理。另消息称,壁仞科技已完成新一轮约15亿元融资,并计划最快今年8月向港交所申请IPO,筹备赴港
    的头像 发表于 07-07 08:59 7533次阅读
    <b class='flag-5'>国产</b><b class='flag-5'>GPU</b>再下一城,群起突围英伟达+AMD

    如何在 VisionFive v2 上使用外部 GPU

    如果旧的 amd gpu 在 VisionFive V2 上运行,我想使用带有开源 amd 驱动程序的 amd gpu。我需要什么以及如何将 GPU 连接到 VisionFive v2?
    发表于 03-13 06:38

    借助NVIDIA CUDA Tile IR后端推进OpenAI Triton的GPU编程

    NVIDIA CUDA Tile 是基于 GPU 的编程模型,其设计目标是为 NVIDIA Tensor Cores 提供可移植性,从而释放 GPU 的极限性能。CUDA Tile 的
    的头像 发表于 02-10 10:31 530次阅读

    为什么国产MCU的工程生态很难统一?

    背景 国产 MCU 种类多、厂商众多,生态碎片化明显。 主要原因 厂商 SDK 不统一 :API、驱动结构差异大 开发工具闭源 :无法统一配置流程 工程模板缺失 :初始化步骤、外设配置
    发表于 01-28 09:25

    又一国产GPU企业上市

    GPU企业、国内首家实现“训练+推理”通用GPU双量产的企业,天数智芯的上市标志着国产高端芯片产业迈入资本驱动与技术突破并行的关键阶段。   从技术深耕到资本进阶   天数智芯成立于2015年,总部位于上海,核心团队汇聚了来自A
    的头像 发表于 01-08 18:09 7079次阅读

    NVIDIA RTX PRO 5000 Blackwell GPU的深度评测

    需求进行了优化设计。无论是 CUDA 核心计算性能、实时渲染能力,还是 AI 推理效率,亦或显存带宽与容量的显著提升,均使得新一代 RTX PRO 5000 Blackwell GPU 能够轻松应对更复杂、更严苛的工作负载。
    的头像 发表于 01-06 09:51 4100次阅读
    NVIDIA RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度评测

    又一家GPU厂商IPO!

    电子发烧友网综合报道,港交所文件显示,上海天数智芯半导体股份有限公司港股IPO通过聆讯。天数智芯是中国首家通用GPU企业,主要提供针对不同行业的通用GPU产品及AI算力解决方案,是首家实现推理通用
    的头像 发表于 12-20 07:35 1.1w次阅读
    又一家<b class='flag-5'>GPU</b><b class='flag-5'>厂商</b>IPO!

    在Python中借助NVIDIA CUDA Tile简化GPU编程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 编程模式。它是自 CUDA 发明以来 GPU 编程最核心的更新之一。借助 GP
    的头像 发表于 12-13 10:12 1430次阅读
    在Python中借助NVIDIA <b class='flag-5'>CUDA</b> Tile简化<b class='flag-5'>GPU</b>编程

    汽车中的GPU是如何使用的?

    (HMI)的发展尤为迅猛。随着电子电气架构(EEA)的集中化,车辆对高性能计算能力的需求显著提升,GPU(图形处理单元)的灵活性、可扩展性以及高效并行计算能力,使其成为支持这些创新应用的核心组件
    的头像 发表于 12-03 14:45 9706次阅读
    汽车中的<b class='flag-5'>GPU</b>是如何使用的?

    如何看懂GPU架构?一分钟带你了解GPU参数指标

    GPU架构参数如CUDA核心数、显存带宽、TensorTFLOPS、互联方式等,并非“冰冷的数字”,而是直接关系设备能否满足需求、如何发挥最大价值、是否避免资源浪费等问题的核心要素。本篇文章将全面
    的头像 发表于 10-09 09:28 1542次阅读
    如何看懂<b class='flag-5'>GPU</b>架构?一分钟带你了解<b class='flag-5'>GPU</b>参数指标

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了
    发表于 07-25 08:18

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP 核,凭借其异构计算架构、能效优化和生态协同,成为全球移动
    的头像 发表于 05-29 10:12 4937次阅读

    Imagination与澎峰科技携手推动GPU+AI解决方案,共拓计算生态

    的深度融合展开合作。双方将结合 Imagination 领先的 GPU IP 技术与澎峰科技在 AI 模型压缩与性能优化方面的软硬协同能力,共同开拓面向 AI 行业应用的计算解决方案,推动国产计算生态
    发表于 05-21 09:40 1296次阅读