0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国内公司自主研发GPU+:兼容CUDA、性能及能效超竞品

硬件世界 来源:硬件世界 2023-07-17 16:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,自称为国内自主创新的通用GPU领军企业的登临科技获得中国互联网投资基金(简称“中网投”)独家投资。

公司称,这将为登临新一代Goldwasser(高凛)规模化量产及商业化落地提供重要保障。

高凛是一款AI加速卡,首款产品2021年量产投入市场,2022年销售过万片。

第二代产品2022年流片,2023年实现量产。根据现有客户测试结果,二代产品针对基于transformer类型的模型提供3-5倍的性能提升,大幅降低类ChatGPT及生成式AI应用的硬件成本。

在官网,登临介绍自己是国内首家完全凭借自主创新,实现规模化商业落地的通用GPU企业,登临科技核心IP完全自主研发,其自主创新的GPU+(基于GPGPU的软件定义的片内异构计算架构),在兼容 CUDA/OpenCL 在内的编程模型和软件生态的基础上,通过架构创新,解决了客户核心关注的通用性和高效率的双重难题。

其表示,经过大量客户产品化验证,针对AI计算,GPU+相比现有主流GPU在性能及能效上有显著提升。

ba101482-23ef-11ee-962d-dac502259ad0.jpg

在AI市场上,NVIDIA现在是没有对手的阶段,AI显卡份额估计在90%以上,AMD都很难竞争,现在Intel也加入这个市场了,而且找到了NVIDIA的一个痛点,那就是性价比。

NVIDIA目前受追捧的AI显卡主要是A100、H100,国内有特供的阉割版A800、H800,性能比原版弱20%左右,但即便如此依然供不应求,A800一周时间就从9万元涨到11万元以上,H100价格在25万元以上,H800也要20万出头,而且不同经销商的价格差异很大。

Intel自然也不会放过这个市场,日前在国内举行发布会,也推出了AI显卡Habana Gaudi2,这是去年底发布的AI推理加速芯片,从第一代的16nm工艺升级到7nm工艺,Tensor 处理器核心数量增至 24 个,同时集成了多媒体处理引擎,内存升级至 96GB HBM2E。

国内版的Gaudi2主要是阉割了部分网络接口,但也集成了21路100Gbps网络接口,总体来说性能依然很可观。

ba385da2-23ef-11ee-962d-dac502259ad0.jpg

Intel还公布了Gaudi2跟H100的AI性能对比,面对要求极为苛刻的、1750亿参数的GPT-3模型,384个Gaudi2加速器上的训练时间仅为311.9分钟,而且从256个加速器到384个加速器,性能扩展幅度达95%。

NVIDIA这边在512块 H100 GPU上的训练时间则为64分钟,论单卡性能的话是Gaudi2的3.6倍多,但是Intel不会跟H100拼极限性能,而是强调性价比。

Habana Labs 首席运营官 Eitan Medina 表示,性价比是影响H100和Gaudi2相对价值的重要考量因素,Gaudi2 服务器的成本要比H100低得多。

更重要的是,目前Gaudi2还没有支持AI常用的FP8运算格式,这种情况下Gaudi2 在性价比上也胜过了H100,今年3季度会升级支持FP8运算,Gaudi2的性能将有明显飞跃,性价比要比H100更高了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5102

    浏览量

    134486
  • AI
    AI
    +关注

    关注

    90

    文章

    38225

    浏览量

    297101
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10078

原文标题:国内公司自主研发GPU+:兼容CUDA、性能及能效超竞品

文章出处:【微信号:hdworld16,微信公众号:硬件世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    首款全国产训推一体AI芯片发布,兼容CUDA生态

    架构,在算力、比等核心指标上实现突破性进展。   HL100芯片FP16算力达256 TFLOPS,配备LPDDR5显存,单芯支持128GB超大容量,显存容量为国际同类产品的1.33倍,同时兼容
    的头像 发表于 11-30 07:20 8919次阅读
    首款全国产训推一体AI芯片发布,<b class='flag-5'>兼容</b><b class='flag-5'>CUDA</b>生态

    深圳南柯电子|灯具EMC整改:低碳时代,兼容性的平衡之道

    深圳南柯电子|灯具EMC整改:低碳时代,兼容性的平衡之道
    的头像 发表于 11-20 10:00 180次阅读

    MPN12AD06-TSEVB非隔离型DC-DC电源模块评估板现货库存

    研发周期 30%以上。l 降低设计风险 通过预置的保护功能及宽温测试,提前发现潜在问题,减少后期修改成本。l 供应链自主可控 Cyntec 作为台达旗下品牌,依托国内供应链体系,提供全
    发表于 11-12 09:41

    合科泰MOSFET如何推动充电宝升级

    2025年8月实施了充电宝新国标,其核心指标包括额定输出容量大于90%,这个变化提高了电源转换效率要求,把原本的隐性需求转变成了硬性要求。合科泰半导体基于自主研发的SGT工艺平台,推出了HKTQ65N03、HKTG50N03等明星产品,通过技术突破实现
    的头像 发表于 09-15 15:27 916次阅读
    合科泰MOSFET如何推动充电宝<b class='flag-5'>能</b><b class='flag-5'>效</b>升级

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    租户环境提供推理服务,需实现性能隔离与稳定扩展。面对这一技术浪潮,深圳市睿海光电科技有限公司(简称“睿海光电”)凭借其创新的800G光模块解决方案,以交付速度比同行快2-3天的硬核实力、广泛兼容性及全球
    发表于 08-13 19:01

    淘宝API实时监控,市场策略快人一步!

    淘宝API构建高效的监控系统,让您的决策“快人一步”。 1. 为什么需要实时监控? 电商市场瞬息万变,
    的头像 发表于 08-06 14:38 550次阅读

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了
    发表于 07-25 08:18

    CSS6404L 在物联网设备中的应用优势:低功耗高可靠的存储革新与对比

    CSS6404L 通过 “高集成度 + 低功耗 + 宽适应” 的组合特性,在容量、功耗、性能及场景兼容性上全面超越同类,尤其在需要兼顾长续航、高速传输与紧凑设计的物联网场景中,成为
    的头像 发表于 06-06 15:35 504次阅读
    CSS6404L 在物联网设备中的应用优势:低功耗高可靠的存储革新与<b class='flag-5'>竞</b><b class='flag-5'>品</b>对比

    ISO 11452-8 标准下,AS5x47y 如何破解传感器的磁场 “弱点”?

    《ISO 11452-8 标准下,AS5x47y 如何破解传感器的磁场 “弱点”?》
    的头像 发表于 05-09 13:48 481次阅读
    ISO 11452-8 标准下,AS5x47y 如何破解<b class='flag-5'>竞</b><b class='flag-5'>品</b>传感器的磁场 “弱点”?

    破解药企管理困局:安科瑞为南通某药企提供微电网管理解决方案

    该项目位于南通市启东经济开发区,是一家以组合化学和现代药物化学技术为核心的新药研发企业,是国内某医药集团公司的子公司。该项目计划建设一个微电网
    的头像 发表于 03-24 09:49 481次阅读
    破解药企<b class='flag-5'>能</b><b class='flag-5'>效</b>管理困局:安科瑞为南通某药企提供微电网<b class='flag-5'>能</b><b class='flag-5'>效</b>管理解决方案

    TNC 连接器大对决,质量谁更胜一筹?

    综合来看,在与的质量对决中,TNC 连接器在电气性能、机械性能和环境适应性等方面展现出了明显的优势,能够为各类电子设备提供更为可靠、稳定的连接解决方案,是追求高质量连接器用户的理想
    的头像 发表于 03-06 08:43 722次阅读
    TNC 连接器<b class='flag-5'>竞</b><b class='flag-5'>品</b>大对决,质量谁更胜一筹?

    迅为3A6000开发板/龙芯3A6000与龙芯3A5000等龙架构处理器软件兼容

    龙芯 3A6000 处理器完全自主设计、性能优异,代表了我国自主桌面 CPU 设计领域的最新里程碑成果。龙芯 3A6000 处理器的推出,说明国产 CPU 在自主可控程度和产品
    发表于 02-12 15:06

    天玑8400 搭载G720 GPU性能双飙,打造惊艳越级游戏体验

    一贯的强项方面,天玑8400更是带来越级旗舰的体验,尤其是游戏场景,直接越级8系芯片,功耗更低、温控更出色,这颗冰封之芯太强了。除了碾压同级的全大核CPU,
    的头像 发表于 12-24 13:55 1368次阅读
    天玑8400 搭载G720 <b class='flag-5'>GPU</b><b class='flag-5'>性能</b><b class='flag-5'>能</b><b class='flag-5'>效</b>双飙,打造惊艳越级游戏体验

    安科瑞管理监测云平台

    管理监测云平台的主要内容包括以下几个方面: 制定科学的管理制度和标准; 建立完善的能源监测系统和数据分析平台; 推进节能技术和设备的研发
    的头像 发表于 12-18 14:52 720次阅读
    安科瑞<b class='flag-5'>能</b><b class='flag-5'>效</b>管理监测云平台

    IO模块助力PLC,全面提升中水处理设备

    随着我国环保事业的不断发展,中水处理技术在工业、生活等领域发挥着越来越重要的作用。如何提高中水处理设备的,成为行业关注的焦点。本文将为您介绍明达技术高效解决方案——利用自主研发的分
    的头像 发表于 12-16 14:57 676次阅读
    IO模块助力PLC,全面提升中水处理设备<b class='flag-5'>能</b><b class='flag-5'>效</b>