0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Nvidia RTX30系显卡翻车,罪魁祸首竟是区区电容?

21克888 来源:电子发烧友网 作者:周凯扬 2020-09-29 06:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


电子发烧友报道(文/周凯扬)随着RTX3080和RTX3090两大系列显卡的相继开卖,消费者发现了库存短缺,为数不多的显卡被黄牛和机器哄抢一空,Nvidia甚至不得不为糟糕的首发情况道歉。除此之外,抢先评测的媒体和首批购买的用户都开始陆续发现一些崩溃、黑屏等不稳定的问题。这些稳定性问题往往在频率超过2GHz时复现,但并非所有显卡厂商都遇上了这种情况。那么这背后究竟有何原因呢?德国硬件测频网站Igor'sLAB等媒体、工程师以及爱好者均对这次“翻车”进行了分析。

生产前期没有真正的功能测试?


为了防止显卡基准性能测试结果的泄露,Nvidia这一次完全封闭了评估驱动。甚至可能没有运行Furmark或Time Spy等经典测试工具,仅用到了NVPunish(一款压力测试工具)来进行热测试。而从AIC显卡合作厂商的角度来看,这就有些怪异了,因为他们生产出来的显卡难以确定具体性能。因此每个厂商的功能测试仅限于正常启动与热稳定性,从而判断是否能够运行,但芯片质量以及最大安全频率却无从得知。这也就造成了不少厂商的质量测试时间较短,未能及时发现相关问题。

错误的元器件选择?

参考板PG132上的电容 / Igor'sLAB


目前来看,比较令人信服的理由就是电容的选择。在Nvidia的参考板PG132设计中,可以看到6个必要的电容,它们用于滤除NVVDD/MSVDD电压轨中的高频。除了电压转换器的高频干扰外,GPU频率的提升也会带来更多的干扰。而这一参考设计开放了使用大面积POSCAP/SP-CAP(导电性聚合物电解电容)还是稍微昂贵一点的MLCC(片式多层陶瓷电容)的选择,后者更小但必须以电容组来实现更高的容值。

从Nvidia自己的表单和规范来看,两者都是可行的。然而从质量上来说,优质的MLCC在过滤高频上更胜一筹。因此在显卡厂商来看,这就成了成本控制的问题。不同的厂商因此也都对自己的显卡选用了不同的电容方案。从许多反馈上来看,索泰的Trinity系列在频率超过2010MHz时往往会出现不稳定的情况,因为索泰使用了6个成本较低的POSCAP电容。

6个SP-CAP电容 / Igor'sLAB


而Nvidia自己的创始人版显卡则选择了更加优秀的方案,它采用了4个POSCAP和2个MLCC电容组(每组10个MLCC)的方案,因此哪怕在超过2GHz的情况下出现问题,也多半是驱动的原因。Igor'sLAB认为这是最优的方案,因为中间区域更加要配以合适的滤波(避免高频混合引起的短路)。

4个SP-CAP电容与两个MLCC电容组 / Igor'sLAB


而华硕的Asus TUF RTX 3080 Gaming显卡上则采用了更进一步的方案,全部采用MLCC电容组。这也证明了为何华硕旗舰显卡ROG STRIX RTX3080 OC的频率能高达1935MHz,比Nvidia的创始人版本高出13.2%。

6个MLCC电容组 / Igor'sLAB


那么电容的选择与显卡的超频有何关联呢?若将电容比作水桶的话,POSCAP就是大桶,MLCC就是小桶,大桶接水和放水速度都要慢,而小桶速度快但要达到相同的容量则有数量要求。随着GPU时钟频率的提高,所需电压也会提高,GPU Boost技术也会更快进行抵消和调节。所以越接近存储极限,修正和负载变化搞得频率也会提高。随着这一间隔变短,对电容的缓冲速度就有更高的要求,这也就是为什么MLCC在高频下更好的原因。对于NVVDD供电来说,一组MLCC就足以解决问题,而MSVDD的变化较少且独立于NVVDD,并不一定需要用到MLCC。

各个厂商显卡电容方案与回应

各个厂商RTX3080显卡的电容方案 / 电子发烧友网搜集整理


上图即部分已知的RTX3080显卡电容方案,其中部分暂未正式发售的显卡数据来源于媒体评测样卡,具体数据以正式零售版为准。从上图可知,大部分厂商都使用了1个MLCC电容组和5个POSCAP/SP-CAP的方案,RTX3090的情况与RTX3080大抵相同,但多数厂商采用了2个MLCC电容组和4个SP-CAP电容的方案。但随着“电容翻车”事件的发酵,相关的厂商也纷纷做出了自己的回应。

早在给媒体送去样卡以及显卡正式发售前,七彩虹已经发布邮件提醒,他们已经发现了崩溃问题,尤其是当按下超频键时,相关显卡随后已被召回。七彩虹官方也已透露未来将会采用更优的2个MLCC组+4个POSCAP电容方案。


华硕电脑中国区经理俞元麟在微博上强调,华硕的媒体送测样卡以及零售版本都采用了全MLCC的设计,原因是在研发过程中发现MLCC超频性能更好。而华硕在尚未正式开售的RTX3070系列显卡上使用了4 SP-CAP的设计,但考虑到RTX3070和RTX3080/3090设计并不相同,而且该显卡10月份才开售,出现不稳定问题的可能性相当之小。

EVGA声明 / EVGA


EVGA的全球产品管理主管Jacob Freeman也发表了自己的回应,称在量产的QC测试环节中,EVGA发现6个POSCAP的方案并没有通过实际应用测试。研发团队花了一周的时间找到问题成因,然后将POSCAP的数量缩减至4个,并在出货前加入20个MLCC电容,这也是为何EVGA GeForce RTX 3080 FTW3系列推迟的原因,但并没有任何6 POSCAP电容方案的该系列显卡出货至消费者手中。但部分媒体评测版本收到了量产前的6 POSCAP电容版本,EVGA正在收回这些显卡并换以零售版本。而XC3系列采用了5 POSCAP和10MLCC的方案,可以实现正常参数配置,并没有发现任何问题。


影驰于9月27日在微博发表声明,称目前只有6片用于评测的RTX 3090 GAMER试产样品采用了6颗SP-CAP的电容方案,该系列暂未开售,而未来正式生产和售卖的GAMER产品将对电容用料进行优化改进。


耕升也在微博发表声明,耕升并没有产品采用6 SP-CAP电容的方案,因此并不会出现盛传的电容问题与新品故障。

索泰马来西亚回应 / 索泰


索泰的母公司柏能集团似乎已经意识到了该问题,并将对设计做出更改。索泰马来西亚也在Facebook上发布了帖子,指出相关调查已在进行,不久后将更新情况,同时建议任何购买了RTX3080和3080 Trinity系列的客户填写调查表单。

小结


由此看来,电容设计失误很有可能是本次“翻车”事件的主要原因,但还是有不少采用了MLCC电容的RTX3080/3090显卡遇上了黑屏等不稳定性问题,而采用全POSCAP方案的显卡也有正常运转无误的。MSI也在一次Insider直播中提到了该问题,表示该问题很有可能是因为驱动引起的。但Igor'sLAB随后也发文称具体稳定性还是取决于芯片质量,高质量的芯片保持稳定所需的电压也更少。因为缺乏合适驱动所以显卡合作厂商无法正常测试第一批显卡,所以造成了部分原本不适用于超频版的显卡出货。从各个厂商的回应来看,电容的选择确实造成了一定影响,但未来稳定性的进一步加强还是得靠Nvidia的新驱动推送。

声明:本文由电子发烧友原创,如需转载和入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 电容
    +关注

    关注

    100

    文章

    6525

    浏览量

    160096
  • NIVIDA
    +关注

    关注

    0

    文章

    9

    浏览量

    7296
  • RTX3080
    +关注

    关注

    0

    文章

    3

    浏览量

    1514
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    TCP/BDP问题的诊断方法和优化方案

    都没有问题,最后发现罪魁祸首竟然是网络延迟——具体来说,是TCP的BDP(Bandwidth-Delay Product,带宽延迟积)问题。
    的头像 发表于 04-02 09:39 173次阅读

    NVIDIA RTX加速的计算机现可直接连接到Apple Vision Pro

    NVIDIA 与 Apple 协作将 NVIDIA CloudXR 6.0 原生集成到 visionOS 中,安全地将基于 NVIDIA RTX 的仿真器和专业 3D 图形应用,如
    的头像 发表于 03-23 15:03 508次阅读

    技嘉RTX 50显卡超频表现亮眼 3DMark多项测试获高分

    Extreme基准测试中核心频率突破至3.33GHz,展现出强劲的超频能力。 技嘉RTX 5070魔鹰与RTX 5060 Ti魔鹰显卡均基于NVIDIA Blackwell架构打造,
    的头像 发表于 03-19 16:29 239次阅读
    技嘉<b class='flag-5'>RTX</b> 50<b class='flag-5'>系</b><b class='flag-5'>显卡</b>超频表现亮眼 3DMark多项测试获高分

    Linux性能分析实战:用trace揪出卡顿、高CPU的“真凶”

    做 Linux 开发或运维的你,是否常被这些问题困扰:服务突然卡顿却找不到根源,CPU 占用率飙升但查不到 “罪魁祸首”,系统响应变慢却摸不清瓶颈?其实,Linux 内核早已为我们准备了 “透视镜”——trace 跟踪技术,今天就手把手教你从生成 trace 文件到可视化分析,搞定性能难题!
    的头像 发表于 02-03 15:24 614次阅读
    Linux性能分析实战:用trace揪出卡顿、高CPU的“真凶”

    NVIDIA RTX PRO 5000 Blackwell GPU的深度评测

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升级迭代产品,其各项核心指标均针对 GPU 加速工作流的
    的头像 发表于 01-06 09:51 4058次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> PRO 5000 Blackwell GPU的深度评测

    NVIDIA RTX PRO 4000 Blackwell GPU性能测试

    作为 NVIDIA 专业显卡产品线中单槽性能的巅峰之作,NVIDIA RTX PRO 4000 Blackwell 在各项核心指标上均实现对前代 N
    的头像 发表于 12-29 15:30 1847次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> PRO 4000 Blackwell GPU性能测试

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    越来越多的应用正在使用 AI 加速,而无论工作站的大小或形态如何,都有越来越多的用户需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的头像 发表于 11-28 09:39 7018次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> PRO 2000 Blackwell GPU性能测试

    工业级UPS电源:工厂突然停机的“救命神器”

    ,技术人员排查后发现:不是设备故障,不是操作失误,罪魁祸首竟是电压瞬间的异常波动。这个看似微不足道的“电力喷嚏”,让整个工厂付出了停工两天、直接损失超五十万元的惨痛代
    的头像 发表于 10-30 09:13 364次阅读
    工业级UPS电源:工厂突然停机的“救命神器”

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA
    的头像 发表于 08-28 11:02 4374次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> PRO 4500 Blackwell GPU测试分析

    Nginx负载均衡策略选择指南

    上个月,我们的电商系统在大促期间突然出现用户购物车数据丢失的问题。经过排查发现,罪魁祸首竟然是负载均衡策略配置不当!
    的头像 发表于 08-20 16:23 1192次阅读

    电解电容放置多久会失效?

    你的电子设备突然失灵,罪魁祸首可能是一个不起眼的电解电容。这种蓝色或黑色的圆柱体元件,就像电子设备的"计时炸弹",它的寿命究竟由什么决定? 规格/系列齐全-详情请关注我们 电解电容的寿命计算遵循阿列
    的头像 发表于 08-02 18:22 4631次阅读

    NVIDIA RTX AI加速FLUX.1 Kontext现已开放下载

    NVIDIA RTXNVIDIA TensorRT 现已加速 Black Forest Labs 的最新图像生成和编辑模型;此外,Gemma 3n 现可借助 RTX
    的头像 发表于 07-16 09:16 2184次阅读

    BGA失效分析原因-PCB机械应力是罪魁祸首

    一、关于BGA简介 首先,我们需要明白什么是BGA。BGA是一种表面贴装封装技术,它的主要特点是在芯片底部形成一个球形矩阵。通过这个矩阵,芯片可以与电路板进行电气连接。这种封装方式由于其体积小、散热好等优点被广泛应用于高性能电子设备中。然而,BGA也有其固有的缺点。由于其结构复杂,一旦出现问题,修复起来就非常困难。其中,最常见的问题就是BGA开裂。那么,BGA为什么会开裂呢?一般来讲BGA开裂的原因有以下几点: 1、温度过高:当电
    的头像 发表于 06-14 11:27 1352次阅读
    BGA失效分析原因-PCB机械应力是<b class='flag-5'>罪魁祸首</b>

    如何在Ubuntu 22.04上安装NVIDIA显卡驱动

    Ubuntu 22.04 安装 NVIDIA 显卡驱动完整步骤
    的头像 发表于 05-20 11:00 5691次阅读

    如何在Ubuntu上安装NVIDIA显卡驱动?

    作者:算力魔方创始人/英特尔创新大使刘力 一,前言 对于使用NVIDIA显卡的Ubuntu用户来说,正确安装显卡驱动是获得最佳图形性能的关键。与Windows系统不同,Linux系统通常不会自动安装
    的头像 发表于 05-07 16:05 2897次阅读
    如何在Ubuntu上安装<b class='flag-5'>NVIDIA</b><b class='flag-5'>显卡</b>驱动?