0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Nvidia RTX30系显卡翻车,罪魁祸首竟是区区电容?

21克888 来源:电子发烧友网 作者:周凯扬 2020-09-29 06:53 次阅读


电子发烧友报道(文/周凯扬)随着RTX3080和RTX3090两大系列显卡的相继开卖,消费者发现了库存短缺,为数不多的显卡被黄牛和机器哄抢一空,Nvidia甚至不得不为糟糕的首发情况道歉。除此之外,抢先评测的媒体和首批购买的用户都开始陆续发现一些崩溃、黑屏等不稳定的问题。这些稳定性问题往往在频率超过2GHz时复现,但并非所有显卡厂商都遇上了这种情况。那么这背后究竟有何原因呢?德国硬件测频网站Igor'sLAB等媒体、工程师以及爱好者均对这次“翻车”进行了分析。

生产前期没有真正的功能测试?


为了防止显卡基准性能测试结果的泄露,Nvidia这一次完全封闭了评估驱动。甚至可能没有运行Furmark或Time Spy等经典测试工具,仅用到了NVPunish(一款压力测试工具)来进行热测试。而从AIC显卡合作厂商的角度来看,这就有些怪异了,因为他们生产出来的显卡难以确定具体性能。因此每个厂商的功能测试仅限于正常启动与热稳定性,从而判断是否能够运行,但芯片质量以及最大安全频率却无从得知。这也就造成了不少厂商的质量测试时间较短,未能及时发现相关问题。

错误的元器件选择?

参考板PG132上的电容 / Igor'sLAB


目前来看,比较令人信服的理由就是电容的选择。在Nvidia的参考板PG132设计中,可以看到6个必要的电容,它们用于滤除NVVDD/MSVDD电压轨中的高频。除了电压转换器的高频干扰外,GPU频率的提升也会带来更多的干扰。而这一参考设计开放了使用大面积POSCAP/SP-CAP(导电性聚合电解电容)还是稍微昂贵一点的MLCC(片式多层陶瓷电容)的选择,后者更小但必须以电容组来实现更高的容值。

从Nvidia自己的表单和规范来看,两者都是可行的。然而从质量上来说,优质的MLCC在过滤高频上更胜一筹。因此在显卡厂商来看,这就成了成本控制的问题。不同的厂商因此也都对自己的显卡选用了不同的电容方案。从许多反馈上来看,索泰的Trinity系列在频率超过2010MHz时往往会出现不稳定的情况,因为索泰使用了6个成本较低的POSCAP电容。

6个SP-CAP电容 / Igor'sLAB


而Nvidia自己的创始人版显卡则选择了更加优秀的方案,它采用了4个POSCAP和2个MLCC电容组(每组10个MLCC)的方案,因此哪怕在超过2GHz的情况下出现问题,也多半是驱动的原因。Igor'sLAB认为这是最优的方案,因为中间区域更加要配以合适的滤波(避免高频混合引起的短路)。

4个SP-CAP电容与两个MLCC电容组 / Igor'sLAB


而华硕的Asus TUF RTX 3080 Gaming显卡上则采用了更进一步的方案,全部采用MLCC电容组。这也证明了为何华硕旗舰显卡ROG STRIX RTX3080 OC的频率能高达1935MHz,比Nvidia的创始人版本高出13.2%。

6个MLCC电容组 / Igor'sLAB


那么电容的选择与显卡的超频有何关联呢?若将电容比作水桶的话,POSCAP就是大桶,MLCC就是小桶,大桶接水和放水速度都要慢,而小桶速度快但要达到相同的容量则有数量要求。随着GPU时钟频率的提高,所需电压也会提高,GPU Boost技术也会更快进行抵消和调节。所以越接近存储极限,修正和负载变化搞得频率也会提高。随着这一间隔变短,对电容的缓冲速度就有更高的要求,这也就是为什么MLCC在高频下更好的原因。对于NVVDD供电来说,一组MLCC就足以解决问题,而MSVDD的变化较少且独立于NVVDD,并不一定需要用到MLCC。

各个厂商显卡电容方案与回应

各个厂商RTX3080显卡的电容方案 / 电子发烧友网搜集整理


上图即部分已知的RTX3080显卡电容方案,其中部分暂未正式发售的显卡数据来源于媒体评测样卡,具体数据以正式零售版为准。从上图可知,大部分厂商都使用了1个MLCC电容组和5个POSCAP/SP-CAP的方案,RTX3090的情况与RTX3080大抵相同,但多数厂商采用了2个MLCC电容组和4个SP-CAP电容的方案。但随着“电容翻车”事件的发酵,相关的厂商也纷纷做出了自己的回应。

早在给媒体送去样卡以及显卡正式发售前,七彩虹已经发布邮件提醒,他们已经发现了崩溃问题,尤其是当按下超频键时,相关显卡随后已被召回。七彩虹官方也已透露未来将会采用更优的2个MLCC组+4个POSCAP电容方案。


华硕电脑中国区经理俞元麟在微博上强调,华硕的媒体送测样卡以及零售版本都采用了全MLCC的设计,原因是在研发过程中发现MLCC超频性能更好。而华硕在尚未正式开售的RTX3070系列显卡上使用了4 SP-CAP的设计,但考虑到RTX3070和RTX3080/3090设计并不相同,而且该显卡10月份才开售,出现不稳定问题的可能性相当之小。

EVGA声明 / EVGA


EVGA的全球产品管理主管Jacob Freeman也发表了自己的回应,称在量产的QC测试环节中,EVGA发现6个POSCAP的方案并没有通过实际应用测试。研发团队花了一周的时间找到问题成因,然后将POSCAP的数量缩减至4个,并在出货前加入20个MLCC电容,这也是为何EVGA GeForce RTX 3080 FTW3系列推迟的原因,但并没有任何6 POSCAP电容方案的该系列显卡出货至消费者手中。但部分媒体评测版本收到了量产前的6 POSCAP电容版本,EVGA正在收回这些显卡并换以零售版本。而XC3系列采用了5 POSCAP和10MLCC的方案,可以实现正常参数配置,并没有发现任何问题。


影驰于9月27日在微博发表声明,称目前只有6片用于评测的RTX 3090 GAMER试产样品采用了6颗SP-CAP的电容方案,该系列暂未开售,而未来正式生产和售卖的GAMER产品将对电容用料进行优化改进。


耕升也在微博发表声明,耕升并没有产品采用6 SP-CAP电容的方案,因此并不会出现盛传的电容问题与新品故障。

索泰马来西亚回应 / 索泰


索泰的母公司柏能集团似乎已经意识到了该问题,并将对设计做出更改。索泰马来西亚也在Facebook上发布了帖子,指出相关调查已在进行,不久后将更新情况,同时建议任何购买了RTX3080和3080 Trinity系列的客户填写调查表单。

小结


由此看来,电容设计失误很有可能是本次“翻车”事件的主要原因,但还是有不少采用了MLCC电容的RTX3080/3090显卡遇上了黑屏等不稳定性问题,而采用全POSCAP方案的显卡也有正常运转无误的。MSI也在一次Insider直播中提到了该问题,表示该问题很有可能是因为驱动引起的。但Igor'sLAB随后也发文称具体稳定性还是取决于芯片质量,高质量的芯片保持稳定所需的电压也更少。因为缺乏合适驱动所以显卡合作厂商无法正常测试第一批显卡,所以造成了部分原本不适用于超频版的显卡出货。从各个厂商的回应来看,电容的选择确实造成了一定影响,但未来稳定性的进一步加强还是得靠Nvidia的新驱动推送。

声明:本文由电子发烧友原创,如需转载和入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 电容
    +关注

    关注

    98

    文章

    5597

    浏览量

    147258
  • NIVIDA
    +关注

    关注

    0

    文章

    9

    浏览量

    7178
  • RTX3080
    +关注

    关注

    0

    文章

    3

    浏览量

    1385
收藏 人收藏

    评论

    相关推荐

    NVIDIA发布两款新的专业显卡RTX A1000、RTX A400

    NVIDIA今天发布了两款新的专业显卡RTX A1000、RTX A400,从编号就能看出来定位入门级,而且架构并非最新的Ada Lovelace,还是上一代的Ampere。
    的头像 发表于 04-18 11:35 557次阅读
    <b class='flag-5'>NVIDIA</b>发布两款新的专业<b class='flag-5'>显卡</b><b class='flag-5'>RTX</b> A1000、<b class='flag-5'>RTX</b> A400

    CPU 100%问题怎么排查?有哪些方法?

    首先,先用放之四海而皆准的命令 top,确认一下是不是 Java 进程是罪魁祸首。Java 进程要不然就是个后台任务,要不然就是个 jar 包,比如一个Spring Boot 服务。
    的头像 发表于 03-18 17:09 825次阅读
    CPU 100%问题怎么排查?有哪些方法?

    NVIDIA RTX 5090痛失512位显存!

    NVIDIA有望在今年底或明年初发布下一代RTX 50系列显卡,大概率首发配备新一代GDDR7显存,但是显存位宽和之前的说法不太一样。
    的头像 发表于 03-11 16:02 252次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> 5090痛失512位显存!

    局域网IP地址冲突、环路的罪魁祸首是什么?

    局域网IP地址冲突、环路的罪魁祸首是什么? 局域网IP地址冲突和环路是网络中常见的问题,它们会导致网络故障和通信中断,影响企业和个人的网络使用体验。本文将详细说明局域网IP地址冲突和环路的原因
    的头像 发表于 02-04 11:03 472次阅读

    RTX 4070 Ti SUPER详细评测

    2024年1月9日,NVIDIA发布了GeForce RTX 40 SUPER系列显卡,包括RTX 4070 SUPER、RTX 4070
    发表于 01-29 10:31 1378次阅读
    <b class='flag-5'>RTX</b> 4070 Ti SUPER详细评测

    英伟达发布RTX 40 SUPER系列显卡

    在刚刚结束的CES 2024上,GPU巨头英伟达正式推出了全新的RTX 40 SUPER系列显卡,包括RTX 4080 SUPER、RTX 4070 Ti SUPER和
    的头像 发表于 01-22 16:09 494次阅读

    NVIDIA RTX 5000 Ada显卡性能实测报告

    单精度浮点运算性能是显卡一项重要的指标,很多计算都是使用单精度来完成的。从测试结果来看 RTX 5000 Ada 的性能达到了 63.1T,而 RTX A5000 只有 30.5T。由此, R
    的头像 发表于 12-21 15:58 1841次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> 5000 Ada<b class='flag-5'>显卡</b>性能实测报告

    不要让空化成为影响船舶性能的罪魁祸首

    本文翻译转载于:Cadence blog 作者:Veena Parthan 空化对现代船只设计提出了严峻挑战,尤其是对参加美洲杯帆船赛、旺代单人环球帆船赛和朗姆之路跨大西洋帆船赛等赛事的高速帆船而言。尤其是水翼极易受到空化的影响,空化会导致空蚀,损坏船只表面,甚至出现灾难性故障,使船员面临危险,从而带来巨大经济损失。螺旋桨也会受到空化空蚀的影响,导致效率下降、耐用性降低,以及随之而来的昂贵的更换费用。 在本篇内容中,我们将探讨 Fidelity F
    的头像 发表于 12-20 12:25 276次阅读
    不要让空化成为影响船舶性能的<b class='flag-5'>罪魁祸首</b>

    UVM环境的看门狗没看住超时是怎么回事?

    一个中规中矩的watchdog是怎么组织的呢?要明确一下watchdog发挥的作用,就是在objection的基础上进行补充,在环境长时间没有动静的情况下能够使环境报错推出并打印此时阻止仿真结束的罪魁祸首
    的头像 发表于 12-05 10:15 242次阅读

    英伟达RTX 4090D显卡爆料:全新GPU芯片,符合出口管制

    11月30日,rtx 4090d显卡由ad102-250 gpu芯片驱动,rtx 4090使用ad102-300/301。根据英伟达的惯例,同样的
    的头像 发表于 12-01 14:19 840次阅读

    英伟达RTX 4090显卡下架!中文官网已移除产品信息

    在提交原稿之前,nvidia官方网站只展示了5款rtx 40系列,但英文官方网站仍保留了rtx 4090。目前,在国内电子商务交易平台上,rtx 4090
    的头像 发表于 11-20 10:24 400次阅读

    聊聊在手机上开启快速swap的可能性

    而造成switch time大大增加的罪魁祸首就是请求调页的低效率。下图表示switch过程中CPU和磁盘带宽利用率。在switch的过程中,CPU的平均利用率仅仅34.2%;,而磁盘带宽利用率仅9.4%。究其原因, 在于解压缩和读磁盘操作只在一次page fault时启动。
    的头像 发表于 10-17 16:55 252次阅读
    聊聊在手机上开启快速swap的可能性

    电子元器件这些封装常被忽视的常识,竟是出现质量问题的罪魁祸首

    电子元器件
    芯广场
    发布于 :2023年10月10日 18:33:41

    服务器库存正在燃烧,增长将在明年恢复

    罪魁祸首当然是 PC 业务。联想的智能设备集团 (IDG) 收入下降 34.2%,略低于 98 亿美元,营业利润下降 37.3% 至 6.61 亿美元。尽管收入下滑,联想仍保持全球第一大个人电脑销售商的地位,联想认为库存正在燃烧,增长将在明年恢复。
    的头像 发表于 06-11 14:50 690次阅读
    服务器库存正在燃烧,增长将在明年恢复

    广东全省电信崩溃数小时! 罪魁祸首是思科的设备?

    时事热点行业资讯
    电子发烧友网官方
    发布于 :2023年06月09日 11:23:18