0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

联发科联手英伟达挑战高通与AMD,游戏、3纳米和大模型

佐思汽车研究 来源:佐思汽车研究 2024-03-27 14:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023年5月,联发科英伟达宣布合作,共同研发车载芯片,原本计划是采用Chiplet形式。

2024年3月,联发科正式发布新一代Dimensity Auto 座舱平台,最大亮点是英伟达RTX GPU IP的加入和台积电3纳米的制造工艺。台积电3纳米制造工艺是目前芯片行业最先进的制造工艺,这是汽车芯片第一次与手机AI芯片同时使用最先进的制造工艺,但不是Chiplet,推测一来是3纳米的Chiplet制造工艺不够成熟,二就是Chiplet需要动用台积电先进封装,成本并不比单一die低,甚至可能高2-3倍,汽车行业对价格还是相对比较敏感的。

联发科是一家非常低调的公司,品牌形象营造远不如高通,也极少对外透露信息。

联发科一直被高通挤压,特别是在GPU和AI方面,联发科引入英伟达的GPU IP来弥补这一短板。

从联发科官方介绍中,我们不难看出联发科使用的英伟达GPU IP是何种类型的IP,因为DLSS3是RTX40系列独有的功能,也就是说联发科使用了英伟达RTX40系列桌面显卡的IP。

简单介绍一下DLSS3

65b3aaf8-ec02-11ee-a297-92fbcf53809c.png

图片来源:英伟达

DLSS全称Deep Learning Super Sampling(深度学习超采样),主要包括DLAA、插帧和光线重建。插帧即帧生成,它可以生成全新帧,而不仅是像素,从而带来惊人的性能提升。基于NVIDIA Ada Lovelace架构的新光流加速器可分析两帧连续的游戏图像,并计算帧到帧中物体和元素的运动矢量数据,而不使用传统游戏引擎的运动矢量进行建模。这极大地减少了AI在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。

通过综合游戏中的一对超级分辨率帧,以及引擎和光流运动矢量,并将其输入至卷积神经网络,就能计算生成出新的一帧,这在实时游戏渲染中是首次实现。将DLSS生成的全新帧与DLSS超级分辨率帧相结合,使DLSS 3能用AI重建八分之七的显示像素,与没有DLSS相比,游戏性能提升了4倍。

由于DLSS生成帧在GPU上作为后处理执行,即使游戏受到CPU性能限制,也能从中获得游戏性能提升。对于受到CPU限制的游戏,例如物理计算密集型游戏或大型场景游戏,DLSS 3令GeForce RTX 40系列GPU以高达两倍于CPU可计算的性能渲染游戏。

DLSS 3集成也包括NVIDIA Reflex,可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。

DLSS3的插帧技术目前还是英伟达独有,AMD英特尔没有,也就是说如果用联发科的芯片运行《赛博朋克2077》这样的硬件杀手游戏,效果或可以碾压特斯拉座舱的AMD 分离式GPU。

RTX40系列也有多个版本,最低的是笔记本电脑用的GTX4050,AD107架构,2560个CUDA,联发科最大可能用这个架构。RTX4050的稀疏INT8算力估计有104TOPS,将来联发科的旗舰芯片或许AI算力大约就是100TOPS,当然了功耗会有25-35瓦以上,水冷恐怕不可避免。

另一大特色就是3纳米工艺,据称目前苹果和联发科已经包下了台积电全部的3纳米产能,高通拿不到台积电的3纳米产能了,高通打算使用三星的3纳米。众所周知,三星与台积电差距还是很大的。制造工艺上,联发科与同在台湾省内的台积电合作更加顺利,联发科的手机芯片也拿到了4纳米首发,领先了高通一步,3纳米上基本也可以确定,联发科也是首发。台积电第一代3nm工艺是N3B,由台积电的大客户苹果率先使用,A17 Pro、M3系列芯片等都是使用的台积电第一代3nm工艺制程。台积电第二代3nm工艺是N3E,N3E预计将比N3B应用更广泛,除了前面提到的联发科天玑9400芯片外,高通骁龙8 Gen4、A18系列芯片也原本计划采用N3E工艺。台积电N3E是N3B的增强版,良率更高,成本更低,但密度会略低于N3B。

联发科这次也是和高通一样,手机芯片与车载芯片同步,都采用最先进的3纳米制造工艺,考虑到3纳米高达数亿美元的惊人的一次性流片成本,联发科的手机和车载芯片应该有共通之处。

2023年9月,联发科宣布首款使用台积电3纳米工艺的芯片即将在2024年量产,这就是联发科新旗舰天玑9400。

天玑9300开始使用全大核设计,晶体管数量高达227亿,比英伟达自动驾驶Orin的170亿还要多很多。天玑9300的227亿晶体管,是真正的遥遥领先:苹果A16是160亿,A17 Pro是190亿,苹果M2是200亿。即便是苹果M3,也“仅”有250亿晶体管,而高通好几代没公布晶体管数目了。历史性的取消小核,CPU由4颗X4超大核和4颗A720大核组成,最高频的X4有更大的缓存。跳出安卓SoC的视角看,天玑9300的4颗超大核和4颗大核,其实更接近于苹果A系列和英特尔的P核(性能核)、E核(能效核)概念。

天玑首发LPDDR5T 9600Mbps内存,速度比之前的LPDDR5x 8533Mbps提升12.5%,这是大家以为要等LPDDR6才能达到的频率(2年前的天玑9000是首发LPDDR 5x 7500Mbps内存,天玑9200是首发LPDDR5x 8533Mbps)。

天玑9400采用ARM旗舰Cortex-x5(下图TCS24就是Cortex-x5,代号黑鹰),这是ARM最强CPU架构。

ARM的路线图

65c28a82-ec02-11ee-a297-92fbcf53809c.png

图片来源:ARM

Cortex-x5据说将消除Arm设计的CPU内核与苹果基于Arm指令集自研的CPU内核之间的性能差距。Moor Insights & Strategy CEO Patrick Moorhead指出,ARM全新的Cortex-X系列CPU内核的内部代号为“Blackhawk”,是ARM CEO Rene Haas接下来的工作重点之一,旨在消除Arm设计的CPU内核与苹果基于Arm指令集自研的CPU内核之间的性能差距。Moorhead引用ARM说法表示,“Blackhawk”核心将会带来巨大的性能提升,是五年来同比最大的IPC性能提升。

65dfd380-ec02-11ee-a297-92fbcf53809c.png

整理:佐思汽研

多年来ARM一直在挤牙膏,IPC带宽从2位,缓慢上升,而苹果一开始就到巅峰的8位,导致安卓性能远低于苹果,X5可能追平苹果的8位解码宽度,也可能直接到10位,超过苹果。

65eeb4b8-ec02-11ee-a297-92fbcf53809c.png

图片来源:联发科

很多人以为AI运算和CPU没关系,或者说CPU无法做AI运算,实际上CPU完全可以做任何类型的AI运算,只是数据吞吐能力不如GPU或AI加速器,抛开数据吞吐,单纯AI运算,CPU是最快的。ARM最新的CPU如Cortex-X3/X4/X5,都能够运行大模型,目前手机领域或者说移动领域大模型最常见的是LIama2,这是目前最好的语言类开源大模型。天玑9400可以做到每秒12-15 tokens。

简单介绍一下LIama2,Meta 出品的 Llama 续作 Llama2,一系列模型(7B、13B、70B)均开源可免费商用。Llama2在各个榜单上精度全面超过Llama1,同时也超过目前所有开源模型。用于车载和手机的70亿参数的相对较小的模型。

尽管语言类大模型LLM训练方法很直观:基于自回归的transformer模型,在大量预料上做自监督训练,然后通过人类反馈强化学习 (RLHF) 等技术来与人类偏好对齐。但高计算需求限制了LLM 只能由少数玩家来推动发展。现有的开源大模型,例如BLOOM、Llama1、Falcon,虽然都能基本达到匹配非开源大模型(如GPT-3、Chinchilla)的能力,但这些模型都不适合成为非开源产品级LLM (比如ChatGPT、BARD、Claude)的替代品,因为这些封闭的产品级LLM经过大量微调,与人类的偏好保持一致,大大提高了它们的可用性和安全性。这一步在计算和人工标注中需要大量的成本,而且往往不透明或容易重现,限制了社区的进步,以促进AI对齐研究。

660bab9a-ec02-11ee-a297-92fbcf53809c.png

图片来源:网络

Meta自己的奖励模型在基于Llama 2-Chat收集的内部测试集上表现最佳,其中「有用性」奖励模型在「元有用性」测试集上表现最佳,同样,「安全性」奖励模型在「元安全性」测试集上表现最佳。总体而言,Meta的奖励模型优于包括GPT-4在内的所有基线模型。有趣的是,尽管GPT-4 没有经过直接训练,也没有专门针对这一奖励建模任务,但它的表现却优于其他非元奖励模型。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 联发科
    +关注

    关注

    57

    文章

    2750

    浏览量

    259884
  • 加速器
    +关注

    关注

    2

    文章

    841

    浏览量

    40244
  • 英伟达
    +关注

    关注

    23

    文章

    4116

    浏览量

    99634
  • 车载芯片
    +关注

    关注

    0

    文章

    84

    浏览量

    15252
  • chiplet
    +关注

    关注

    6

    文章

    499

    浏览量

    13650

原文标题:联发科联手英伟达挑战高通与AMD,游戏、3纳米和大模型

文章出处:【微信号:zuosiqiche,微信公众号:佐思汽车研究】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2nm“诸神之战”打响!性能飙升+功耗骤降,台积电携领跑

    电子发烧友网报道(文/莫婷婷)2025年,2nm制程正式开启全球半导体“诸神之战”。就在近期,MediaTek()宣布,首款采用台积电 2 纳米制程的旗舰系统单芯片(SoC)已成
    的头像 发表于 09-19 09:40 1.4w次阅读
      2nm“诸神之战”打响!性能飙升+功耗骤降,台积电携<b class='flag-5'>联</b><b class='flag-5'>发</b><b class='flag-5'>科</b>领跑

    遭强势回应!起诉华为

    电子发烧友网报道(文 / 吴子鹏)近日,欧洲统一专利法院(UPC)曼海姆(Mannheim)分庭更新的诉讼信息显示,子公司 HFI Innovation 起诉中国华为旗下五家子公司,指控其侵犯
    的头像 发表于 06-24 01:10 4492次阅读
    遭强势回应!<b class='flag-5'>联</b><b class='flag-5'>发</b><b class='flag-5'>科</b>起诉华为

    英伟+,打入游戏本市场?

    电子发烧友网报道(文/梁浩斌)近日有消息称,英伟合作,将推出面向笔记本市场的APU,并最快在今年四季度或明年初进入市场。   同时
    的头像 发表于 06-05 09:08 5614次阅读

    MWC2026:6G狂飙!华为、通、英伟等五大巨头,亮出哪些突破性技术

    尽管6G标准冻结预计在2029年前后,但是在今年的MWC现场,6G已经从愿景走向原型展示,成为产业提前布局的阵地。华为、通、英伟、爱立信、
    的头像 发表于 03-05 09:15 1.6w次阅读
    MWC2026:6G狂飙!华为、<b class='flag-5'>高</b>通、<b class='flag-5'>英伟</b><b class='flag-5'>达</b>等五大巨头,亮出哪些突破性技术

    麦格纳宣布扩大与英伟的战略合作

    麦格纳宣布扩大与英伟的战略合作,为整车厂基于英伟DRIVE Hyperion平台的项目落地提供支持。
    的头像 发表于 01-09 12:59 514次阅读

    安卓主板定制_MTK安卓系统主板PCBA方案开发

    的整体表现。(MTK)凭借高性价比、低功耗及集成度,成为安卓主板定制开发的优选方案,为多元化智能设备的升级注入强大动力。基于
    的头像 发表于 12-26 20:31 704次阅读
    安卓主板定制_MTK<b class='flag-5'>联</b><b class='flag-5'>发</b><b class='flag-5'>科</b>安卓系统主板PCBA方案开发

    【实测分享】智能显示模块图片乱码 / 模糊?用 MTK 芯片方案避坑!

    最近看到不少朋友问 “智能显示模块导入图片乱码、模糊”(比如楼上的问题),刚好我们用 MTK 显示模块芯片做了一批实测,分享下避坑经验 + 方案优势: 一、先解决 2 个高频问题(亲测有效
    发表于 11-27 21:49

    英伟 Q3 狂揽 308 亿

    厂商季度合计 500 亿美元资本支出中,约 30% 流向了英伟。 新一代 Blackwell 芯片已全面投产,Q3 交付 1.3 万个 GPU 样品,H200 GPU 理论性能较 H100 翻倍
    的头像 发表于 11-20 18:11 1373次阅读

    NVIDIA新闻:英伟10亿美元入股诺基亚 英伟推出全新量子设备

    研发并推出相关产品。 英伟CEO黄仁勋出现在美国华盛顿的GTC DC大会上的演讲中表示;“今天我们宣布与诺基亚建立了合作关系,诺基亚是世界第二大电信制造商,这是一个价值3万亿美元的产业。”黄仁勋说,全世界有数百万个基站,双方合
    的头像 发表于 10-29 17:12 2413次阅读

    看点:台积电2纳米N2制程吸引超15家客户 英伟拟向OpenAI投资1000亿美元

    给大家分享两个热点消息: 台积电2纳米N2制程吸引超15家客户 此前有媒体爆出苹果公司已经锁定了台积电2026年一半以上的2nm产能;而通和
    的头像 发表于 09-23 16:47 1101次阅读

    英伟下一代Rubin芯片已流片

    继8月底英伟透露Rubin架构芯片计划明年量产后,当地时间9月8日的盛技术会议上,英伟又谈到Rubin的进展。
    的头像 发表于 09-12 17:15 2031次阅读

    定制安卓主板_|通|紫光展锐安卓主板方案

    安卓主板搭载八核处理器,主频高达2.2GHz,采用先进的6nm制程工艺,性能表现出色。内置Android 13.0操作系统,标配4GB DDR4内存和64GB UFS高速存储,硬件配置强劲高效
    的头像 发表于 07-11 19:56 762次阅读
    定制安卓主板_<b class='flag-5'>联</b><b class='flag-5'>发</b><b class='flag-5'>科</b>|<b class='flag-5'>高</b>通|紫光展锐安卓主板方案

    游戏到智能驾驶,英伟有哪些技术升级?

    [首发于智驾最前沿微信公众号]在2025年国际消费电子展(CES 2025)上,英伟重磅发布了其最新一代车规级自动驾驶芯片“Thor”,并同步展示了在智能汽车领域的技术进展与合作布局。英伟
    的头像 发表于 05-16 09:02 1183次阅读
    从<b class='flag-5'>游戏</b>到智能驾驶,<b class='flag-5'>英伟</b><b class='flag-5'>达</b>有哪些技术升级?

    一加宣布与科技达成战略合作,首发天玑9400旗舰家族新成员9400e

    科技首发专为游戏而生的天玑9400旗舰家族新成员9400e。会上,一加中国区总裁李杰宣布:即将发布的一加Ace 5至尊系列采用天玑9400+和天玑9400e双旗舰平台,凭借风驰游戏内核加持,挑战行业最强1%low帧表现,带来行业
    的头像 发表于 05-14 17:18 3145次阅读
    一加宣布与<b class='flag-5'>联</b><b class='flag-5'>发</b>科技达成战略合作,首发天玑9400旗舰家族新成员9400e