0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型快速发展,GPU IP有何作用

Carol Li 来源:电子发烧友 作者:李弯弯 2024-05-29 00:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


电子发烧友网报道(文/李弯弯)随着人工智能技术的快速发展,GPU作为重要的算力支撑时常被提及。国内外重要的GPU芯片公司也为人熟知,包括英伟达AMD英特尔,景嘉微、海光信息、天数智芯、摩尔线程等。

事实上,除此之外还有一些GPU IP公司也为GPU产业发展做出很大贡献,包括Imagination、Arm、芯原科技等。在当前备受关注的大模型方面,这些公司的产品也起到一定支持作用。

Imagination

Imagination的GPU IP产品包括IMG A系列、IMG CXT、IMG DXT等多个系列,每个系列有不同的特点和应用场景。IMG A系列,是Imagination有史以来性能最强大GPU IP产品,IMG A系列被设计为可应用于与各种场景的GPU,是多种垂直应用领域的终极解决方案。

该系列产品覆盖从入门级市场的每时钟周期处理1个像素(1 PPC)的组件,到高性能设备的速度高达每秒2万亿次浮点运算(2 TFLOP)的内核,以及针对云应用的、速度超越该数值的多核解决方案。

IMG CXT,搭载首个针对移动端优化的PowerVR Photon光线追踪架构,为移动端游戏玩家和开发者提供桌面级光线追踪功能的体验。实现了光线追踪性能的大幅提升,支持在移动设备中以高帧率实现逼真的光线追踪阴影、反射、全局照明和环境遮蔽等效果。

IMG DXT是新一代面向移动端的高性能GPU IP,为移动设备用户带来先进的图形技术。提供三款配置,包括DXT-8-256、DXT-48-1536和DXT-72-2304,分别针对主流、高端和旗舰移动设备。旗舰产品DXT-72-2304具有72 GTexels/s和2.5 TFLOP FP32算力,与上一代产品相比,其最大单核性能提升了50%。

Imagination的GPU IP产品广泛应用于移动设备、汽车、数据中心、桌面和云游戏等多个领域。通过提供高性能的图形渲染和数据处理能力,为各种应用场景提供了强大的支持。

Imagination的GPU IP高性能、可扩展性和低功耗的特性,使得在支持大模型的应用上具有优势。如IMG DXD,其多核配置提供了强大的计算能力,5 TFLOPS FP32和144 GTexel/s,能够在大模型的应用上起到支持作用。

Arm

Arm的GPU IP产品系列主要包括Mali系列和Immortalis系列。Mali系列GPU IP是Arm的长期主力产品,拥有从入门级到旗舰级的完整产品线。Mali系列包括Mali-G710、Mali-G610、Mali-G510、Mali-G310等多个型号,分别定位于不同性能和价格的市场段。

Mali系列GPU基于Valhall GPU架构,并持续优化和提升性能。例如,Mali-G710号称综合性能提升20%、机器学习性能提升35%、纹理性能提升50%、能效提升20%。

Immortalis系列是Arm在2022年推出的全新旗舰级GPU IP产品,旨在提供终极的移动3D体验。Immortalis GPU基于Mali设计,并引入了硬件光线追踪功能,这是首款在移动端支持此功能的GPU。

Immortalis GPU采用10-16核设计,性能比上一代Mali GPU高15%。其光线追踪单元旨在提高效率,只占用约4%的着色器核心面积,却能带来300%的性能提升。

目前,Immortalis系列已经推出了Immortalis-G715和Immortalis-G720等型号。Immortalis-G720是Arm目前性能和能效表现最为出色的GPU,与上一代产品相比,其性能和能效分别提高了15%,系统级效率更跃升了40%。

Arm的GPU IP产品广泛应用于移动设备、汽车、数据中心、桌面和云游戏等多个领域。它们能够支持各种计算任务,如图形渲染、物理模拟、图像处理、机器学习和人工智能等。

Arm的GPU IP高性能计算、能效优化和生态系统支持方面特点,使其在大模型的应用方面具有优势。Arm的GPU IP,如Mali系列和Ethos系列,已被多家公司采用,并成功应用于大模型训练和推理中。

在大模型训练方面,Arm的GPU IP被广泛应用于深度学习、自然语言处理等领域。通过与合作伙伴共同开发定制化的解决方案,Arm GPU IP为这些领域的研究者和开发者提供了强大的计算能力支持。

在云端推理方面,Arm的GPU IP同样发挥了重要作用。通过提供高性能的云端计算资源,Arm GPU IP支持了多种大模型应用的实时推理需求。

芯原股份

芯原股份的GPU IP系列产品,以其高性能、灵活性和广泛的应用范围,成为市场上备受瞩目的产品。芯原可扩展的Vivante图形处理器(GPU)IP系列应用广泛,包括从低功耗的小型物联网MCU到面向汽车和计算机应用的功能强大的SoC。设计可满足各种芯片尺寸和功耗预算,是具成本效益的优质图形处理器解决方案。

芯原科技此前还详细介绍了其GPGPU-AI IP为核心的AI芯片定制解决方案。其以Tensor Core和GPGPU/GPU为主,提供了一个灵活的架构。

芯原GPGPU-AI处理器上有芯原通用的软件栈,在上层可以支持标准的应用接口,下层可以适配芯原各种各样的算力IP,算力IP有图形处理器、并行计算处理器、神经网络处理器。芯原GPGPU-AI分几个层次扩展的算力,可以支持异构计算,包括矢量计算、标量计算和张量处理单元,还可以支持大模型,高带宽计算需求,同时基于在AI领域有多年的积累,可对数据组织、数据搬移和计算有针对性的优化,另外还有专门针对大模型的带宽压缩技术。

芯原的GPU IP已被广泛应用于桌面显卡、车载信息娱乐、工业显示、物联网及可穿戴设备、大规模并行计算等领域。

写在最后


可以看到,GPU IP在多个领域都有广泛应用,包括科学计算、大数据分析、深度学习和人工智能、游戏服务器、图像处理、图形渲染和动画制作、视频处理和图像识别等。

当然,GPU IP也在不断发展和演进中,未来,专用加速IP与通用GPU的融合或许是GPU技术未来发展的一个亮点,这种融合将使GPU更具多功能性,更好地处理特定工作负载。高速DRAM和缓存技术的不断演进也将推动GPU的性能提升,使其能够更有效地处理复杂的计算任务,如支持大模型的训练和部署。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5272

    浏览量

    136070
  • IP
    IP
    +关注

    关注

    5

    文章

    1883

    浏览量

    156718
  • 大模型
    +关注

    关注

    2

    文章

    3772

    浏览量

    5273
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    壁仞科技壁砺166系列GPU产品率先支持Kimi K2.6模型

    4月20日晚,月之暗面正式发布并开源Kimi K2.6模型,带来行业领先(state-of-the-art)的代码、长程任务执行和Agent集群能力。壁仞科技(06082.HK)旗舰通用GPU产品壁
    的头像 发表于 04-23 16:30 861次阅读
    壁仞科技壁砺166系列<b class='flag-5'>GPU</b>产品率先支持Kimi K2.6<b class='flag-5'>模型</b>

    登临科技KS系列GPU产品深度适配阿里千问Qwen3.6大模型

    体验。而在这一前沿模型发布的第一时间,苏州登临科技股份有限公司自主研发的 KS系列高性能通用GPU 便已完成深度适配与优化,实现了 Day0 级别的支持。这不仅是登临科技在大模型生态领域快速
    的头像 发表于 04-21 16:50 1125次阅读
    登临科技KS系列<b class='flag-5'>GPU</b>产品深度适配阿里千问Qwen3.6大<b class='flag-5'>模型</b>

    海外静态IP和海外动态IP哪些区别?怎么选择?

    这个问题其实对于需要做跨境、电商、社媒运营的人问的比较多,所以本篇内容为大家来详细介绍下,具体如下: 一、什么是静态IP、动态IP? 1、静态IP(Static IP) 简单理解就是:
    的头像 发表于 04-13 12:36 97次阅读
    海外静态<b class='flag-5'>IP</b>和海外动态<b class='flag-5'>IP</b><b class='flag-5'>有</b>哪些区别?怎么选择?

    沐曦股份曦云C系列GPU产品Day 0适配智谱GLM-5.1旗舰模型

    4月8日,智谱新一代旗舰模型GLM-5.1实现开源。目前,沐曦股份曦云 C 系列 GPU已完成该系列模型Day 0 全量适配,再度以全栈自主技术实力,领跑国产 GPU 生态适配赛道。
    的头像 发表于 04-09 11:25 386次阅读

    登临科技GPU+技术如何推动智慧矿业发展

    随着人工智能技术的快速发展,传统矿业正面临从"经验驱动"向"智能决策"的深刻变革。在这一转型过程中,GPU+技术凭借其强大的算力、高效的能效比和灵活的部署能力
    的头像 发表于 04-07 14:20 369次阅读
    登临科技<b class='flag-5'>GPU</b>+技术如何推动智慧矿业<b class='flag-5'>发展</b>

    GPU与汽车安全有关联?

    汽车行业正在经历自电子技术应用于汽车以来最深刻的变革。车辆正朝着软件定义、智能网联、AI驱动和持续迭代的方向演进。这一转型带来了前所未有的新功能,同时也引入了更高层级的网络安全与功能安全风险。GPU
    的头像 发表于 01-12 13:21 960次阅读
    <b class='flag-5'>GPU</b>与汽车安全有<b class='flag-5'>何</b>关联?

    自动驾驶中毫米波雷达到底作用

    毫米波雷达、超声波雷达等感知硬件,更像是一个配角,成为自动驾驶技术实现的辅助硬件。那在自动驾驶中毫米波雷达到底作用
    的头像 发表于 12-10 17:07 2063次阅读
    自动驾驶中毫米波雷达到底<b class='flag-5'>有</b><b class='flag-5'>何</b><b class='flag-5'>作用</b>?

    华为如何通过大模型技术打造智能IP网络

    2025年非洲通信展在南非开普敦召开,华为数据通信产品线NCE数据通信领域总裁王辉受邀参加“Telecoms For Tomorrow”论坛,发表题为“拥抱AI时代,打造面向未来的智能IP网络”的演讲,分享华为如何通过大模型技术打造智能
    的头像 发表于 11-14 16:39 1627次阅读

    空气温度测量装置的主要作用是什么?品牌推荐?

    随着气象学的发展,气象站遍布全球,对空气温度的观测更加系统和准确,市面上可供选择的空气温度测量仪器种类也越来越丰富。那么,空气温度测量装置的主要作用是什么?品牌推荐?下面就让小编来
    发表于 10-20 16:24

    基于神经网络的数字预失真模型解决方案

    在基于神经网络的数字预失真(DPD)模型中,使用不同的激活函数对整个系统性能和能效影响?
    的头像 发表于 08-29 14:01 3668次阅读

    PCIe协议分析仪在数据中心中有作用

    升数据中心的整体可靠性。以下是其核心作用及具体应用场景的详细分析:一、性能优化:突破带宽瓶颈,提升计算效率 链路带宽利用率分析 场景:在AI训练集群中,GPU通过PCIe与CPU交换数据,若带宽利用率低
    发表于 07-29 15:02

    【VisionFive 2单板计算机试用体验】1、开箱初体验(刷系统+静态IP设置+GPU跑分测评)

    文件:注意:balenaEtcher这个软件表面上可以选择bz2文件,但是在软件内解压的话会卡在73%的进度。所以,bz2文件要先解压,再用balenaEtcher烧录镜像到TF卡。 开机设置静态IP
    发表于 07-09 21:50

    为什么无法在GPU上使用INT8 和 INT4量化模型获得输出?

    安装OpenVINO™ 2024.0 版本。 使用 optimum-intel 程序包将 whisper-large-v3 模型转换为 int 4 和 int8,并在 GPU 上使用 OpenVINO™ 运行推理。 没有可用的输出。
    发表于 06-23 07:11

    Imagination与澎峰科技携手推动GPU+AI解决方案,共拓计算生态

    的深度融合展开合作。双方将结合 Imagination 领先的 GPU IP 技术与澎峰科技在 AI 模型压缩与性能优化方面的软硬协同能力,共同开拓面向 AI 行业应用的计算解决方案,推动国产计算生态
    发表于 05-21 09:40 1296次阅读

    摩尔线程GPU率先支持Qwen3全系列模型

    近日,阿里云正式发布Qwen3系列的8款开源混合推理模型。摩尔线程团队在模型发布当天,率先完成了Qwen3全系列模型在全功能GPU上的高效支持。这一成果充分展现了MUSA架构及全功能
    的头像 发表于 05-07 15:24 1133次阅读