0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

盘点国产GPU在支持大模型应用方面的进展

Carol Li 来源:电子发烧友 作者:李弯弯 2024-03-29 00:27 次阅读

电子发烧友网报道(文/李弯弯)目前谈到GPU,大家首先想到的应该就是英伟达了。近一年多时间来,随着大模型的发展,英伟达GPU的强大实力可谓无人不知。而相比之下,国产GPU的声势就小了许多。事实上,近些年国内也有不少GPU企业在逐步成长,虽然在大模型的训练和推理方面,与英伟达GPU差距极大,但是不可忽视的是,不少国产GPU企业也在AI的训练和推理应用上找到位置。

wKgZomYFRmmARSpxAAFSRafzhM0753.png

景嘉微

景嘉微是国产GPU市场的主要参与者,目前已经完成JM5、JM7和JM9系列三代图形处理芯片的研发,并成功实现产业化。

2024年3月12日,该公司发布公告称,其面向AI 训练、AI推理、科学计算等应用领域的景宏系列高性能智算模块及整机产品研发成功,并将尽快面向市场推广。

根据公告,景宏系列支持INT8、FP16、FP32、FP64等混合精度运算,支持全新的多卡互联技术进行算力扩展,适配国内外主流CPU操作系统及服务器厂商,能够支持当前主流的计算生态、深度学习框架和算法模型库,大幅缩短用户适配验证周期。

海光信息

海光信息的产品包括海光通用处理器(CPU)和海光协处理器(DCU)。海光DCU属于GPGPU 的一种,采用“类CUDA”通用并行计算架构,能够较好地适配、适应国际主流商业计算软件和人工智能软件。

海光8000系列具有全精度浮点数据和各种常见整型数据计算能力,具有最多64个计算单元,能够充分挖掘应用的并行性,发挥其大规模并行计算的能力,快速开发高能效的应用程序。

海光DCU主要部署在服务器集群或数据中心,为应用程序提供性能高、能效比高的算力,支撑高复杂度和高吞吐量的数据处理任务。在AIGC持续快速发展的时代背景下,海光DCU 能够完整支持大模型训练,实现LLaMa、GPT、Bloom、ChatGLM、悟道、紫东太初等为代表的大模型的全面应用,与国内包括文心一言等大模型全面适配,达到国内领先水平。

瀚博半导体

瀚博半导体成立于2018年12月,是一家GPU芯片提供商,致力于为人工智能核心算力和图形渲染、内容生成、AIGC提供全栈式芯片解决方案。瀚博目前拥有自主研发的核心IP以及两代GPU芯片,并衍生AI、渲染、视频三大产品线。

据介绍,其2023年推出的第二代GPU SG100芯片,采用7nm先进制程,具备业界一流的渲染性能,同时兼具低延时高吞吐的AI算力和强大的视频处理能力,可广泛支持数字孪生、数字人、云桌面、云手机、云游戏、云渲染、工业软件等多领域应用。

同时针对大模型时代算力需求,瀚博还首发了LLM大模型AI加速卡VA1L,具备200 TOPS INT8/72 TFLOPS FP16算力,并支持ChatGPT、LLaMA、Stable Diffusion等主流AIGC网络模型。同时,瀚博更重磅推出AIGC大模型一体机,共使用8张LLM大模型AI加速卡VA1L,支持512GB显存,进而支持1750亿参数的大模型。

摩尔线程

摩尔线程成立于2020年10月,是一家以全功能GPU芯片设计为主的集成电路公司。该公司已经发布两款自主研发的GPU芯片产品,2022年3月发布GPU产品“苏堤”,11月又发布了第二款GPU芯片“春晓”。

“春晓”内置MUSA架构通用计算核心以及张量计算核心,可支持FP32、FP16和INT8三种计算精度;相较于其首款自研的GPU“苏堤”,“春晓”内置的四大计算引擎都进行了全面升级,性能显著提升,AI计算加速平均提升4倍。

沐曦集成

沐曦成立于2020年9月,致力于为异构计算提供全栈GPU芯片及解决方案,可广泛应用于智算、智慧城市、云计算自动驾驶、数字孪生、元宇宙等前沿领域。

沐曦集成目前有三条产品线规划,曦思N系列GPU产品用于智算推理,曦云C系列GPU产品用于通用计算,曦彩G系列GPU产品用于图形渲染。据沐曦此前对外透露,公司N系列云端推理芯片已经量产出货,C系列于2023年6月13日回片并完成测试。

沐曦产品均采用完全自主研发的GPU IP,拥有完全自主知识产权的指令集和架构,配以兼容主流GPU生态的完整软件栈(MXMACA),具备高能效和高通用性的天然优势,能够为客户构建软硬件一体的全面生态解决方案。

天数智芯

天数智芯致力于开发自主可控、国际领先的高性能通用GPU产品,探索通用GPU赶超发展道路,加快建设自主产业生态,为全产业提供高端算力解决方案。

天数智芯2018年正式启动通用GPU芯片设计,在2021年发布了其通用GPU“天垓100”芯片及天垓100加速卡,2021年10月宣布天垓100正式进入量产环节。2022年9月,又发布了首款7nm制程的云端推理通用GPU产品“智铠100”。

智铠 100 芯片支持 FP32、FP16、INT8 等多精度混合计算,实现了指令集增强、算力密度提升、计算存储再平衡,支持多种视频规格解码。

燧原科技

燧原科技专注人工智能领域云端和边缘算力产品,致力为通用人工智能打造算力底座,提供原始创新、具备自主知识产权的AI加速卡、系统集群和软硬件解决方案。产品可广泛应用于泛互联网、智算中心、智慧城市,智慧金融、科学计算、自动驾驶等多个行业和场景。

该公司于2018年3月成立,仅用18个月时间,即发布第一代AI芯片邃思1.0,又于2021年7月发布邃思2.0。到现在,该公司已经在两款芯片的基础上迭代了两代训练和推理产品,第三代产品也已经在研发中。并且,燧原科技已经在科研领域和智慧城市的应用中落地了训练和推理的超千卡算力集群。

登临科技

登临科技专注于芯片研发与技术创新,致力于打造云边端一体、软硬件协同的前沿芯片产品和平台化基础系统软件。公司自主创新的GPU+(基于GPGPU的软件定义的片内异构计算架构),在兼容CUDA/OpenCL在内的编程模型和软件生态的基础上,通过架构创新,完美解决了通用性和高效率的双重难题。

登临首款基于GPU+的创新AI计算加速器Goldwasser已规模化运用在各个应用场景。未来将继续秉承核心IP全自研的架构实现,以AI计算为主线,以创新为灵魂,加强核心IP自主研发,加速产品在高级自动驾驶,图形加速等相关领域的开拓创新和商业化进程。

写在最后

GPU最初是为解决CPU在图形处理领域性能不足的问题而诞生的,早期它多用于图形处理,而如今大家谈到用于AI训练和推理多是通用计算GPGPU,它脱胎于早期的图形处理器。

上述谈到的GPU企业,有些既有用于AI计算的GPU产品,也有用于图形处理的产品,如景嘉微,是国内较早入局GPU市场的企业,之前已经发布过多个系列的产品,主要用于图形处理。近期才公布面向AI 训练、AI推理、科学计算等应用领域的GPU产品研发成功。

如沐曦入局GPU市场较晚,像用于AI训练、推理的产品,以及用于图形渲染的产品都有规划,不过它是先推出了用于AI计算的GPU芯片,而用于图形渲染的产品预计要到2025年才发布。像瀚博半导体、摩尔线程等也是面向图形渲染和AI计算都有产品。

面对现在关注比较多的大模型的训练和推理,国产GPU企业也在积极跟进,如海光DCU就能够完整支持大模型训练,实现LLaMa、GPT、Bloom、ChatGLM、悟道、紫东太初等为代表的大模型的全面应用;瀚博基于新一代GPU芯片首发了LLM大模型AI加速卡VA1L,能支持ChatGPT、LLaMA、Stable Diffusion等主流AIGC网络模型。天数智芯、燧原科技等也都在支持大模型的应用上取得进展。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126702
  • 大模型
    +关注

    关注

    2

    文章

    1516

    浏览量

    1103
收藏 人收藏

    评论

    相关推荐

    模型时代,国产AI芯片最新进展!算力集群化是必然趋势

    、算力提供商也针对大模型展示了相应的方案。   大模型时代,国产AI 芯片进展如何?   在这次大会上,瀚博半导体、燧原科技、登临科技、天数智芯等纷纷展示了针对大
    的头像 发表于 07-11 09:05 1404次阅读
    大<b class='flag-5'>模型</b>时代,<b class='flag-5'>国产</b>AI芯片最新<b class='flag-5'>进展</b>!算力集群化是必然趋势

    模型时代,国产GPU面临哪些挑战

    国产GPU在不断成长的过程中也存在诸多挑战。   在大模型训练上存在差距   大语言模型是基于深度学习的技术。这些模型通过在海量文本数据上
    的头像 发表于 04-03 01:08 3091次阅读
    大<b class='flag-5'>模型</b>时代,<b class='flag-5'>国产</b><b class='flag-5'>GPU</b>面临哪些挑战

    国产GPU在AI大模型领域的应用案例一览

    不断推出新品,产品也逐渐在各个领域取得应用,而且在大模型的训练和推理方面,也有所建树。   国产GPU在大模型上的应用
    的头像 发表于 04-01 09:28 2429次阅读
    <b class='flag-5'>国产</b><b class='flag-5'>GPU</b>在AI大<b class='flag-5'>模型</b>领域的应用案例一览

    FPGA深度学习应用中或将取代GPU

    上涨,因为事实表明,它们的 GPU 训练和运行 深度学习模型 方面效果明显。实际上,英伟达也已经对自己的业务进行了转型,之前它是一家纯粹做 GPU
    发表于 03-21 15:19

    笙泉MCU在工控方面的应用

    笙泉MCU在工控方面的应用
    的头像 发表于 09-18 10:56 354次阅读
    笙泉MCU在工控<b class='flag-5'>方面的</b>应用

    pytorch模型转换需要注意的事项有哪些?

    和记录张量上的操作,不会记录任何控制流操作。 为什么不能是GPU模型? 答:BMNETP的编译过程不支持。 如何将GPU模型转成CPU
    发表于 09-18 08:05

    RFID手持机和普通手持机在技术和应用方面的区别

    大家知道手持机分为普通手持机和RFID手持机,他们在技术原理、应用场景、数据处理能力等方面都存在明显的差异,今天我们就来盘点一下普通手持机和RFID手持机在技术和应用方面的区别
    的头像 发表于 09-05 21:56 305次阅读

    盘点:AI大模型背后不同玩家的网络支撑

    高性能网络并非一蹴而就,其背后需要有从架构设计到芯片方案等诸多细节的配合。本文盘点了部分互联网厂商、设备厂商、芯片厂商以及运营商在AI大模型底层网络支撑方面所做的工作与进展
    的头像 发表于 09-05 16:56 1746次阅读
    <b class='flag-5'>盘点</b>:AI大<b class='flag-5'>模型</b>背后不同玩家的网络支撑

    沐曦基于曦云C500发布国产首台GPU千亿参数大模型训推一体机

    首台GPU千亿参数大模型训推一体机由数字宁夏倡议发起技术攻关,基于沐曦最新发布的曦云C500旗舰GPU芯片提供的算力支持、智谱华章的AI大模型
    的头像 发表于 08-21 14:41 2893次阅读

    GPU上OpenVINO基准测试的推断模型的默认参数与CPU上的参数不同是为什么?

    CPU 和 GPU 上推断出具有 OpenVINO™ 基准的相同模型: benchmark_app.exe -m model.xml -d CPU benchmark_app.exe -m
    发表于 08-15 06:43

    盘点:2023年支持国产仪器新政

    来源:仪器信息网 “十四五”开局以来,国产仪器利好政策频频发布。2023上半年,还有哪些支持国产仪器发展的新政策?仪器信息网汇总如下: 编辑:感知芯视界 “十四五”开局以来,国产仪器利
    的头像 发表于 08-14 13:04 620次阅读

    飞凌嵌入式国产平台大盘点之瑞芯微系列

    的RK3399处理器设计,具备2个ARM Cortex-A72内核,主频1.8GHz;4个ARM Cortex-A53内核,主频1.4GHz;GPU采用Mali-T864,支持OpenGL ES1.1
    发表于 08-05 11:12

    新型 GPU 云桌面的准确定义

    。在实践方面,重点介绍了新型 GPU 云桌面的技术架构与关键技术要点,并梳理了教育、泛行业办公等典型场景的应用案例,通过量化数据直观展现这项技术的优势。最后,针对 GPU 的发展作出总
    的头像 发表于 06-29 09:57 1767次阅读
    新型 <b class='flag-5'>GPU</b> 云桌<b class='flag-5'>面的</b>准确定义

    十大国产GPU产品及规格概述

    近年来,国产GPU 厂商在图形渲染 GPU 和高性能计算 GPGPU 领域上均推出了较为成熟的产品,在性能上不断追赶行业主流产品,在特定领域达到业界一流水平。生态方面
    的头像 发表于 06-25 16:38 2.7w次阅读
    十大<b class='flag-5'>国产</b><b class='flag-5'>GPU</b>产品及规格概述

    天数智芯通用GPU产品为大模型时代提供强大算力底座

    第七届集微半导体峰会于6月初在厦门成功举办,上海天数智芯半导体有限公司(以下简称“天数智芯”)产品线总裁邹翾受邀参加“集微通用芯片行业应用峰会”,发表了题为“国产GPU助力大模型的实践”的主题演讲
    的头像 发表于 06-08 22:55 1028次阅读
    天数智芯通用<b class='flag-5'>GPU</b>产品为大<b class='flag-5'>模型</b>时代提供强大算力底座