0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国产GPU在AI大模型领域的应用案例一览

Carol Li 来源:电子发烧友网原创 作者:李弯弯 2024-04-01 09:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)近一年多时间,随着大模型的发展,GPUAI领域的重要性再次凸显。虽然相比英伟达等国际大厂,国产GPU起步较晚、声势较小。不过近几年,国内不少GPU厂商成长非常快,并且不断推出新品,产品也逐渐在各个领域取得应用,而且在大模型的训练和推理方面,也有所建树。

国产GPU在大模型上的应用进展

电子发烧友此前就统计过目前国内主要的GPU厂商,也介绍了这些厂商主要的产品及产品发布、量产进展情况。可以看到,其实近几年已经有不少产品面世并应用。

如沐曦集成,其N系列用于AI推理的GPU芯片早已量产。去年9月,该公司宣布,其与眸瑞科技联合发布了首个AI模型“贴图超分”技术。该技术依托曦思N系列AI推理GPU首款产品曦思N100的强大算力,结合眸瑞科技丰富的算法库资源和先进的AI超分算法,首次将AI超分成功应用到了3D模型领域。

曦思N100是沐曦面向人工智能推理场景推出的高效能GPU产品,针对AI推理及AI应用场景中大量的视频图像处理任务,提供强大的AI算力和视频/图像编解码功能。据称,目前沐曦已联合合作伙伴打造了多种基于曦思N100 的解决方案,如高密度视频结构化分析解决方案、高并发智能转码解决方案、光电混合异构计算解决方案等,这些方案可广泛应用于城市安防、智慧交通、工业视觉、短视频、云计算和智算中心等多个领域。

再如天数智芯,其提供的算力集群具有支持百亿级参数大模型训练的能力。早前有消息,天数智芯与智源研究院、爱特云翔合作,开展基于自主通用GPU的大模型CodeGen(高效编码)项目,通过中文描述来生成可用的C、JavaPython代码以实现高效编码。

智源研究院负责算法设计、训练框架开发、大模型的训练与调优,天数智芯负责提供天垓100加速卡、构建算力集群及全程技术支持,爱特云翔负责提供算存网基础硬件及智能化运维服务。在天垓100加速卡的算力集群,基于智源研究院70亿参数的Aquila语言基础模型,使用代码数据进行继续训练,稳定运行19天,模型收敛效果符合预期。

近一年多来,随着大模型的发展,国产GPU公司都在朝着大模型领域布局。摩尔线程此前也透露,公司已经可以支持3亿参数量模型的训练,2022年底就提前布局了自然语言模型预训练,自研了MusaBert模型。

还有登临科技,该公司此前也表示,公司首款产品Goldwasser已规模化运用在多家行业知名企业的主营业务中,新一代Goldwasser产品针对基于Transformer的网络和生成式AI类大模型的应用在性能有大幅提升。

国产GPU应用于AI领域的多个方面

除了上述谈到应用案例,国产GPU在AI领域的应用案例还有很多,主要涉及到深度学习、自然语言处理以及计算机视觉等多个方面。

如,在计算机视觉领域,国产GPU被广泛应用于图像识别和目标检测等任务。例如,利用GPU加速的深度学习模型可以大幅提升算法的准确性和实时性,这在安防监控、自动驾驶等实际应用中具有重要的价值。

在自然语言处理方面,国产GPU也在发挥重要作用。通过GPU加速的循环神经网络、Transformer等模型,可以实现高效的机器翻译、文本生成等任务。这对于提升智能客服、智能写作等应用的性能具有关键作用。

国产GPU还在强化学习领域得到了应用。强化学习是AI领域的一个重要分支,其目标是通过与环境的交互来学习策略。GPU加速的价值网络、策略网络等模型可以应用于游戏AI、机器人控制等领域,从而提高智能体的学习效率和性能。

另外值得关注的还有,国产GPU在自动驾驶领域的应用也比较多。自动驾驶系统需要处理大量的传感器数据,包括来自摄像头、雷达、激光雷达等的信息。GPU通过其强大的并行计算能力和高效的内存管理,可以实时处理这些数据,并为自动驾驶系统提供准确的决策依据。

例如,一些国产汽车厂商已经开始在其自动驾驶系统中采用国产GPU。这些GPU不仅用于图像处理和计算机视觉任务,如目标检测、车道线识别等,还用于深度学习模型的推理和决策。通过GPU的加速,自动驾驶系统可以更快地识别交通信号、障碍物以及其他重要信息,从而提高行车安全性。

此外,国产GPU还在自动驾驶的地图构建和定位方面发挥了重要作用。通过利用GPU进行高效的地图数据处理和实时定位计算,自动驾驶系统可以更加准确地感知周围环境,并实现精确的导航和路径规划。

具体来说,百度Apollo、小马智行等自动驾驶技术公司,都在其自动驾驶解决方案中采用了国产GPU。这些解决方案不仅应用于乘用车,还扩展到商用车、物流车等多个领域。

写在最后

从目前的情况来看,国内外GPU厂商都在追逐大模型应用带来的机会。当前无论是大模型训练还是推理,英伟达GPU都占据了绝大部分市场。对于国产厂商来说,为了在大模型方面拥有更多自主权,仍然需要持续在大模型训练方面发力,同时相对大模型训练来说,大模型接下来大面积的部署,对于推理芯片的需要将会很大,这将是一个更容易把握的机会。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134463
  • AI
    AI
    +关注

    关注

    89

    文章

    38114

    浏览量

    296659
  • 大模型
    +关注

    关注

    2

    文章

    3442

    浏览量

    4967
  • AI大模型
    +关注

    关注

    0

    文章

    394

    浏览量

    942
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    搭建万卡GPU集群,小米AI模型即将全力启动

    董事长雷军该团队扮演重要的领导角色。   高性能计算是大模型发展的基础,而GPU在其中扮演重要作用。随着AI如今社会中发挥着越来越重要的
    的头像 发表于 12-29 00:02 3532次阅读
    搭建万卡<b class='flag-5'>GPU</b>集群,小米<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>即将全力启动

    成都汇阳投资关于国产开源模型持续突破,国产AI 竞争力增强

    国产 AI 产业正展现出从技术追赶到特定领域实现差异化领先的强劲趋势 。 当前的技术迭代的重点集中在编程和 Agent 能力等方面 ,同时 ,
    的头像 发表于 11-24 14:01 181次阅读

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    世界各国&地区常见电压/频率/插头/插座一览

    电子发烧友网站提供《世界各国&地区常见电压/频率/插头/插座一览表.pdf》资料免费下载
    发表于 05-30 16:27 7次下载

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    模型全链路分析功能,针对AI应用开发的三大痛点逐个击破。 当前AI应用开发者使用开发工具时会面临个很头疼的问题,种类多、功能不聚合、过
    发表于 04-13 19:52

    摩尔线程GPU成功适配Deepseek-V3-0324大模型

    架构和全功能GPU的强大技术实力,摩尔线程迅速响应并完成了对DeepSeek-V3的无缝升级,实现了零报错、零兼容性问题的光速部署,充分展现了摩尔线程AI模型领域的领先优势。
    的头像 发表于 03-31 11:34 1104次阅读
    摩尔线程<b class='flag-5'>GPU</b>成功适配Deepseek-V3-0324大<b class='flag-5'>模型</b>

    摩尔线程GPU原生FP8计算助力AI训练

    并行训练和推理,显著提升了训练效率与稳定性。摩尔线程是国内率先原生支持FP8计算精度的国产GPU企业,此次开源不仅为AI训练和推理提供了全新的国产化解决方案,更对推动
    的头像 发表于 03-17 17:05 1217次阅读
    摩尔线程<b class='flag-5'>GPU</b>原生FP8计算助力<b class='flag-5'>AI</b>训练

    国产AI芯片破局:国产TCB设备首次完成CoWoS封装工艺测试

    DeepSeek的突破性进展,让中国AI产业领域似乎迅速缩小了和美国的差距,然而整个国产模型的运行仍高度依赖英伟达的芯片支持。尽管
    的头像 发表于 03-14 11:09 1419次阅读
    <b class='flag-5'>国产</b><b class='flag-5'>AI</b>芯片破局:<b class='flag-5'>国产</b>TCB设备首次完成CoWoS封装工艺测试

    无法GPU上运行ONNX模型的Benchmark_app怎么解决?

    CPU 和 GPU 上运行OpenVINO™ 2023.0 Benchmark_app推断的 ONNX 模型 CPU 上推理成功,但在
    发表于 03-06 08:02

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    近期,DeepSeek这个名字AI圈彻底炸开了锅并且关于DeepSeek的消息网络铺天盖地,短视频,朋友圈随处可见不少网友留言称其是“来自东方的神秘力量”又次震撼海外人士心脏“这太疯狂了
    发表于 03-03 11:21

    模型领域常用名词解释(近100个)

    本文总结了大模型领域常用的近100个名词解释,并按照模型架构与基础概念,训练方法与技术,模型优化与压缩,推理与应用,计算与性能优化,数据与标签,模型评估与调试,特征与数据处理,伦理与公
    的头像 发表于 02-19 11:49 1284次阅读
    大<b class='flag-5'>模型领域</b>常用名词解释(近100个)

    K1 AI CPU基于llama.cpp与Ollama的大模型部署实践

    为了应对大模型(LLM)、AIGC等智能化浪潮的挑战,进迭时空通过AI指令扩展,RISC-VCPU中注入了原生AI算力。这种具有原生AI
    的头像 发表于 02-18 14:23 1554次阅读
    K1 <b class='flag-5'>AI</b> CPU基于llama.cpp与Ollama的大<b class='flag-5'>模型</b>部署实践

    小米加速布局AI模型,搭建GPU万卡集群

    近日,有消息称小米正在紧锣密鼓地搭建自己的GPU万卡集群,旨在加大对AI模型的投入力度。据悉,小米的大模型团队成立之初就已经拥有了650
    的头像 发表于 12-28 14:25 791次阅读

    GPU是如何训练AI模型

    AI模型的训练过程中,大量的计算工作集中矩阵乘法、向量加法和激活函数等运算上。这些运算正是GPU所擅长的。接下来,
    的头像 发表于 12-19 17:54 1325次阅读

    云知声荣登甲子光年“2024中国AI模型领域最具商业潜力榜”

    科技产业投资榜】三大行业榜单。云知声凭借卓越的技术实力、创新的场景应用以及广阔的市场前景,荣登“2024中国AI模型领域最具商业潜力榜”。
    的头像 发表于 12-13 14:30 878次阅读